导 师: 蔡浩
授予学位: 硕士
作 者: ();
机构地区: 汕头大学
摘 要: 随着智慧医疗的不断发展深入,人工智能和深度学习技术在医疗领域的应用越来越广泛。如何高效准确的检测识别出药品盒图像中的文本对于构建一套智能高效的智慧医疗系统具有重要的研究价值。在药品盒图像文本检测中,研究学者们提出了各种优秀的文本检测算法。其中,基于深度学习的TextBoxes算法能直接通过单个神经网络来预测文本的位置,受到广泛的关注。然而,TextBoxes网络的特征层表达能力较弱并且对小尺度文本检测不够鲁棒。 针对这些问题,本文提出了一种改进的TextBoxes网络,通过对原始网络内部加入反卷积层和Eltwise层,将网络中的不同特征层相融合,并构建了三种特征层融合的网络结构,分别为相邻两层融合、相邻三层融合、以及最高层与其他层融合的网络结构。文本在MEDIBOX数据集上测试改进的TextBoxes算法性能,实验结果表明,改进的TextBoxes网络能更有效的检测出药品盒图像中的小尺度文本,并且在文本检测中具有更高的准确性和鲁棒性,与原始TextBoxes算法相比,在该数据集上F值提升了3%。