导 师: 刘文印; 谭清华
授予学位: 硕士
作 者: ();
机构地区: 广东工业大学
摘 要: 当今世界每时每刻都有许多真实事件在发生,如公共安全事件(游行示威、火灾车祸等)、体育娱乐事件(体育比赛、演出表演等)等等。其中,网上新闻媒体和社交媒体等互联网数据平台是人们得知现实世界事件发生的主要途径。通过互联网数据进行事件检测具有十分重要的意义。本文主要针对两种常见场景的事件检测问题进行研究,即单数据源下的多模态事件检测与基于迁移学习的不同数据源的同构事件检测。对于单数据源下的多模态事件检测,其主要存在着标签样本少的问题,本文提出一个深度逐层堆叠模型,通过充分利用多模态特征来对解决现实场景中标定样本稀少的问题。该模型由Dropout模块、Block模块和Detector模块组成,其中,Dropout模块避免了模型的过拟合、Block模块利用多个分类器对多模态数据进行融合、Detector模块决定模型的深度。对于基于迁移学习的不同数据源的同构事件检测,本文提出基于联合分布适配的最大化分类器差异模型的迁移学习方法来解决异源数据之间的迁移问题。其一方面通过最小化最大均值差异距离以减少不同源数据之间的联合分布差异,另一方面利用两个分类器之间的差异进行对抗学习使生成器生成上生成的不同源数据之间的特征尽可能接近。为了验证本文提出的两个模型的有效性,我们收集了两个用于不同事件检测任务的数据集,即一个包含412个事件的单源多模态事件检测数据集和一个包含3个数据源共68个事件的多源事件检测数据集,并在这两个数据集对所提出的方法进行验证。实验表明,本文提出的两个模型与其它算法比有更高的表现性能。另外,通过一些特征分析、可视化等实验也能看出模型的优越性。所以,本文提出的模型均可以处理好对应的事件检测任务。更多还原
关 键 词: 事件检测 深度学习 [518602]多模态 迁移学习
分 类 号: [TP181;TP311.13]