文献详情 - Gdtheory理论粤军网|广东智库信息化平台

文献详细_{Journal detailed}

一种基于深度学习与Labeled-LDA的文本分类方法

收藏

导　　师： 任江涛

授予学位： 硕士

作　　者： (）;

机构地区： 中山大学

摘　　要： 文本分类一直是自然语言处理中的基础、热点和难点。主题模型LDA作为无监督的概率统计模型在文本语义挖掘上取得良好的效果,而它的拓展标签主题模型Labeled-LDA基于标签这个强而有力的监督信息,使得词的主题分布更加准确可控。深度学习在近几年得到前所未有的发展,神经网络在各个领域大展身手。图像的像素矩阵形式以及自身固有的空间结构特点,与卷积神经网络完美结合,在人脸识别等图像领域取得比人类识别还要好的效果,而随着word2vec在自然语言处理的大热,文本固有的序列特点与递归神经网络完美结合,在文本分类、智能对话、机器翻译等领域取得长足的进步。相同情况下,在短文本分类上递归神经网络要比卷积神经网络的分类效果更好,原因之一递归神经网络基于序列建模,更吻合文本自身固有的序列特点。然而在长文本分类上,递归神经网络由于梯度弥散而造成无法收敛,存在记忆长度不够的缺陷,即使LSTM对长文本分类问题也是力不从心。文本既有空间结构特点,相近的文本主题相似,又有序列结构特点。为了使递归神经网络序列建模的优势在文本分类问题上得以保持,以及结合卷积神经网络对于空间结构建模的优势,本文应用的是卷积递归神经网络CNNNN。对于超长文本,本文应用的是多卷积层递归神经网络MCNNNN。实验结果表明,Labeled-LDA具有很好的文本聚类功能,能做特征选择,能很好地学出词的类别分布,本文引入词的类别分布信息,提出一种卷积递归神经网络CNNNNLDA,对于超长文本,本文提出一种卷积递归神经网络MCNNNNLDA。在具有丰富样本的数据集上,前人应用非常深层的卷积网络取得很好的效果,近两年大热的注意力模型在自然语言处理上也硕果颇丰,鉴于此,本文提出了深度残差双向注意力网络RESATTLDA。实验结果表明引入词的类别分布信

关键词： 文本分类深度残差网络注意力模型

领　　域： []

相关机构对象

机构暨南大学: 作者数：20971; 发文主题：行政手段,比较文学,法人资格,东亚货币合作,世界华文文学,三民主义,追寻,国际移民,双方当事人,文艺理论,法律地位,多角化经营战略,区域经济合作,经济法学,孙中山,国家所有权,母语教育,章程,网络,海外华文教育,横向经济联合,产权关系,专利法,文学传统,华裔美国文学,致辞,马来西亚华文教育,整体观,监事会,国有资产所有权,华族,全过程,汉语文学,冷战后,法律调整,全球语境,统战工作,海外华文文学研究,华文教育,辛亥革命时期,结构性权力,华人社会,海外华文文学,他者,文本阅读,涉外经济法规,粤港澳,经济法制,东南亚华人,新移民文学,人口比例,经济联合体,中国文学,企业集团,跨文化,社会参与,法制管理,文学概论,全球化语境,文艺学研究,

机构中山大学: 作者数：27151; 发文主题：电视节目,用户,实证研究,家居,硬件,视域,异构,权利,分布式存储,蓝牙,启迪,从严治党,音乐门铃,领导干部,加密方法,中间件,党内权力,数字电视,权力监督,制度反腐,实体化,数字家庭,民主监督,社会主义国家执政党,马克思主义,监控系统,视频图像,中间件系统,数据传输方法,毛泽东,中国特色社会主义,风险评估,中国共产党,邓小平,素质教育,青年农民工,嵌入式,

机构华南师范大学: 作者数：20338; 发文主题：教师成长,宏观经济,社会主义实践,中国梦,二重性质,马克思主义经济学,人生哲学,有效教学,中国货币政策,教育科研,克鲁格曼,教育叙事研究,教育研究,政治经济学,人民内部矛盾,新自由主义,校本教研,人性,哲学发展,课程改革,老师,教育行动研究,卢卡奇,学校教育,动物精神,马克思哲学,凯恩斯主义,人类社会发展规律,西方经济学,因果,教学研究,社会主义市场经济,中国共产党,教师,实证研究,诺贝尔经济学奖,教育现象学,英美文学,埃尔斯特,实证检验,校本教学研究,中国化马克思主义,社会主义建设规律,唯物史观,经济政策,社会存在本体论,异化,日常教学,社会主义发展道路,叙事研究,早期西方马克思主义,教学理念,马克思主义,人民币国际化,历史唯物主义,萨金特,教育叙事,世界货币,本体论,

机构华南理工大学: 作者数：19075; 发文主题：模型,甲烷,订单农业,协商模型,零售商,供应链管理,绩效关系,供应链协调,制造商,催化剂,知识创新,关系承诺,利益分配,变质性物品,企业,技术创新,虚拟企业,知识分享,供应链协调模型,订货量,石墨烯,研究生教育,可控提前期,时变需求,实证研究,价格折扣,管理创新,信息共享,运营绩效,战略管理,货栈,协整关系研究,滞后支付,创新绩效,库存路径问题,订购,报童模型,信息不对称,创新型企业,销售商,内向型,博弈,甲醇电氧化,创新管理,直接甲醇燃料电池,外向型,智慧城市,风险规避,生命周期,车辆路径问题,供应链协作,供应链,员工创新行为,协整检验,动态面板,共性技术,德行领导,

机构暨南大学新闻与传播学院: 作者数：1241; 发文主题：民国,中国丛报,广播人,粤港,广播,民国时期,新闻事业,新闻学研究,节目形态,邵飘萍,视频,新闻记者,新闻报道,广播新闻,中国广播,广播频率,宗教,中国新闻史,受众,中国之声,网络评论,新闻工作者,媒介融合,网络广播,办报理念,互联网,媒体融合,中国共产党,地铁隧道,新闻业,地市报,记者,广播节目,中国新闻奖,新媒体时代,广播发展,南方都市报,中国新闻界,地市党报,传统广播,联播,中央电台,人民日报,上海世博会,地铁车站,中国新闻,新闻立台,企业营销,地铁报,新闻界,自律,广播媒体,国际新闻,中国人,视频新闻,他律,新闻教育,广播媒介,两会报道,

一种基于深度学习与Labeled-LDA的文本分类方法

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+

相关作者

相关机构对象

相关领域作者

一种基于深度学习与Labeled-LDA的文本分类方法

参考文献 更多+

二级参考文献 更多+

引证文献 更多+

二级引证文献 更多+

同被引文献 更多+

耦合作品文献 更多+

相关文献 更多+

相关作者

相关机构对象

相关领域作者

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+