文献详情 - Gdtheory理论粤军网|广东智库信息化平台

文献详细_{Journal detailed}

基于Web文本挖掘的命名实体关系抽取研究

收藏

导　　师： 陈建国

授予学位： 硕士

作　　者： (）;

摘　　要： 命名实体关系抽取是信息抽取领域的重要研究课题，从应用角度而言，它属于智慧搜索、自动问答、知识图谱等系统的关键技术之一;从基础理论研究而言，它对于机器翻译、文本分类、自动摘要、新词发现等自然语言处理技术有重要研究意义。　　当前国内外对于命名实体关系抽取的研究，大部分集中在ACE（Automatic Content Extraction）定义的七种主要关系类型的研究，而对于诸如农业信息领域的命名实体的研究则比较少见。此外，大部分研究方法集中在知识工程方法或机器学习方法，而其中的机器学习方法大多数使用单纯的有监督或无监督训练方法，而对于结合人工与机器学习的方法研究较为少见。　　基于命名实体关系抽取的国内外研究现状，本文对香蕉命名实体关系抽取进行了较为深入的讨论，综合应用到了人工和机器学习的方法，具体而言，本文研究工作包括以下几个方面：　　（1）构建面向香蕉的命名实体语料库。在分析了农业信息的特点的基础上，设计了定向爬虫，并采集了香蕉网页文档。然后设计了基于网页特征的Web信息抽取模型，并完成了对Web网页信息的抽取，接着进行文本清洗、实体识别，最终抽取出命名实体对。　　（2）面向香蕉的命名实体关系抽取研究。根据已构建的命名实体语料库，定义了本文所要研究和抽取的命名实体关系类型，提出了一种基于Word2Vec和种子自扩展的命名实体关系抽取模型，该模型的核心在于将命名实体对转化为数值向量，并通过计算向量之间的相似度来表征命名实体对之间的相似度，采用此模型对本文构建好的香蕉命名实体语料库进行命名实体关系抽取，设计并分析实验结果，讨论了模型效果。　　（3）命名实体关系抽取系统设计与实现。针对系统的功能目标，首先设计了系统�

关键词： 命名实体关系抽取网络文本挖掘实体语料库智慧搜索

领　　域： []

相关机构对象

机构广东外语外贸大学: 作者数：8857; 发文主题：创业研究,法治,语言学,战略性技术,系统功能语法,行政体制改革,语言维度,词汇语法,部门行政职权,主语,语法,双语词典,私有财产权,行政行为,创业决策,企业动态能力,语态,下行,级差,网络营销,语言模式,企业,可持续发展,具体行政行为,公法保护,法律规制,创业者,绿色营销,行政权,文体学,电子商务,人际,行政诉讼,服务型政府,实证研究,行政法治,汉语,营销研究,行政法,司法审查,系统功能语言学,组织知识,行政主体,企业家决策,动态能力,文化,企业绩效,语篇,法治视野,语义,韩礼德,英汉大词典,绿色消费,风险感知,商务背景,廊桥遗梦,持续竞争优势,公共行政,行政相对人,

机构华南师范大学: 作者数：20338; 发文主题：教师成长,宏观经济,社会主义实践,中国梦,二重性质,马克思主义经济学,人生哲学,有效教学,中国货币政策,教育科研,克鲁格曼,教育叙事研究,教育研究,政治经济学,人民内部矛盾,新自由主义,校本教研,人性,哲学发展,课程改革,老师,教育行动研究,卢卡奇,学校教育,动物精神,马克思哲学,凯恩斯主义,人类社会发展规律,西方经济学,因果,教学研究,社会主义市场经济,中国共产党,教师,实证研究,诺贝尔经济学奖,教育现象学,英美文学,埃尔斯特,实证检验,校本教学研究,中国化马克思主义,社会主义建设规律,唯物史观,经济政策,社会存在本体论,异化,日常教学,社会主义发展道路,叙事研究,早期西方马克思主义,教学理念,马克思主义,人民币国际化,历史唯物主义,萨金特,教育叙事,世界货币,本体论,

机构华南理工大学: 作者数：19075; 发文主题：模型,甲烷,订单农业,协商模型,零售商,供应链管理,绩效关系,供应链协调,制造商,催化剂,知识创新,关系承诺,利益分配,变质性物品,企业,技术创新,虚拟企业,知识分享,供应链协调模型,订货量,石墨烯,研究生教育,可控提前期,时变需求,实证研究,价格折扣,管理创新,信息共享,运营绩效,战略管理,货栈,协整关系研究,滞后支付,创新绩效,库存路径问题,订购,报童模型,信息不对称,创新型企业,销售商,内向型,博弈,甲醇电氧化,创新管理,直接甲醇燃料电池,外向型,智慧城市,风险规避,生命周期,车辆路径问题,供应链协作,供应链,员工创新行为,协整检验,动态面板,共性技术,德行领导,

机构中山大学: 作者数：27151; 发文主题：电视节目,用户,实证研究,家居,硬件,视域,异构,权利,分布式存储,蓝牙,启迪,从严治党,音乐门铃,领导干部,加密方法,中间件,党内权力,数字电视,权力监督,制度反腐,实体化,数字家庭,民主监督,社会主义国家执政党,马克思主义,监控系统,视频图像,中间件系统,数据传输方法,毛泽东,中国特色社会主义,风险评估,中国共产党,邓小平,素质教育,青年农民工,嵌入式,

机构华南师范大学外国语言文化学院: 作者数：403; 发文主题：英语语法,国大党,非暴力,政治现代化,语音水平,语料库研究,圣经,词汇,英语,隐喻研究,语言教学,中国抗战,阅读教学,政治秩序,英语口语,外语教学,高中英语教材,英文,理据,英语教材,短语,音段,神学思想,宗教思想,语料库语言学,隐喻,语料库辅助,圣雄甘地,殖民统治,神学家,英汉双语,实证研究,素食主义,中印关系,隐喻理解,情感态度,渊源,印度政治,课程标准,英语教学,神灵,尼赫鲁,神学体系,语料库,日常教学,隐喻性,英汉,隐喻能力,中学英语教材,研究方法,表象表征,时间隐喻,政党,基于语料库,素质教育,

基于Web文本挖掘的命名实体关系抽取研究

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+

相关作者

相关机构对象

相关领域作者

基于Web文本挖掘的命名实体关系抽取研究

参考文献 更多+

二级参考文献 更多+

引证文献 更多+

二级引证文献 更多+

同被引文献 更多+

耦合作品文献 更多+

相关文献 更多+

相关作者

相关机构对象

相关领域作者

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+