文献详情 - Gdtheory理论粤军网|广东智库信息化平台

全部文献媒体文章报刊论文会议论文学位论文出版专著研究报告课题成果特色专题

高级检索

您现在所在的位置：网站首页 > 知识中心 > 文献详情

文献详细_{Journal detailed}

基于聚簇隐马尔可夫模型的文本信息抽取
Text Information Extraction Based on Clustering Hidden Markov Model

下载全文在线阅读

收藏

作　　者： ; ; ; ;

机构地区： 湖南大学信息科学与工程学院软件学院

出　　处： 《系统仿真学报》 2007年第21期4926-4931,共6页

摘　　要： 应用隐马尔可夫模型是文本信息抽取的一种重要方法。对于网上不同来源的文本,由于其格式很不相同,进行混合训练,一般难以得到较优化的模型。将聚簇应用到文本信息抽取中,首先通过一种改进的k-平均方法对训练文本的Markov链模型进行聚簇,然后训练各簇的隐马尔可夫模型,提出了一种基于聚簇隐马尔可夫模型的文本信息抽取算法(C-HMM)。对700篇网上不同来源的文本进行信息抽取仿真实验,结果表明,新的算法能有效地提高抽取性能。 Using Hidden Markov model is an important approach for text information extraction, The form is dissimilar for texts which are from different resource of network. The optimal model is commonly difficult to obtain by hybrid training texts Clustering was applied to text information extraction. Clustering was given to Markov Chains of training texts through an improved approach of K-mean, and Hidden Markov model was trained out through every cluster. An algorithm of text information extraction based on clustering hidden Markov model （C-HMM） was proposed, A simulation experiment of information extraction was tried on 700 texts from different resource of network. Results show that the performance of extraction can be improved effectively by using the new algorithm.

关键词： 聚簇马尔可夫链隐马尔可夫模型信息抽取

领　　域： [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者侯雅文: 作品数：4被引量：5; 供职机构：暨南大学; 发文主题：隐马尔可夫模型;预警监控;自主创新能力;六西格玛管理;金融市场;控制图;汇率市场;股票价格指数;过程控制;过程能力指数;算法

作者魏栋: 作品数：1被引量：0; 供职机构：华南理工大学; 发文主题：隐马尔可夫模型;语音识别;实验语音学;数理语言学

作者刘志明: 作品数：24被引量：221; 供职机构：华南农业大学; 发文主题：非营利组织;突发事件;实证分析;说服;隐马尔可夫模型;实证研究;突发事件新闻报道;电子书包;问责;教育信息化;捐赠收入;家长;教师;信息安全;高校信息;高校管理;安全管理;新闻

作者詹佳佳: 作品数：6被引量：18; 供职机构：中山大学; 发文主题：国外图书馆学;博士论文;博士学位论文;词聚类;情报领域;情报学;文摘;竞争情报;信息可视化;信息抽取;信息抽取系统;演进分析;博硕士论文;词频分析

作者黄讴: 作品数：1被引量：0; 供职机构：中山大学; 发文主题：正则表达式;网页净化;信息抽取;分词技术;垂直搜索引擎

相关机构对象

机构中山大学: 作者数：27151; 发文主题：电视节目,用户,实证研究,家居,硬件,视域,异构,权利,分布式存储,蓝牙,启迪,从严治党,音乐门铃,领导干部,加密方法,中间件,党内权力,数字电视,权力监督,制度反腐,实体化,数字家庭,民主监督,社会主义国家执政党,马克思主义,监控系统,视频图像,中间件系统,数据传输方法,毛泽东,中国特色社会主义,风险评估,中国共产党,邓小平,素质教育,青年农民工,嵌入式,

机构华南理工大学工商管理学院: 作者数：3266; 发文主题：统计量,随机前沿模型,农村劳动力迁移,随机前沿分析,管理层激励,实证研究,公司绩效,经济增长,抑价,产权性质,知识溢出效应,企业业绩,融资约束,实证分析,融资困境,商业银行,模拟,企业税负,知识外溢,中小企业,增长极,上市公司,融资决策,空间计量模型,并购绩效,企业研发投入,有效性,外商直接投资,成本控制,收敛,投资者法律保护,股权性质,农村劳动力,方法,企业,技术创新,认股权证,国有企业,技术并购,资本结构,股权激励,面板数据,政府干预,指标体系,公司治理,并购,

机构华南理工大学: 作者数：19075; 发文主题：模型,甲烷,订单农业,协商模型,零售商,供应链管理,绩效关系,供应链协调,制造商,催化剂,知识创新,关系承诺,利益分配,变质性物品,企业,技术创新,虚拟企业,知识分享,供应链协调模型,订货量,石墨烯,研究生教育,可控提前期,时变需求,实证研究,价格折扣,管理创新,信息共享,运营绩效,战略管理,货栈,协整关系研究,滞后支付,创新绩效,库存路径问题,订购,报童模型,信息不对称,创新型企业,销售商,内向型,博弈,甲醇电氧化,创新管理,直接甲醇燃料电池,外向型,智慧城市,风险规避,生命周期,车辆路径问题,供应链协作,供应链,员工创新行为,协整检验,动态面板,共性技术,德行领导,

机构中山大学资讯管理学院: 作者数：446; 发文主题：残障人士,信息系统管理,英国议会,档案公共服务,档案开放利用,图书馆学,图书馆,公民权利,灾难,公共,图书馆史,声明,档案公布,档案法规,档案服务工作,档案利用,硕士教育,灾区重建,中国图书馆史,导航,档案鉴定,数字化档案信息,社会角色,知识产权,档案学专业,档案学教育,英文文献,再设计,国际图联,档案利用权,考释,程序规制,资产性,石刻拓片,用户服务,档案开放,图书馆协会,档案,档案利用服务,公民隐私权保护,知识自由政策,权利行使,访谈录,知识自由,档案学,书目控制,知识管理,奖项,专业硕士,释文,现行文件服务,图书馆权利,真人,学术论文,图书馆集成系统,

机构华南农业大学: 作者数：4429; 发文主题：交易成本,农地制度变迁,政治学,权力观,农地改革,经济增长,价值性,政府公信力,股权融资,村镇银行,影响因素,道德生态,资本配置效率,文化演进,上市公司,佃农理论,政德建设,行政伦理,力作,融资偏好悖论,道德使命,资本结构,权力,经济解释,首次加息,新农村建设,社会道德,权力合法性,理论范式,权力腐败,研究范式,中国房地产业,融资行为,化解策略,体验式教学,秩序,经济转轨,经济绩效,实证分析,劳动契约,道德,资本结构优化,利率市场化,金融支持,产权管制,租金耗散,高校思想政治理论课,探视,权力伦理,股权分置,农村金融风险,交易费用,青年,市场化,强制性制度变迁,制度转轨,银行发展,范式,制度绩效,农村金融,

相关领域作者

作者李文姬: 作品数：3被引量：0; 供职机构：广州市社会科学院; 发文主题：云计算;中国社科院;中科院;社会信息服务;数据库;数字图书馆;网络;信息服务;信息资源

作者邵慧君: 作品数：9被引量：21; 供职机构：文学院; 发文主题：粤方言;粤语;综论;语音比较;语音数据库;语音特点;战国时期;第一人称代词;送气;同源;代词系统;清分;厦门话;小称;海话;儿尾;方言词汇;白话;变调;变音

作者杜松华: 作品数：2被引量：0; 供职机构：广东工业大学; 发文主题：社交媒体;农业现代化;企业;电子商务;可持续发展;共生共赢

作者周国林: 作品数：22被引量：54; 供职机构：广东金融学院; 发文主题：产业共性技术;上市公司;实证研究;组织承诺;董事会;动漫产业集群;产业集群;影响因素;语言学习;证券市场;证券市场风险;人力资源发展战略;社会主义新农村;生态系统;生态学思考;实证分析;市场壁垒;企业形象设计;区域经济合作;区域经济均衡

作者邢弘昊: 作品数：8被引量：0; 供职机构：广东省社会科学院; 发文主题：营销管理创新;在线广告;支付功能;视觉中心;数据库技术;通信设施;亲情服务;主流媒体;自我革新;最大多数人;网络媒体发展;网民规模;媒介竞争;媒体;民族性特征;目标受众;精神文化产品;新媒体;活跃度;技术门槛

联系方式

电话：020-38800179

邮箱：gdtheory@126.com

地址：广州市天河区天河北路618号广东社会科学中心

邮编：510635

友情链接

扫一扫手机浏览

广东省社会科学院·广东省哲学社会科学数据库·广东智库版权所有 Copyright©2012 gdtheory.cn All Rights Reserved.

违法和不良信息举报中心举报邮箱：jubao@cqvip.com 粤ICP备10080020号-3