文献详情 - Gdtheory理论粤军网|广东智库信息化平台

文献详细_{Journal detailed}

随机森林算法对文本情感分析的应用与R软件实现

收藏

中文会议： 2017年中国卫生统计学学术年会论文集

会议日期： 2017-08-22

会议地点： 中国湖北武汉

主办单位： 中国卫生信息学会卫生统计学教育专业委员会;中国卫生信息学会统计理论与方法专业委员会;中华预防医学会生物统计分会;国际生物统计学会中国分会

出版日期： 2017-08-31

作　　者： (）;

机构地区： 中山大学公共卫生学院医学统计与流行病学系

出　　处： 《2017年中国卫生统计学学术年会》

摘　　要： 目的文本数据与日俱增。本文旨在阐述如何通过随机森林算法和R软件实现文本情感分析,为学者提供方法学参考。方法人工标注1200例文本情感类别,然后用'RWordseg'包对文本进行中文分词,用词频-逆向文件频率量化特征词权重。用卡方法进行特征词选择。按照不同参数组合,用'randonForest'包对数据进行建模,并用准确率、查准率、查全率和F1得分来评估模型性能,用统计量FF比较模型优劣。结果 1149条文本纳入分析,正向、负向和中立情感各占34.3%、31.3%和34.4%。共构建18个模型,其中模型16最优。特征选择后的模型2的运行时间（5秒）远少于模型5（535秒）。最优模型有190个特征词,mtry=13,ntree=2500,准确率0.60,95%置信区间（0.53,0.68）。中立情感的查全率相对较高（0.79）,正向情感的查准率相对较高（0.66）。影响准确率的主要原因有样本量大小、特征词选择、算法选择和参数调整。R软件能实现情感分析。

领　　域： []

相关机构对象

机构华南理工大学: 作者数：19075; 发文主题：模型,甲烷,订单农业,协商模型,零售商,供应链管理,绩效关系,供应链协调,制造商,催化剂,知识创新,关系承诺,利益分配,变质性物品,企业,技术创新,虚拟企业,知识分享,供应链协调模型,订货量,石墨烯,研究生教育,可控提前期,时变需求,实证研究,价格折扣,管理创新,信息共享,运营绩效,战略管理,货栈,协整关系研究,滞后支付,创新绩效,库存路径问题,订购,报童模型,信息不对称,创新型企业,销售商,内向型,博弈,甲醇电氧化,创新管理,直接甲醇燃料电池,外向型,智慧城市,风险规避,生命周期,车辆路径问题,供应链协作,供应链,员工创新行为,协整检验,动态面板,共性技术,德行领导,

机构暨南大学: 作者数：20971; 发文主题：行政手段,比较文学,法人资格,东亚货币合作,世界华文文学,三民主义,追寻,国际移民,双方当事人,文艺理论,法律地位,多角化经营战略,区域经济合作,经济法学,孙中山,国家所有权,母语教育,章程,网络,海外华文教育,横向经济联合,产权关系,专利法,文学传统,华裔美国文学,致辞,马来西亚华文教育,整体观,监事会,国有资产所有权,华族,全过程,汉语文学,冷战后,法律调整,全球语境,统战工作,海外华文文学研究,华文教育,辛亥革命时期,结构性权力,华人社会,海外华文文学,他者,文本阅读,涉外经济法规,粤港澳,经济法制,东南亚华人,新移民文学,人口比例,经济联合体,中国文学,企业集团,跨文化,社会参与,法制管理,文学概论,全球化语境,文艺学研究,

机构暨南大学管理学院企业管理系: 作者数：203; 发文主题：政企不分,中间商,员工忠诚度,道德风险,进化,人力资源管理部门,基金资助,产权制度改革,企业竞争力,内部人控制,治理措施,学术历程,融资能力,企业家才能,员工离职率,人力资源体系,邓小平文选,知识经济时代,股,独立董事报酬,人力资源管理,人事管理,职业经理人,企业,市场经济体制,胜任力,现代企业制度,产权主体,温州民间借贷,人力资源,深市,独立董事,建立现代企业制度,福利性,高校治理,实证研究,致富,非国有,价格改革,竞争型,人际关系管理,中国高校,兼职,薪酬制度,动态能力,管理学,计划合同,激励机制,现代人力资源管理,经济学家,人力资源规划,薪酬结构,企业间,国有企业,企业文化,民营企业,公司治理,转轨过程,公司经营绩效,

机构佛山科学技术学院体育学院: 作者数：56; 发文主题：体育教学改革,实践教学模式改革,职业生涯规划,优秀体育教师,体育文化,实践教学模式,社会,健身产业,影响因素,政府购买,引文分析,足球,社会体育指导员,足球运动,健身房,社区武术,审度,农民工,中国式,体育教师,体育活动,中国足球运动,体育,胰岛素,高校体育,人力资源,中国足球,赛事品牌,群众体育,映照,体育产业竞争力,实证分析,应用型人才,珠江三角洲,社会体育专业,体育教育专业,篮球,东南沿海,参与度,岭南文化,体育经济,社会融合,实践教学研究,新生代农民工,运动员体能,赛龙舟,全民健身,运动免疫,体育参与,地方院校,大学生自主创业,城市,运动员年龄,身体锻炼,

机构广州民航职业技术学院: 作者数：717; 发文主题：意识形态,就业指导,双师型,知识人,玛丽,浅层,心理健康教育,雪莱,高职校企合作,创业教育,高职毕业生,女性,生态自我,德育社会化,欲望,人民群众,高职院校,大学新生,生态学,哲学思想,阿伦特,人类中心主义,田园,权力,隐喻,沉思,实训基地,哲学思考,高职教育,德育环境,哲学,父权,德育工作,视域,高职院校德育,生态,德育体系,生态伦理,政治自由,文化主体,电影,生态学视野,思想政治理论,父权社会,道德,女性叙述,生态整体主义,思想政治教育,文化建设,唯物史观,德育模式,弗兰肯斯坦,实践观,德育教育,早期西方马克思主义,专业英语,马克思主义,人性假设,就业工作,就业形势,

随机森林算法对文本情感分析的应用与R软件实现

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+

相关作者

相关机构对象

相关领域作者

随机森林算法对文本情感分析的应用与R软件实现

参考文献 更多+

二级参考文献 更多+

引证文献 更多+

二级引证文献 更多+

同被引文献 更多+

耦合作品文献 更多+

相关文献 更多+

相关作者

相关机构对象

相关领域作者

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+