帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于内容分析的中文BBS话题检测系统的设计与实现
DESIGN AND IMPLEMENTATION OF CHINESE BBS TOPIC DETECTION SYSTEM BASED ON CONTENT ANALYSIS

作  者: ; ;

机构地区: 深圳职业技术学院电子与信息工程学院

出  处: 《计算机应用与软件》 2011年第6期242-246,共5页

摘  要: 通过对BBS话题模型、话题相似度、话题检测评价标准以及话题趋势的分析和研究,提出了基于内容分析的中文BBS话题检测算法:通过爬虫获取BBS信息;采用基于URL和Xpath的网页模板处理BBS信息;应用ICTLAS实现BBS信息的分词;采用Carrot2对BBS话题进行聚类,基于功率谱的热点话题分析以及基于时间序列的话题预测。最后,通过采用J2EE开发包及Eclipse集成开发环境,结合Hibernate、GWT等技术实现了中文BBS话题检测系统,并在多个BBS论坛上进行了测试,取得了良好的效果。 Through analyzing and studying BBS topic model,topic similarity,topic assessment standard and topic development trend,the paper puts forward a content analysis based Chinese BBS topic detection algorithm,including obtaining BBS information by web crawlers,processing BBS information with URL and Xpath based webpage templates,realizing BBS information participles by ICTLAS,clustering BBS topics by Carrot2,analyzing hot topics based on the power spectrum and predicting topics based on time sequences.Finally a Chinese BBS topic detection system is realized by applying J2EE SDK and Eclipse IDE as well as combining such technologies as Hibernate and GWT etc.A number of tests have been performed on multiple BBS;all have achieved fine results.

关 键 词: 话题检测 网络爬虫 话题聚类 热点分析

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 李芮
作者 高乔子
作者 梁小丽
作者 易淑琼
作者 雷丹

相关机构对象

机构 广东外语外贸大学
机构 华南师范大学
机构 暨南大学
机构 华南师范大学教育科学学院心理学系
机构 中山大学

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊