帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于访问内容类型统计的Web Robot检测算法
A Web Robot Detection Method Based on Content Classification and Statistics

作  者: ; ;

机构地区: 江苏大学

出  处: 《计算机科学》 2005年第8期179-181,共3页

摘  要: 随着搜索引擎的广泛使用,由此而引起的网络机器人(Web Robot)对于Web站点的访问所产生的影响必须引起重视。该文分析了网络机器人的访问行为特点,提出了一个基于访问内容类型统计的检测算法。经实验验证,该算法可以有效地检测未知的和不遵守网络机器人排斥标准的Robot。 With the widely use of search engines, the impact Web robots have on the Web sites should not be ignored. After analyzing the navigational patterns of Web robots, a new algorithm based on content classification and statistics is proposed. The experiment shows that the new algorithm can detect the unknown robots and unfriendly robots who do not obey the Standard for Robot Exclusion.

关 键 词: 搜索引擎 网络机器人 内容分类 检测 日志 站点 检测算法 统计

领  域: [自动化与计算机技术] [自动化与计算机技术] [电子电信] [电子电信]

相关作者

作者 邹竞辉
作者 袁春华
作者 蓝维鼎
作者 吴华香
作者 陈雄成

相关机构对象

机构 华南理工大学
机构 中山大学
机构 华南师范大学经济与管理学院
机构 中山大学资讯管理学院信息管理系
机构 华南师范大学

相关领域作者

作者 毕凌燕
作者 王和勇
作者 杨涛
作者 谢惠加
作者 孟显勇