帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于倒排表的数据检索优化系统
System of Optimized Data Search Based on Inverted Files

作  者: ; ; (彭宇扬);

机构地区: 中山大学物理科学与工程技术学院

出  处: 《电脑与信息技术》 2008年第2期18-21,共4页

摘  要: 针对通用数据库海量数据检索速度慢的缺点,文章提出了一个数据检索优化系统。该系统通过将海量数据拆分成短语和单词,利用哈稀算法和基数排序算法,将拆分的短语和单词重新组织成词典,并对每个短语和单词建立倒排表,利用该倒排表对通用数据库中的海量数据做索引。使用这种基于倒排表的数据索引能够将数据检索速度降低到毫秒级。 In order to reduce the disadvantage of the slow data search of common database, this article introduces a system to optimize data search. The system divides large numbers of data into terms and words. These terms and words are rebuilt to dictionary by using Hash and Radix sorting algorithm. Then the system builds inverted files based every term and word in the dictionary. Finally, the system uses the inverted files to build sort lists for the large numbers of data in the common database. Using the sort lists based on the inverted files, the speed of data search can reduce to millisecond level.

关 键 词: 倒排表 分词 数据检索优化 词典

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 曾雪珊
作者 杨莉莉
作者 申伟
作者 赵新
作者 黄建华

相关机构对象

机构 广东外语外贸大学
机构 暨南大学
机构 广东外语外贸大学词典学研究中心
机构 中山大学
机构 中山大学外国语学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊