帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

双数组Trie树算法优化及其应用研究
Research of Optimization on Double-Array Trie and its Application

作  者: ; ; ;

机构地区: 中国科学院计算技术研究所

出  处: 《中文信息学报》 2006年第5期24-30,共7页

摘  要: 本文对双数组Trie树(Doub le-Array Trie)算法提出了一种优化策略,即在采用Trie树构造数组的过程中,优先处理分支结点数更多的结点。这种优化策略可以在保证该算法数据查找效率不变的同时,进一步减少数据稀疏,提高空间利用率。我们基于该优化算法实现了一个词典管理程序,并与利用其他索引机制的词典进行了实验对比。实验结果表明,利用优化的双数组Trie树算法的词典不仅在查询速度上优于用其他索引机制的词典,而且存储数据的空间占用也比较小。 This paper proposes an improved strategy for the algorithm of Double-Array Trie that is, the node with most child nodes is praessed firstly when constructing the array. This strategy can reduce the data sparseness and keep the search efficiency meanwhile. We implement a program for lexicon management base on the improved Double-Array Trie and compare it with other index mechanisms. The results clearly show that the improved Double-Array-Trie algorithm has a much higher search speed and needs a smaller space for data store than other index machanisms.

关 键 词: 计算机应用 中文信息处理 双数组 词典 分词

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 占勇
作者 杨晓
作者 林燕华
作者 康鹏
作者 周慧婷

相关机构对象

机构 广东外语外贸大学
机构 暨南大学
机构 广东外语外贸大学词典学研究中心
机构 暨南大学图书馆
机构 中山大学

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊