机构地区: 中山大学信息科学与技术学院
出 处: 《计算机科学》 2010年第9期173-176,共4页
摘 要: 在文本检索领域,当前广泛应用的方法或者是考察检索词项与被检索文本的词频信息,或者是考察检索词项与被检索文本的语义相似性。这些方法忽略了检索词项与被检索文本的结构信息,检索结果有一定的局限性。通过分析检索词项与被检索文本句子结构的主谓宾信息,进而考察主谓宾结构中词汇的语义相似性,最终实现对文本的语义检索。实验表明,该方法能够有效提高检索的查准率。 In text retrieve area,popular methods either considered word frequency or semantic information between retrieve terms and text corpus.These methods ignore the semantic structure information of retrieve terms and text corpus,and then the good result limits to some domains.This paper analyzed the subject-verb-object structure information of text,and then computed the similarity of the words where the words lie in the subject-verb-object structure,and finally implemented semantic information retrieving of texts.The experiment shows that the approach could improve the precision effectively.
关 键 词: 文本信息检索 语义相似度 语法结构信息 检索算法
领 域: [自动化与计算机技术] [自动化与计算机技术]