中文会议: 中国人工智能学会第12届全国学术年会论文汇编
会议日期: 2007-11-20
会议地点: 哈尔滨
主办单位: 中国人工智能学会
机构地区: 中国科学院研究生院
出 处: 《中国人工智能学会第12届全国学术年会》
摘 要: 文本分类一直是智能科学研究中的重要问题,它将未分类文本划分到相关的类别。然而,实际应用中的文本往往会与多个类别相关,因此,不能单纯地仅将其划分到一个类别。 本文针对这类问题,提出了基于模糊数学规划思想的分类方法,在预设的分类规则及参数的基础上,将文本散列到多个类别中,并给出其相关程度。该方法适用于对难以进行单一分类的文本,如跨专业领域的文本、新闻文本等进行分类。实验验证了该方法在处理综合类型文本方面的出色表现;同时,利用支持向量机和向量空间法,也证明了该方法在处理特征比较单一的文本方面,效果也没有降低太多,仍在可以接受的范围类。此外,该方法还可以挖掘出多个类别最容易产生交集的领域。
关 键 词: 智能科学 数据挖掘 文本分类 模糊规划 计算机数学
领 域: [自动化与计算机技术]