帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于集成学习与规则提取的多标记学习方法在高血压证素辩证中的研究

导  师: 李坚强

授予学位: 硕士

作  者: ();

机构地区: 深圳大学

摘  要: 高血压疾病是引起心血管疾病的重要原因之一,中国高血压患病率正呈现上升趋势。随着中医高血压数据的增长,对中医高血压证素辩证进行研究将是一个具有前景的方向。中医对高血压治疗是基于辩证的手段进行的,只有先经过辩证得到具体的证名才会有相应的治疗手段。辩证是一个首先通过分析证候信息,推断出证素信息,最后合成证名的过程。传统中医师进行辩证主要依赖于对前人经验的学习以及个人经验。随着中医高血压临床数据的剧增,这种方式不再适合于发现中医高血压辩证新的知识。本文将应用数据挖掘技术研究中医高血压证素辩证,即研究分析证候信息,得到证素信息的过程。为了发现高血压证素辩证中证候与证素之间的关系,本文运用了多标记集成学习方法、不平衡处理策略与规则提取等技术。本文的主要工作如下:首先,本文针对高血压证素辩证中一个样本存在多个证候和多个证素的特征,将多标记学习方法应用于中医高血压证素辩证,本文还对高血压证素辩证数据进行了统计,发现了其中一些证素存在着类别不平衡的问题。接着,结合多标记学习方法和集成学习方法的优势,比较不同多标记集成学习方法在高血压证素辩证中的优势,探索出一种具有较高性能的中医高血压证素辩证的分类模型。在这个过程中,结合部分证素存在着类别不平衡的问题,提出了一种基于标记相关性的欠采样算法,改善了高血压证素辩证过程中证素类别不平衡的问题。最后,本文利用随机森林规则提取构建了一个可解释性与准确性相结合的模型,用于指导高血压证素辩证。随机森林中每棵决策树从根结点节点到叶子节点的路径可以认为是一条规则,本文通过对高血压证素数据集进行训练得到随机森林分类器,采用爬山法对随机森林中的决策树进行抽取,之后使�

关 键 词: 高血压证素辩证 多标记学习 集成学习 不平衡问题 规则提取

领  域: [] []

相关作者

作者 潘嘉良
作者 林选
作者 史微
作者 阳新明

相关机构对象

机构 中山大学生命科学学院
机构 中山大学药学院
机构 广州医科大学
机构 华南师范大学体育科学学院
机构 徐州医学院公共教育学院

相关领域作者