帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

鞅在学习样本选择中的应用
Martingale Application in Selection of Learning Samples

作  者: ; ; ; ;

机构地区: 安徽大学数学科学学院数学系

出  处: 《计算机工程与应用》 2006年第18期47-49,共3页

摘  要: 样本训练集的选取对网络分类精度及泛化能力有很大影响,同样对回归分析中的两难问题“偏差-方差”影响很大。经典的简单抽样理论在现实中很难做到,数据之间关系受到噪音以及领域知识的限制而显得很复杂,尤其是离群点的影响不能忽视。故而有限样本集中学习,如何获得最优结果不仅与算法有关,且与样本集的选取有关。文章首先从学习的数学理论出发阐明样本训练集的选取方法必要性,进而提出样本选择的鞅性要求与样本训练集中的离群点定义,最后提出在无监督学习中,混合密度分布有限样本集且样本类别数不知情形下的聚类与离群点判别算法,试验结果表明该算法的可行性与有效性。 The selection of training sample set has some influence on classification precision and generalization ability of neural networks as well as "bias-variance" dilemma of regression analysis.Classical simple sampling theory cannot carry out in reality because of noise affection and domain knowledge limitation,especially outliers affection,so that optimal result is relative to not only algorithms but also selection of sample set under the condition of finite samples.In this paper,the selection of training sample set is necessary in light of mathmatical learning theory firstly,martingale criterion about selecting samples and outliers definition are brought up secondly,and at last a kind of outliers detection algorithm is proposed based on unsupervised learning.The analysis of a simulated data shows that the algorithm can effectively detect samples produced by different mechanisms,namely outliers.

关 键 词: 神经网络 回归分析 离群点 无监督学习

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 王晓晶
作者 薛琼
作者 张阿妮
作者 朱怀意
作者 詹裕河

相关机构对象

机构 华南理工大学
机构 华南理工大学工商管理学院
机构 暨南大学
机构 中山大学
机构 北京理工大学珠海学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊