导 师: 王振宇;胡炜梅
授予学位: 硕士
作 者: ();
机构地区: 华南理工大学
摘 要: 随着音乐社交媒体的快速发展,线上音乐资源快速增加,音乐类型日益多元化。丰富的音乐标注信息作为一种组织海量音乐数据的有效手段,成为在线音乐服务的重要部分。同时音乐自动标注作为一种音乐信息丰富的有效方法受到越来越多的关注与研究。近年来,深度神经网络算法在音乐自动标注领域取得了巨大成功。尽管如此,真实音乐标注数据集存在大量标签噪声,影响音乐自动标注深度网络在训练和分析过程的可靠性,导致自动标注效果较差。噪声的不良影响无法直接通过深度神经网络结构优化解决。针对上述问题,本文主要完成以下几点工作:1)对一个大规模的音乐标注数据集进行分析,并研究标签噪声对卷积神经网络的影响,深入了解其中特性。研究发现标签噪声使网络在训练过程学习到更发散的映射关系,导致最终标注效果差。2)提出标签向量概念,并验证其合理性与有效性。根据数据集与音乐标签分析结果定义标签向量,挖掘音乐标签与音频之间的深层信息,并将标签向量用于音乐自动标注任务。3)提出基于标签深度分析的音乐标注算法。算法提取音频多层级特征,结合标签向量,提高音乐自动标注深度网络对标签噪声的鲁棒性,在真实标注数据集上得到更好的表现。基于百万音乐数据集上的实验结果表明本文通过预训练网络有效观察到了音乐标签与标签之间的深层关系。另外,基于百万音乐数据集、Magna Tag ATune数据集和真实商业数据集的实验结果表明在真实音乐标注数据集上,本文基于标签深度分析的音乐自动标注算法比其他最新的方法更有效。
关 键 词: 音乐自动标注 深度神经网络 标签噪声 标签向量
领 域: []