导 师: 韩国强
授予学位: 博士
作 者: ;
机构地区: 华南理工大学
摘 要: 由于“语义鸿沟”存在,长期以来基于自然数据的理解、识别和分类任务需要对自然数据进行特征提取,而这些特征提取方法往往只能得到非常底层的特征,而且需要针对不同的任务设计不同的特征提取方法,这要求设计者对于某一领域的数据有着深入的理解并且具备相关领域先验知识。特征的提取方法往往决定了整个系统的成败,底层特征的难以设计和调优困扰着人工智能领域的进步。深度学习技术的出现,使得以统一的机制通过数据自身出发,学习数据之间有利于最终任务的关系表达成为了可能。这种机制通过多层网络,每一层学习数据的不同抽象程度的特征,从底层至高层逐层抽象。目前,深度学习在图像分类、围棋博弈等领域已经接近了人类的水平。因此,通过基于深度学习的数据处理技术具有广泛的研究意义。针对基于深度学习的数据处理技术,本文从交通流量数据和胶囊摄像机的视频数据两种数据出发,提出了若干基于深度学习的数据处理关键技术,主要研究的内容和创新点如下:1.提出了一种门限的自适应提升栈式自编码器,这种栈式自编码器在一定程度上解决了基于栈式自编码器在某些特定条件下交通流量预测存在的统计失效、计算失效和表达失效问题。这种自适应框架通过集成具有不同初始条件、网络结构的栈式自编码器,通过一种数据复制策略,使下一个自编码器进行训练时,更多地考虑预测误差较大的样本,通过计算所集成的各个栈式自编码器的判别误差,确定每个自编码器的重要程度,最后通过穷举可行解寻找一个预测值,这个预测值根据所集成度的自编码器的重要程度来满足尽可能多的栈式自编码器的预测结果来作为最终的预测值。我们在荷兰阿姆斯特丹市周边的高速公路的数据集上进行测试,实验结果表明我们的方法优于传统的