帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

面向慕课视频的关键词抽取研究与应用

导  师: 马震远;唐晓辛

授予学位: 硕士

作  者: ();

机构地区: 广东技术师范学院

摘  要: 随着互联网技术和移动通讯技术的飞速发展,“慕课”(Massive Open Online Course,MOOC)在世界范围内迅速兴起,现有慕课平台上提供了海量的教学视频,但这些平台大多无法根据知识点进行精准视频检索。如何帮助学习者在海量的慕课资源中快速准确地查找具体的知识点,满足其个性化的学习需求,提高其学习效率是本文要解决的核心问题。鉴于教学视频的知识点通常也是视频讲授内容的关键词,因此,解决这一问题的关键是针对教学视频依据讲授内容实现关键词自动抽取。虽然,目前已有不少针对文本的关键词抽取算法,但尚未有针对口语化程度高、知识点具有层次性等特点的教学视频的关键词抽取研究。因此,亟需提出一种面向慕课视频关键词自动抽取的方法,为此,本文主要进行了以下工作:(1)分析并总结了慕课视频的语言特征,构建了慕课关键词抽取测试数据集并进行数据预处理。由于目前尚未有针对教学视频的标准数据集,本文运用视频爬虫和视频语音文字转写等综合方法构建了慕课测试数据集。并针对慕课视频的语言特征,提出从中文分词和文本过滤等方面对数据集进行文本预处理,以确保关键词抽取的准确性,最终得到关键词抽取候选文档集。(2)基于经典的TextRank算法和慕课视频的语言特征,提出了一种多特征融合的TextRank慕课视频关键词抽取算法。首先,根据慕课视频的语言特征,对关键词抽取候选文档集进行特征提取,得到影响词语重要性的特征:词语位置、词性和领域特征等;其次,提出通过序关系法确定文本中词语位置、词性和领域特征的权重分配;再次,将计算得到的词语综合权重用以确定传统TextRank模型中的词汇节点初始权值及概率转移矩阵,获得改进的TextRank算法;最后,通过算法的迭代,计算每个词语的最终权值,并据此选出权值最大的若干词语�

关 键 词: 关键词抽取 算法 序关系法 慕课视频 知识点

领  域: []

相关作者

作者 周群
作者 钟佩吟
作者 蔡燕婷
作者 何少轩
作者 徐菡

相关机构对象

机构 华南师范大学
机构 深圳信息职业技术学院
机构 中山大学
机构 肇庆学院生命科学学院
机构 华南理工大学

相关领域作者