帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

面向微博的数据采集平台及应用

导  师: 庞雄文

学科专业: H1204

授予学位: 硕士

作  者: ;

机构地区: 华南师范大学

摘  要: BSTRACT_DL">

微博数据的采集方法主要包括网络爬虫和应用编程接口API,由于微博的简短性和随意性,目前还没有出现十分成熟的微博数据采集方法,因此针对微博数据采集的研究具有重要的实际意义。本文设计实现了面向微博的数据采集平台,抽象不同的数据采集方法之间的共性,屏蔽底层细节,实现对不同微博的数据进行统一采集。
  本文的研究内容包括:
  1)认证与授权方法的封装。目前认证与授权方式主要包括模拟登录和OAUTH认证,本文通过接口对这两种授权方式进行封装。
  2)数据采集的封装。包括网络爬虫和应用编程接口API采集方法的封装,模拟登录、JAVASCRIP...

展开

关 键 词: 微博 数据采集 身份认证 授权管理 网络爬虫

分 类 号: [TP393.08 G210.7]

领  域: [自动化与计算机技术] [自动化与计算机技术] [文化科学]

相关作者

作者 张坚雄
作者 黄尧
作者 吴念香
作者 梁向东
作者 朱晴晴

相关机构对象

机构 中山大学
机构 中山大学管理学院
机构 深圳大学
机构 中山大学信息科学与技术学院软件研究所
机构 华南理工大学

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊