文献详情 - Gdtheory理论粤军网|广东智库信息化平台

全部文献媒体文章报刊论文会议论文学位论文出版专著研究报告课题成果特色专题

高级检索

您现在所在的位置：网站首页 > 知识中心 > 文献详情

文献详细_{Journal detailed}

一种基于逆序匹配重复模式的主题信息提取方法
A THEME INFORMATION EXTRACTION METHOD BASED ON REPETITIVE PATTERN REVERSE MATCHING

下载全文在线阅读

收藏

作　　者： ; ; ;

机构地区： 广东工贸职业技术学院计算机工程系

出　　处： 《计算机应用与软件》 2013年第4期88-91,共4页

摘　　要： 网页中的信息主要以重复的HTML结构进行组织并形成一致的展现形式,主要研究具备复杂重复模式的网页主题信息块识别,提出一种改进的基于逆序匹配重复模式的算法。该算法依据HTML标签结构和class属性改进DOM树,重构页面的向量空间模型,逆序匹配重复结构模式并完成对主题信息的提取。实验结果表明,该方法能准确识别复杂页面结构中主题重复模式,有效避免非主题重复模式的干扰,有较好的召回率和准确率。 The information in webpage is mainly arranged with repetitive HTML structure and presents in consistent display style.In the paper we put emphasis on studying the recognition of the webpage theme information with complicated repetitive pattern and propose an improved algorithm which is based on repetitive pattern reverse matching.The method improves document tree model in accordance with HTML tag structure and class property,reconstructs vector space model of the pages,reversely matches the repetitive structure pattern and then completes the extraction of the theme information.Experimental results suggest that this method can precisely recognise the theme repetitive pattern in complicated webpage structure,effectively avoid the disturbance from non-theme repetitive pattern blocks and performs well in precision and recall.

关键词： 信息提取重复模式主题识别逆序匹配

领　　域： [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者毕凌燕: 作品数：8被引量：28; 供职机构：华南理工大学; 发文主题：实证研究;电子商务专业;国内高校;营销;支持向量机;图像编码;汽车零部件;侵权犯罪;情感计算;情绪信息;主题识别;小波变换;效果评价模型;假冒产品;信息流;工作流授权模型;股价预测;股票市场预测;国际刑警组织;行为金融理论

作者周静仪: 作品数：1被引量：17; 供职机构：香港中文大学; 发文主题：语音信息;中文阅读;主题信息;句子加工

作者陈少芳: 作品数：1被引量：17; 供职机构：香港中文大学; 发文主题：语音信息;中文阅读;主题信息;句子加工

作者廖剑锐: 作品数：1被引量：0; 供职机构：中山大学; 发文主题：文本挖掘;信息获取;信息提取;选股;系统

作者黄燕佩: 作品数：2被引量：0; 供职机构：广州大学; 发文主题：青少年;网络成瘾;网络心理;物理学科;信息提取;学科领域知识

相关机构对象

机构香港中文大学: 作者数：2016; 发文主题：教师,人力资本理论,实证研究,教师认同感,民办高等教育,心理过程,公立高校,教师专业发展,教育财政,高等教育需求,社会资本,课程实施,高等教育,教育成本,影响因素,人力资本,中国课程改革,香港学前教育,再培训,教学,大学生贷款,教育发展,心理变化,高中生,制度化,课程改革,政府角色,经济动因分析,课程变革,教师情绪,教育收益率,教师改变,信任,学生贷款,预算约束,情绪劳动,高校收费,新课程改革,幼稚园,教育公平,

机构中山大学: 作者数：27151; 发文主题：电视节目,用户,实证研究,家居,硬件,视域,异构,权利,分布式存储,蓝牙,启迪,从严治党,音乐门铃,领导干部,加密方法,中间件,党内权力,数字电视,权力监督,制度反腐,实体化,数字家庭,民主监督,社会主义国家执政党,马克思主义,监控系统,视频图像,中间件系统,数据传输方法,毛泽东,中国特色社会主义,风险评估,中国共产党,邓小平,素质教育,青年农民工,嵌入式,

机构南方医科大学外国语学院: 作者数：62; 发文主题：异文化,影坛,英语阅读教学,外语课堂,英语口语能力,读为,卡佛,大学英语,美国短篇小说,自组织,字谜游戏,大学英语听力教学,身份,英语交流,女性主义批评,极简主义,英语阅读能力,雷蒙德,概念图,德莱塞,主题,英语阅读教学模式,专家学者,殖民叙事,历史民族志,外语教学改革,肿瘤病区,提高口语能力,主题阅读教学,小说,对抗情绪,网络教学,权力话语,战争创伤,荡妇,大学英语口语,图式,短篇小说,殖民文化,蓝领阶层,文学界,思维能力,悖论,中班,人文关怀,教学设计,英译策略,英语考试,研究方法,异化翻译,思辨能力,纬度,元认知策略,

机构广州大学: 作者数：5527; 发文主题：公立高校转制,实践教学,社会主义,教育改革,公立高校,教育收益,高校思想政治理论课程,协商民主,马克思主义中国化,产业结构,广东高等教育,高等教育,教育成本,青少年,实践教育,学费,高校,思想政治理论课,失衡,地方高校,民主党派,义务教育,教育培养成本,收取,低收入人群,马克思主义,教学一体化,政府,执政能力,思想政治理论课程,统一战线,内在特质,办学效益,多党合作制,因教致贫,逻辑构成,中国共产党,邓小平,公立学校转制,

机构华南师范大学: 作者数：20338; 发文主题：教师成长,宏观经济,社会主义实践,中国梦,二重性质,马克思主义经济学,人生哲学,有效教学,中国货币政策,教育科研,克鲁格曼,教育叙事研究,教育研究,政治经济学,人民内部矛盾,新自由主义,校本教研,人性,哲学发展,课程改革,老师,教育行动研究,卢卡奇,学校教育,动物精神,马克思哲学,凯恩斯主义,人类社会发展规律,西方经济学,因果,教学研究,社会主义市场经济,中国共产党,教师,实证研究,诺贝尔经济学奖,教育现象学,英美文学,埃尔斯特,实证检验,校本教学研究,中国化马克思主义,社会主义建设规律,唯物史观,经济政策,社会存在本体论,异化,日常教学,社会主义发展道路,叙事研究,早期西方马克思主义,教学理念,马克思主义,人民币国际化,历史唯物主义,萨金特,教育叙事,世界货币,本体论,

相关领域作者

作者李文姬: 作品数：3被引量：0; 供职机构：广州市社会科学院; 发文主题：云计算;中国社科院;中科院;社会信息服务;数据库;数字图书馆;网络;信息服务;信息资源

作者邵慧君: 作品数：9被引量：21; 供职机构：文学院; 发文主题：粤方言;粤语;综论;语音比较;语音数据库;语音特点;战国时期;第一人称代词;送气;同源;代词系统;清分;厦门话;小称;海话;儿尾;方言词汇;白话;变调;变音

作者杜松华: 作品数：2被引量：0; 供职机构：广东工业大学; 发文主题：社交媒体;农业现代化;企业;电子商务;可持续发展;共生共赢

作者周国林: 作品数：22被引量：54; 供职机构：广东金融学院; 发文主题：产业共性技术;上市公司;实证研究;组织承诺;董事会;动漫产业集群;产业集群;影响因素;语言学习;证券市场;证券市场风险;人力资源发展战略;社会主义新农村;生态系统;生态学思考;实证分析;市场壁垒;企业形象设计;区域经济合作;区域经济均衡

作者邢弘昊: 作品数：8被引量：0; 供职机构：广东省社会科学院; 发文主题：营销管理创新;在线广告;支付功能;视觉中心;数据库技术;通信设施;亲情服务;主流媒体;自我革新;最大多数人;网络媒体发展;网民规模;媒介竞争;媒体;民族性特征;目标受众;精神文化产品;新媒体;活跃度;技术门槛

联系方式

电话：020-38800179

邮箱：gdtheory@126.com

地址：广州市天河区天河北路618号广东社会科学中心

邮编：510635

友情链接

扫一扫手机浏览

广东省社会科学院·广东省哲学社会科学数据库·广东智库版权所有 Copyright©2012 gdtheory.cn All Rights Reserved.

违法和不良信息举报中心举报邮箱：jubao@cqvip.com 粤ICP备10080020号-3