文献详情 - Gdtheory理论粤军网|广东智库信息化平台

全部文献媒体文章报刊论文会议论文学位论文出版专著研究报告课题成果特色专题

高级检索

您现在所在的位置：网站首页 > 知识中心 > 文献详情

文献详细_{Journal detailed}

Web文档清洗技术
Research on Web Document Cleaning

下载全文在线阅读

收藏

作　　者： ; ; ; ;

机构地区： 南京大学计算机科学与技术系计算机软件新技术国家重点实验室

出　　处： 《计算机科学》 2002年第6期52-54,共3页

摘　　要： 1引言随着Internet在全球的迅速发展,WWW(World WideWeb)已经发展成为一个包含多种信息资源、站点遍布全球的巨大信息服务网络,为用户提供了一个极具价值的信息源,并已成为世界范围内信息共享和信息传播的最主要渠道之一.WWW系统一经出现,就得到了迅猛的发展,无论是WWW站点数还是WWW用户数,都是以每年5～10倍的速度呈指数形式增长.目前仅中国的Internet用户就已经达到了2500万. Information on Web is expanding rapidly, but the quality differs greatly, which makes Web information retrieval and mining more difficulty. Not only research on the technology of information retrieval and Web mining itself needs to be made, but also cleaning Web documents must be done before Web information retrieval and Web mining. However, the latter is often delegted in most current reseach work. This paper puts forward the concept of Web document cleaning. introduces the role that Web document cleaning plays in Web information processing and the process of Web document cleaning. A rule-based system of Web document cleaning is implemented.

关键词： 信息资源信息挖掘文档清洗计算机网络信息检索

领　　域： [自动化与计算机技术] [自动化与计算机技术] [文化科学]

相关作者

作者张岌秋: 作品数：2被引量：23; 供职机构：中山大学资讯管理学院资讯管理系; 发文主题：数字资源整合;情报学;网络环境;信息检索;信息资源;研究方法

作者卢炳卫: 作品数：4被引量：4; 供职机构：华南农业大学; 发文主题：高校图书馆信息资源建设;农业信息化;自然语言处理;信息化建设;信息检索;信息资源;答案抽取

作者杨艳萍: 作品数：6被引量：2; 供职机构：广东技术师范学院; 发文主题：档案管理;档案保密工作;档案编研工作;档案工作;档案利用;档案信息;档案业务工作;档案意识;档案资源建设;育人机制;涉密档案;电子文件归档;电子政务;文档;民生档案;信息化社会;各项工作;信息记录;高校;保密工作

作者康全礼: 作品数：8被引量：24; 供职机构：汕头大学高等教育研究所; 发文主题：大学本科;教学改革;高等教育学;本科教学;本科教育;数据可视化;硕士培养;通才教育;文档;理论体系构建;民国时期;教育改革;教育结构;教育模式研究;工程教育;高等教育;学科建设;本科教学改革;工程;大学教育

作者范晓蔚: 作品数：6被引量：4; 供职机构：中山大学; 发文主题：档案信息资源开发;档案部门;异议;档案管理;档案文献编纂工作;档案形成;市委;提起;电子档案管理;电子文件;利用者;伦理关系;伦理规范;伦理问题;个人信息;信息伦理;信息生产;信息挖掘;行政复议;行政诉讼

相关机构对象

机构中山大学: 作者数：27151; 发文主题：电视节目,用户,实证研究,家居,硬件,视域,异构,权利,分布式存储,蓝牙,启迪,从严治党,音乐门铃,领导干部,加密方法,中间件,党内权力,数字电视,权力监督,制度反腐,实体化,数字家庭,民主监督,社会主义国家执政党,马克思主义,监控系统,视频图像,中间件系统,数据传输方法,毛泽东,中国特色社会主义,风险评估,中国共产党,邓小平,素质教育,青年农民工,嵌入式,

机构中山大学资讯管理学院: 作者数：446; 发文主题：残障人士,信息系统管理,英国议会,档案公共服务,档案开放利用,图书馆学,图书馆,公民权利,灾难,公共,图书馆史,声明,档案公布,档案法规,档案服务工作,档案利用,硕士教育,灾区重建,中国图书馆史,导航,档案鉴定,数字化档案信息,社会角色,知识产权,档案学专业,档案学教育,英文文献,再设计,国际图联,档案利用权,考释,程序规制,资产性,石刻拓片,用户服务,档案开放,图书馆协会,档案,档案利用服务,公民隐私权保护,知识自由政策,权利行使,访谈录,知识自由,档案学,书目控制,知识管理,奖项,专业硕士,释文,现行文件服务,图书馆权利,真人,学术论文,图书馆集成系统,

机构中山大学资讯管理学院信息管理系: 作者数：271; 发文主题：档案管理,图书馆事业,群分析,被引半衰期,数据库建设,图书馆学,因特网,语种,社会,文件生命周期理论,档案馆建设,档案管理理论,档案传播,档案公布,档案工作,引文分析,档案法规,著者,档案信息服务,档案利用,档案法,档案法制建设,新中国,网络建设,统计分析,档案管理体制,档案学研究,图书馆管理,载文分析,档案工作者,图书馆社会学,图书馆工作,档案服务功能,索引,科学计量学,市场经济,国外信息,法律效力,档案,档案利用者,载文统计分析,网络环境,档案学,档案人才,文献计量学,电子文件,职业化,档案管理现代化,档案工作实践,电子文件鉴定,信息政策法规,档案事业,档案管理机构,档案观念,期刊影响因子,本体论,档案馆网站,

机构中山大学资讯管理学院资讯管理系: 作者数：414; 发文主题：周年,职业倦怠,文体特征,互操作框架,相似度计算,图书馆,专业教育,情报学,图书馆员职业,社区建设,教学,数字仓储,图书馆专业人才,人力资源管理,文体分析,特曼,档案学教育,图书馆事业史,图书馆管理,人文社会科学,文本挖掘,网络学术,平等权利,公共图书馆理念,图书馆服务,职业倦怠现象,输入法,异构,语义相似度,信息资源共享,实体关系抽取,网络信息保存,网络环境,图书情报教育,社区信息服务,中国图书馆学,营销策略,看图,自由权利,公共图书馆思想,知识抽取,图书馆目标,数字参考服务,视障人士,图书馆学教育,信息查询行为,用户研究,研究方法,图书馆使命,相似度算法,图书馆权利,人文社科,网页去噪,隐私权,图书馆核心价值观,读者满意度调查,

机构华南师范大学经济与管理学院: 作者数：2327; 发文主题：支持向量机,公司成长性,模型,养老基金,经济发展,神经网络,工资体系,文献计量分析,公平,图书馆,有限状态图,财务杠杆,路向,自由现金流,上市公司,内部资本市场,第一大股东,劳动关系,股利政策,双重代理关系,开源软件,投资者保护,股权制衡,社会保障,知识图谱,企业,资本结构,数字图书馆建设,债务期限结构,经济合作,供应商融资,市场运行效率,规模经济,支持向量机分类,就业结构,文本分类,数字图书馆,实证分析,跨国经营,经济定位,聚类分析,数据挖掘,云计算,股权结构,可视化分析,集中度,集团内部资本,大样本,证券指数,数据挖掘研究,劳动力市场,企业成长性,现金持有量,社会和谐,公司治理,政治市场,经济结构,

相关领域作者

作者李文姬: 作品数：3被引量：0; 供职机构：广州市社会科学院; 发文主题：云计算;中国社科院;中科院;社会信息服务;数据库;数字图书馆;网络;信息服务;信息资源

作者邵慧君: 作品数：9被引量：21; 供职机构：文学院; 发文主题：粤方言;粤语;综论;语音比较;语音数据库;语音特点;战国时期;第一人称代词;送气;同源;代词系统;清分;厦门话;小称;海话;儿尾;方言词汇;白话;变调;变音

作者杜松华: 作品数：2被引量：0; 供职机构：广东工业大学; 发文主题：社交媒体;农业现代化;企业;电子商务;可持续发展;共生共赢

作者周国林: 作品数：22被引量：54; 供职机构：广东金融学院; 发文主题：产业共性技术;上市公司;实证研究;组织承诺;董事会;动漫产业集群;产业集群;影响因素;语言学习;证券市场;证券市场风险;人力资源发展战略;社会主义新农村;生态系统;生态学思考;实证分析;市场壁垒;企业形象设计;区域经济合作;区域经济均衡

作者邢弘昊: 作品数：8被引量：0; 供职机构：广东省社会科学院; 发文主题：营销管理创新;在线广告;支付功能;视觉中心;数据库技术;通信设施;亲情服务;主流媒体;自我革新;最大多数人;网络媒体发展;网民规模;媒介竞争;媒体;民族性特征;目标受众;精神文化产品;新媒体;活跃度;技术门槛

联系方式

电话：020-38800179

邮箱：gdtheory@126.com

地址：广州市天河区天河北路618号广东社会科学中心

邮编：510635

友情链接

扫一扫手机浏览

广东省社会科学院·广东省哲学社会科学数据库·广东智库版权所有 Copyright©2012 gdtheory.cn All Rights Reserved.

违法和不良信息举报中心举报邮箱：jubao@cqvip.com 粤ICP备10080020号-3