收藏本站
《电脑知识与技术》 2010年15期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

半结构化的Deep Web信息抽取技术

朱晴  姜利群  张言辉  
【摘要】:当今随着互联网技术的飞速发展,DeepWeb的信息量也在以惊人的速度迅猛增长,对其进行信息抽取具有十分重要意义。该文针对Web页面半结构化的特点,提出了基于XML的信息自动抽取方法,设计了抽取的流程,并对抽取规则进行了优化。
【作者单位】中国矿业大学计算机科学与技术学院;
【分类号】:TP311.13

【参考文献】
中国硕士学位论文全文数据库 前2条
1 贺智平;Web信息自动抽取技术研究[D];西安电子科技大学;2006年
2 苟全登;基于XML的半结构化Web信息提取的研究[D];电子科技大学;2006年
【共引文献】
中国重要会议论文全文数据库 前1条
1 王文生;谢能付;;基于Web的农业信息自动抽取方法研究[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年
中国硕士学位论文全文数据库 前2条
1 赖春波;Web信息自动抽取技术研究[D];浙江大学;2008年
2 轩艳艳;基于XML的Web信息抽取研究与实现[D];武汉理工大学;2008年
【同被引文献】
中国期刊全文数据库 前1条
1 暴海龙,朱东华;专利情报分析方法综述[J];北京理工大学学报(社会科学版);2002年S1期
中国硕士学位论文全文数据库 前7条
1 王俊英;基于科技文献的中文文本分类算法研究[D];燕山大学;2007年
2 刘峰;通用中英文专业搜索引擎技术的研究及应用[D];大连理工大学;2004年
3 蒋科;基于领域概念定制的主题爬虫系统的设计与实现[D];西安电子科技大学;2007年
4 罗兵;支持AJAX的互联网搜索引擎爬虫设计与实现[D];浙江大学;2007年
5 杨海东;基于Ajax技术的异步搜索引擎研究与实现[D];南京信息工程大学;2007年
6 高岭;Deep Web分类搜索引擎关键技术研究[D];苏州大学;2007年
7 肖亮;垂直搜索引擎的研究与实现[D];北京交通大学;2008年
【二级参考文献】
中国期刊全文数据库 前6条
1 王茹,宋瀚涛,陆玉昌;基于树自动机的网页数据抽取[J];北京理工大学学报;2004年09期
2 李鹤龄;信息熵、玻尔兹曼熵以及克劳修斯熵之间的关系——兼论玻尔兹曼熵和克劳修斯熵是否等价[J];大学物理;2004年12期
3 张绍华,徐林昊,杨文柱,薛文玲,李天柱;基于样本实例的Web信息抽取[J];河北大学学报(自然科学版);2001年04期
4 殷锋;从Web数据库的发布看XML技术[J];计算机应用;2001年S1期
5 孙承杰,关毅;基于统计的网页正文信息抽取方法的研究[J];中文信息学报;2004年05期
6 张树瑜,杜国宁,朱仲英;基于Web的半结构化信息抽取技术研究[J];系统工程与电子技术;2004年05期
中国硕士学位论文全文数据库 前4条
1 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
2 陈少飞;Web信息抽取规则的优化及规则的XQuery表达[D];河北大学;2003年
3 邓丽;面向主题的XML网页的模式和数据抽取[D];华侨大学;2004年
4 狄慧;基于Agent的Web信息抽取研究[D];大连理工大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 朱晴;姜利群;张言辉;;半结构化的Deep Web信息抽取技术[J];电脑知识与技术;2010年15期
2 周宁;数字时代的数据库技术研究[J];图书情报知识;2001年04期
3 文必龙;王瑞;姚建蓬;黄俊莲;;一种Excel数据到结构化数据的转换方法[J];佳木斯大学学报(自然科学版);2006年03期
4 叶飞跃;蒙德龙;员红娟;;一种用于存储与查询半结构化数据的新方法[J];计算机工程;2006年19期
5 温华菁;陈红娟;;基于XML进行Web数据挖掘浅析[J];商场现代化;2009年04期
6 俞晨梓;;论半结构化数据的模型集成[J];电脑编程技巧与维护;2010年04期
7 韩京宇;徐立臻;董逸生;;Web数据仓库研究综述[J];计算机科学;2004年11期
8 王晓东;江元;徐超;;XML技术在Web数据挖掘中的应用[J];中国科技信息;2008年18期
9 谢坤武;;半结构化数据的结构发现聚类算法[J];湖北民族学院学报(自然科学版);2009年03期
10 宋中山,曾广平;基于XML的Web数据挖掘技术[J];中南民族大学学报(自然科学版);2005年01期
中国重要会议论文全文数据库 前10条
1 王钦克;周立柱;;基于模式的半结构化数据重组[A];第十六届全国数据库学术会议论文集[C];1999年
2 冯玉才;刘玉葆;冯剑琳;;半结构化数据中模式的交互式开采[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 陈滢;王宁;俞本权;王能斌;;异构数据源系统中半结构化数据的存取与表示服务[A];第十五届全国数据库学术会议论文集[C];1998年
4 余伟;李石君;洪辉;田建伟;;基于覆盖关系的Deep Web数据源排名[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
5 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 张德;冒志鸿;董逸生;;Web上半结构化数据的管理[A];第十五届全国数据库学术会议论文集[C];1998年
7 王轶彤;汪卫;施伯乐;;半结构化数据模型及对象模式[A];第十五届全国数据库学术会议论文集[C];1998年
8 梁浩;左万利;任斐;赫枫龄;;基于启发式信息的Deep Web查询接口属性抽取[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 王英;左万利;王鑫;彭涛;;Deep Web查询转换研究[A];第六届全国信息检索学术会议论文集[C];2010年
10 闫中敏;李庆忠;彭朝晖;董永权;丁艳辉;张永新;徐秀星;;DWDIS:面向分析的Deep Web数据集成系统[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
中国重要报纸全文数据库 前10条
1 郭平;动态归档助力企业内容管理[N];计算机世界;2007年
2 岑广海;建设自动化的绿色数据中心[N];计算机世界;2007年
3 郭平;数据归档软件HT FileStore[N];计算机世界;2006年
4 于翔;数据治理走到台前[N];网络世界;2007年
5 中国传媒大学计算机学院 朱立谷柳昊 孙志伟 郅斌;非结构化数据的归档术[N];中国计算机报;2007年
6 郭平;博科Tapestry提供文件“保管箱”[N];计算机世界;2006年
7 张志军;IT工具支持BPM[N];计算机世界;2008年
8 清华大学 张志强 邢春晓 冯建华;在技术中体会喜与忧[N];计算机世界;2003年
9 谢立宏博士;企业的“黄金眼”数据挖掘决策支持[N];中国计算机报;2002年
10 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 田建伟;面向领域的高质量Deep Web数据集成技术研究[D];武汉大学;2010年
2 孙涛;面向半结构化数据的数据模型和数据挖掘方法研究[D];吉林大学;2010年
3 潘鹏;Deep Web查询中的不确定性问题研究[D];山东大学;2010年
4 王英;Deep Web数据集成关键技术研究[D];吉林大学;2010年
5 董永权;Deep Web数据集成关键问题研究[D];山东大学;2010年
6 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
7 梁浩;Deep Web信息集成架构及相关问题研究[D];吉林大学;2010年
8 杨厚群;半结构化数据频繁模式挖掘相关技术研究[D];重庆大学;2010年
9 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
10 寇月;Deep Web实体搜索的关键技术研究[D];东北大学;2009年
中国硕士学位论文全文数据库 前10条
1 张雨佳;半结构化数据管理的动态建模技术研究与应用[D];东北农业大学;2010年
2 陈文;Deep Web入口识别和个性化搜索研究与设计[D];江苏大学;2010年
3 付玥;半结构化数据语义分析与映射方法研究[D];东北石油大学;2012年
4 李秀兰;基于结果模式的Deep Web语义标注研究[D];兰州理工大学;2011年
5 杨学伟;基于OEM模型的半结构化数据模式抽取算法研究[D];中国石油大学;2011年
6 房强;面向半结构化数据的数据质量控制系统的研究与实现[D];东北大学;2008年
7 刘丽楠;Deep Web数据源下重复记录识别模型的研究[D];东北大学;2009年
8 王振雷;基于规则的半结构化数据的模式抽取方法研究[D];大庆石油学院;2010年
9 刘凯;Deep Web数据集成关键技术研究[D];长春工业大学;2012年
10 李三义;基于模型匹配的Deep Web数据库分类[D];吉林大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026