收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

半结构化的Deep Web信息抽取技术

朱晴  姜利群  张言辉  
【摘要】:当今随着互联网技术的飞速发展,DeepWeb的信息量也在以惊人的速度迅猛增长,对其进行信息抽取具有十分重要意义。该文针对Web页面半结构化的特点,提出了基于XML的信息自动抽取方法,设计了抽取的流程,并对抽取规则进行了优化。

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 许学标,顾宁,施伯乐;半结构化数据模型及查询语言[J];计算机研究与发展;1998年10期
2 王宁,陈滢,俞本权,徐宏炳,王能斌;一个基于CORBA的异构数据源集成系统的设计[J];软件学报;1998年05期
3 王宁,徐宏炳,王能斌;基于带根连通有向图的对象集成模型及代数[J];软件学报;1998年12期
4 李庆华,刘昊;用待确定的上下文无关文法分析半结构化数据[J];华中理工大学学报;1999年05期
5 陈滢,徐宏炳,王能斌;基于标记图的Web数据模型[J];计算机学报;1999年03期
6 徐贵红;Web的半结构化数据模型和查询模型[J];内蒙古大学学报(自然科学版);1999年03期
7 王宁,徐宏炳,王能斌;数据源集成系统中全局模板的增量维护策略[J];软件学报;1999年04期
8 陈滢,王能斌;半结构化数据查询的处理和优化[J];软件学报;1999年08期
9 苏纪石,周傲英;二十一世纪的数据库技术[J];微型电脑应用;1999年05期
10 陈恩红;范焱;王行甫;蔡庆生;;网际网上半结构化数据抽取与知识发现方法及其实现[J];计算机科学;1999年10期
中国重要会议论文全文数据库 前7条
1 易虹;许德刚;;Web数据挖掘的研究与应用[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
2 赵朋朋;高岭;崔志明;;基于查询接口特征的Deep Web数据源自动分类[A];2006年全国开放式分布与并行计算学术会议论文集(二)[C];2006年
3 冯迪;李晋宏;曹原;;基于网页的数据挖掘研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
4 袁小龙;刘增才;李晓霞;郭力;;基于XML的半结构化化学信息提取系统的重构与优化[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
5 刘凡君;胡荷芬;乔明;;Native XML数据库技术研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
6 朱辉;陈建中;;支持分布式异构数据仓库的财务决策支持系统研究[A];中国企业运筹学[C];2009年
7 李宝林;兰芸;赵云霞;李玲飞;;基于内容的Internet信息过滤方法研究综述[A];全国计算机安全学术交流会论文集(第二十三卷)[C];2008年
中国博士学位论文全文数据库 前10条
1 郑淑丽;Web信息集成系统及查询优化方法研究[D];合肥工业大学;2003年
2 王真星;基于本体的计算机支持协同学习关键技术研究[D];复旦大学;2003年
3 陶春;半结构化数据集成系统中的查询处理研究[D];复旦大学;2004年
4 秦杰;Web环境中半结构化数据存储与查询技术研究[D];国防科学技术大学;2005年
5 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
6 王秦辉;约束满足及其分布式求解和应用研究[D];中国科学技术大学;2007年
7 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年
8 徐和祥;Deep Web集成中若干技术研究[D];复旦大学;2008年
9 赵朋朋;Deep Web信息集成若干关键技术研究[D];苏州大学;2008年
10 方巍;基于本体的Deep Web信息集成关键技术研究[D];苏州大学;2009年
中国硕士学位论文全文数据库 前10条
1 胡红霞;Web敏感页面发现技术研究[D];中国人民解放军信息工程大学;2002年
2 李由;一种半结构化信息组织技术的研究与实现[D];国防科学技术大学;2002年
3 武刚;以XML为核心的WEB统一数据的初步研究[D];西南石油学院;2002年
4 张仕;XML数据管理系统的研究与实现[D];南京航空航天大学;2003年
5 凌永丰;基于J2EE/XML的Web数据处理技术研究[D];南京理工大学;2003年
6 邬丽云;XML数据管理技术研究[D];南京航空航天大学;2004年
7 赵萍;基于XML的异构数据集成系统[D];大连海事大学;2004年
8 陈明;半结构化数据XML与结构化数据库之间转换的研究及应用[D];重庆大学;2004年
9 洪小伟;基于XML异构数据集成的研究[D];东南大学;2004年
10 杨兵;基于可扩展置标语言的通用数据访问模型研究[D];华中科技大学;2004年
中国重要报纸全文数据库 前10条
1 谢立宏博士;企业的“黄金眼”数据挖掘决策支持[N];中国计算机报;2002年
2 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
3 清华大学 邢春晓 李蕾 周立柱;XML数据库另辟天地[N];计算机世界;2003年
4 本报记者 刘学习;25年的感悟[N];计算机世界;2004年
5 ;下一代数据库六大特点[N];中国计算机报;2005年
6 马云;商业智能的五大趋势[N];计算机世界;2005年
7 ;数据库:变革前夜?[N];网络世界;2005年
8 辛铭;数据库技术 这里的变化静悄悄[N];金融时报;2006年
9 郭平;博科Tapestry提供文件“保管箱”[N];计算机世界;2006年
10 郭平;数据归档软件HT FileStore[N];计算机世界;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978