收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于XPath的Web信息抽取的设计与实现

杨文柱  徐林昊  陈少飞  郝亚南  李天柱  
【摘要】:提出了一种基于XPath的Web信息抽取方法,鉴于目前还没有免费的商用XPath引擎可用,于是利用DOM定制了一个XPath引擎,实现了Web信息抽取。该文着重介绍了原型系统的工作原理和实现中所采用的具体技术,该方法可用于Web查询和包装器的构造,也可用于格式转换。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王花;张阳;;基于XPath和XSLT的农产品信息抽取系统[J];农机化研究;2010年06期
2 庞秋奔;顾平;杨小梅;;基于分块重要性模型与Xpath的Web信息抽取的研究[J];计算机与现代化;2009年08期
3 陈奇;XSLT、XPath和DOM的应用研究[J];计算机工程;2003年03期
4 严尚维,田绪红,孙爱东,王洁桦;基于关系数据库的XML查询效率测试方法[J];计算机工程与应用;2004年02期
5 冒东奎;XML相关语言解析[J];计算机系统应用;2005年01期
6 吴铁洲,徐元中,武明虎;XML查询语句转换成SQL语句的实现[J];湖北工业大学学报;2005年01期
7 李庆江;;基于XSLT和XPath的数据转换技术[J];菏泽学院学报;2009年02期
8 张晓琳;陈向阳;路皓;;基于结构索引的XML数据流的XPath查询技术[J];计算机与信息技术;2010年06期
9 张宏,陈志刚;应用XML技术辅助.NET平台的应用系统开发[J];电脑与信息技术;2003年02期
10 徐江峰;刘晓敏;;基于交错自动机的XPath查询模型研究[J];微计算机信息;2008年15期
11 吕岩,卢奕南,曹大洲,杨佳颖,刘畅;基于XPath查询的XML技术在电子病历中的应用[J];长春理工大学学报;2004年01期
12 严海兵;;基于扩展锚文本的网页特征识别[J];苏州科技学院学报(自然科学版);2009年02期
13 许向阳,代卫宏,班鹏新;XNode:一种新的利用RDBMS来存储与检索XML的方法[J];计算机工程与应用;2004年16期
14 孟健;曹立明;王小平;姚亮;;基于XML电子病历多重签名方案的设计与实现[J];计算机工程;2006年19期
15 方优;潘荫荣;胡幼华;;基于四元索引结构和SQL语言的XPath优化方案[J];计算机应用与软件;2007年10期
16 陈鑫;;DotNET下基于XPath的信息检索[J];软件导刊;2008年07期
17 郭太飞;何洁月;;归纳学习XPATH Web信息提取规则[J];计算机技术与发展;2007年03期
18 周丹;周新志;;基于存储过程的XML和SQL Server 2000数据交换的实现[J];计算机与现代化;2009年04期
19 叶晓彤,郑宗良;基于XML的站内搜索引擎的实现研究[J];西南民族大学学报(自然科学版);2003年03期
20 谭锋;崔亮亮;;基于XPath的XML数据提取的C#实现[J];电脑知识与技术;2011年09期
中国重要会议论文全文数据库 前10条
1 邵泽才;陈立军;杨良怀;解凡;杨冬青;;EMR—基于元素匹配的XPath结构相似性计算的递归算法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
2 林大海;万常选;;带谓词XPath查询的流处理算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 廖雨果;冯建华;钱乾;李国良;塔娜;;XPath片断的包含与等价关系的判定[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
4 李东;邝子民;;XPath结构连接顺序优化[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
5 谢敏;王小锋;张新;孟小峰;周军锋;;XML数据流上的有序XPath查询处理[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
6 万常选;林大海;;基于X-RESTORE有效地处理XPath路径表达式[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
7 付艳;杨冬青;唐世渭;王腾蛟;高军;;基于XPath的Web页面自动清洗算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
8 徐林昊;杨文柱;陈少飞;郝亚南;李天柱;;基于XPath的Web信息抽取[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
9 王兰野;洪晓光;;使用DTD优化XML数据流上的XPath查询[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
10 廉成洋;毛宇光;;一种基于二叉树的HTML到XML的转换方法研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
中国博士学位论文全文数据库 前6条
1 杨红丽;XML家族语言语义研究[D];西北大学;2003年
2 金雪云;基于XQuery的增量计算程序自动生成技术研究[D];北京工业大学;2012年
3 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
4 刘逸敏;基于访问目的的隐私数据访问控制机制研究[D];复旦大学;2012年
5 胡文生;XML数据流上基于窗口的查询处理方法研究[D];武汉大学;2012年
6 王晔;垂直搜索引擎若干问题研究[D];复旦大学;2011年
中国硕士学位论文全文数据库 前10条
1 董树明;半结构化Web信息抽取技术及其应用研究[D];东南大学;2004年
2 黎立文;XPath查询模型研究[D];湖南师范大学;2010年
3 轩艳艳;基于XML的Web信息抽取研究与实现[D];武汉理工大学;2008年
4 王旭东;基于Web的信息抽取技术研究[D];西南交通大学;2008年
5 李智;XML数据流的高效XPath查询算法[D];四川大学;2004年
6 刘玲;一种通用Web信息抽取系统的研究与实现[D];西南石油大学;2007年
7 陈向阳;基于结构索引的XML数据流的XPath查询技术研究[D];内蒙古科技大学;2010年
8 狄慧;基于Agent的Web信息抽取研究[D];大连理工大学;2004年
9 梁晓翀;基于代价估算的XPath查询优化[D];华南理工大学;2012年
10 唐红光;基于XPath路径表达式的选择度估算研究[D];中南林业科技大学;2007年
中国重要报纸全文数据库 前10条
1 张欣;以Xpath优化SAN Fabric应用[N];计算机世界;2003年
2 李建忠;Yukon中的XML[N];计算机世界;2004年
3 王如;数据库与XML[N];网络世界;2002年
4 ;XML+SQL=数据库的未来?[N];网络世界;2003年
5 方正技术研究院 XML中国论坛网(WWW.xml.net.cn) 王绪胜;Xpointer语言[N];网络世界;2001年
6 易水;计算机专业时文选读(941)[N];计算机世界;2004年
7 清华大学 李骅竞 邢春晓 张志强;NXDB与XEDB殊途同归[N];计算机世界;2003年
8 朱茜;在XML层实现路由[N];中国计算机报;2004年
9 本报记者 张欣;核心在软件[N];计算机世界;2003年
10 李安渝、朱亮;Native XML数据库技术 打破传统数据库独霸格局[N];中国计算机报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978