收藏本站
《江西师范大学学报(自然科学版)》 2008年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于XPath的广告数据提取研究

何章鸿  董守斌  
【摘要】:针对广告抽取系统的实际需求,该文提出了利用XPath规则从包含多个广告的页面中抽取广告记录数据的方法.该文主要阐述了广告抽取系统核心模块的实现机制和系统架构.实验结果表明,该方法能够准确定位页面广告数据块,并且能较好提取块内广告记录信息,具有一定的实用价值.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 董旻;方曙;杨志萍;;使用JTree和XPath构建动态网页信息抽取系统[J];情报杂志;2007年06期
2 支宗良;陈少飞;;一种基于XQuery的优化Web信息抽取方法[J];计算机应用;2008年01期
3 刘云峰;;一种基于标签路径聚类的文本信息抽取算法[J];计算机应用与软件;2010年11期
4 杨文柱,徐林昊,陈少飞,郝亚南,李天柱;基于XPath的Web信息抽取的设计与实现[J];计算机工程;2003年16期
5 张彦超;刘云;李勇;沈波;;基于自动生成模板的Web信息抽取技术[J];北京交通大学学报;2009年05期
6 谭锋;崔亮亮;;基于XPath的XML数据提取的C#实现[J];电脑知识与技术;2011年09期
7 陈奇;XSLT、XPath和DOM的应用研究[J];计算机工程;2003年03期
8 胡少荣;孟嗣仪;刘云;张彦超;丁飞;;网页信息自动抽取技术的研究[J];铁路计算机应用;2010年09期
9 严尚维,田绪红,孙爱东,王洁桦;基于关系数据库的XML查询效率测试方法[J];计算机工程与应用;2004年02期
10 冒东奎;XML相关语言解析[J];计算机系统应用;2005年01期
11 吴铁洲,徐元中,武明虎;XML查询语句转换成SQL语句的实现[J];湖北工业大学学报;2005年01期
12 陆科进,李新颖;基于Ontology的文本信息抽取[J];计算机应用研究;2003年07期
13 李向阳;苗壮;肖江;;无结构文本信息抽取综述[J];军事通信技术;2004年02期
14 贺令亚;柳佳刚;;基于Web的包装器技术的现状与发展[J];电脑开发与应用;2007年06期
15 张春明;;Web挖掘技术研究[J];廊坊师范学院学报(自然科学版);2008年05期
16 张岩;;基于本体的信息抽取技术研究[J];科技信息(学术研究);2008年36期
17 邹荣;;对垂直搜索技术的分析[J];福建电脑;2009年02期
18 吴芳;郑君;刘金亮;宗克玄;;基于GATE框架的中文信息抽取技术的研究[J];电脑知识与技术;2009年24期
19 于薇;;包装器的自动生成方法介绍[J];才智;2009年28期
20 张涛;胡正华;夏明星;;远洋运输业业务邮件信息抽取系统的设计及实现[J];电脑知识与技术;2010年01期
中国重要会议论文全文数据库 前10条
1 徐林昊;杨文柱;陈少飞;郝亚南;李天柱;;基于XPath的Web信息抽取[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 邵泽才;陈立军;杨良怀;解凡;杨冬青;;EMR—基于元素匹配的XPath结构相似性计算的递归算法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
3 林大海;万常选;;带谓词XPath查询的流处理算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
5 廖雨果;冯建华;钱乾;李国良;塔娜;;XPath片断的包含与等价关系的判定[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
6 李东;邝子民;;XPath结构连接顺序优化[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
7 谢敏;王小锋;张新;孟小峰;周军锋;;XML数据流上的有序XPath查询处理[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
8 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
9 万常选;林大海;;基于X-RESTORE有效地处理XPath路径表达式[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
10 付艳;杨冬青;唐世渭;王腾蛟;高军;;基于XPath的Web页面自动清洗算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
中国重要报纸全文数据库 前10条
1 张欣;以Xpath优化SAN Fabric应用[N];计算机世界;2003年
2 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
3 李建忠;Yukon中的XML[N];计算机世界;2004年
4 彭芳;搜索也专业[N];中国计算机报;2004年
5 ;XML+SQL=数据库的未来?[N];网络世界;2003年
6 王如;数据库与XML[N];网络世界;2002年
7 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
8 方正技术研究院 XML中国论坛网(WWW.xml.net.cn) 王绪胜;Xpointer语言[N];网络世界;2001年
9 易水;计算机专业时文选读(941)[N];计算机世界;2004年
10 清华大学 李骅竞 邢春晓 张志强;NXDB与XEDB殊途同归[N];计算机世界;2003年
中国博士学位论文全文数据库 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
4 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
5 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
6 杨红丽;XML家族语言语义研究[D];西北大学;2003年
7 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
8 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
9 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
10 滕伟;面向Web信息集成的Web信息抽取中若干关键问题的研究[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年
2 王花;Web信息抽取技术研究[D];西北农林科技大学;2010年
3 田宇;基于XML的WEB信息抽取系统研究与实现[D];内蒙古大学;2011年
4 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
5 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
6 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
7 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
8 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
9 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
10 杨秀丽;基于网页内容分析的Web信息抽取技术及其应用[D];河北科技大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978