收藏本站
《计算机与数字工程》 2007年06期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于XML的Web信息抽取方法

陈佳  胡燕  轩艳艳  
【摘要】:利用标准的XML技术来解决信息抽取问题,提出一个基于XML技术的Web信息抽取平台。通过归纳学习算法,寻找和识别出感兴趣的数据。利用XSLT和Xpath技术在数据定位和转换方面的优势,解决信息抽取中的关键问题:编写抽取规则。并对抽取规则进行优化,使其更加简单、健壮和通用。

【引证文献】
中国期刊全文数据库 前4条
1 黄淑芹;;基于XML的WEB数据抽取模型研究[J];通化师范学院学报;2012年02期
2 翟东升;刘晨;欧阳轶慧;;专利信息获取分析系统设计与实现[J];现代图书情报技术;2009年05期
3 李青伟;逄焕利;李艳波;;数据抽取在征信系统中的应用[J];科技创新导报;2009年01期
4 李青伟;逄焕利;李艳波;;数据抽取在征信系统中的应用[J];科技创新导报;2009年02期
中国硕士学位论文全文数据库 前3条
1 范春晓;基于XML的Web信息抽取技术研究[D];沈阳理工大学;2010年
2 黄新强;基于IP和CATV双网融合的视频点播系统设计与实现[D];中国科学院研究生院;2007年
3 杨宝春;基于类目的电子商务导航系统设计与实现[D];南京邮电大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 唐培丽;解飞;陈志雨;;基于概念检索的中文搜索引擎研究[J];长春大学学报;2006年04期
2 王晓;沈健;周宏;;一种数字电视VOD回传系统的安全解决方案[J];重庆工学院学报(自然科学版);2007年04期
3 刘剑;王兰成;;基于概念检索的数字档案馆馆内搜索引擎的设计与实现[J];档案与建设;2008年05期
4 李红宇;;分布式计算技术探讨[J];电脑开发与应用;2007年08期
5 王丽;唐建雄;;基于DOM和网页模板的Web信息抽取[J];电脑知识与技术(学术交流);2007年18期
6 周志,王贻良;DVB数据广播标准及实现[J];电视技术;2000年05期
7 何敏,李新春,刘建辉;有线电视视频点播系统中的信道分配[J];电视技术;2001年01期
8 张玉清,蔡安妮,孙景鳌;基于HFC和IP网的VOD系统的设计与实现[J];电视技术;2001年05期
9 杨伏华,孙谦,李广侠;数据增值业务在DVB中的实现[J];电视技术;2002年02期
10 毛小成,刘卫忠,徐重阳;数据广播接收卡驱动程序设计[J];电视技术;2002年04期
中国博士学位论文全文数据库 前1条
1 金燕;WWW信息导航机制研究[D];武汉大学;2005年
中国硕士学位论文全文数据库 前10条
1 韩立奇;网站导航代价量化与测试算法研究[D];大连理工大学;2006年
2 王思力;面向大规模信息检索的中文分词技术研究[D];中国科学院研究生院(计算技术研究所);2006年
3 韩慧俊;电子商务个性化推荐系统的研究[D];上海交通大学;2007年
4 陈佳;基于XML的Web信息抽取技术的应用研究[D];武汉理工大学;2007年
5 周翔;基于XML的Web内容挖掘研究[D];重庆大学;2007年
6 冯礼;基于事件框架的突发事件信息抽取[D];上海交通大学;2008年
7 任仲晟;基于树形结构的Web信息抽取技术研究[D];厦门大学;2007年
8 陈川波;基于半结构化文本信息抽取的简历识别系统[D];北京邮电大学;2008年
9 许雁鸣;博客资源的爬取与检索[D];山东大学;2008年
10 张胜岭;导航结构对B2C电子商务网站可用性影响的实证研究[D];华中科技大学;2008年
【二级引证文献】
中国期刊全文数据库 前4条
1 卞继方;韩雷;;基于.NET的专利信息管理系统的设计与实现[J];电子设计工程;2011年12期
2 乔玉珍;;基于有线电视网络平台视频点播技术的实现[J];硅谷;2012年01期
3 马超;叶祺;吴斌;石川;佘影;;基于动态链接分析的网络可视化分析平台的设计与实现[J];现代图书情报技术;2010年06期
4 吴红;李玉平;胡泽文;;基于领域本体的专利信息检索系统研究与实现[J];现代图书情报技术;2010年06期
中国硕士学位论文全文数据库 前4条
1 马超;基于云计算的海量旅行数据分析[D];北京邮电大学;2011年
2 尹新强;企业专利信息利用实证研究[D];湘潭大学;2011年
3 王艳领;专利等级划分方法的研究与实现[D];河北工业大学;2011年
4 乜丽丽;基于专利分析的技术成熟度预测方法研究与实现[D];河北工业大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 徐征骏,叶文川;基于XML的信息发布技术在WAP上的应用[J];计算机工程;2000年S1期
2 王欢;用XML开发web应用软件[J];微型电脑应用;2001年09期
3 魏应彬,张树亮;由ASP动态生成XML文档[J];福建电脑;2002年04期
4 李俊,包亮,吴海涛,荣国平,潘金贵;基于Java的多功能XML工作引擎[J];计算机应用与软件;2003年03期
5 史小烈;基于XML的报表应用[J];工业控制计算机;2003年05期
6 李琳;浅谈XML及其在Microsoft Office中的应用[J];衡阳师范学院学报;2003年03期
7 严玉,吕强;一个基于JSP和XML技术的业务管理系统[J];苏州大学学报(自然科学版);2002年04期
8 赵立志,海桦,张永胜,王玉凤;XML及其在网络教育中应用的研究[J];山东师范大学学报(自然科学版);2003年02期
9 李文果,李勇;基于XSL技术SVG图像的更新[J];计算机与现代化;2004年08期
10 雷刚跃;任胜兵;;基于XML的数据集成研究[J];中国科技信息;2005年23期
中国重要会议论文全文数据库 前10条
1 陈婷;周家纪;杨宁;;基于VRML-AJAX的分布式虚拟现实应用[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
2 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 何震瀛;李建中;王宏志;;XML数据的关系存储[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
4 丁峰;王煜;姚延涛;沈钧毅;;从XML模式到数据库模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
5 谈子敬;施伯乐;;XML导出数据库表的实现与应用[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 罗道峰;孟小峰;;一种面向XML文档的基于角色的扩展访问控制方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 郑骏;王焱;钱卫宁;周傲英;;XML相似相关结构库的构造及其应用[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 吴刚;于亚新;王国仁;于戈;;并行XML文档数据分片技术研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
9 王静;孟小峰;王珊;;以目标节点为导向的XML路径查询处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
10 王鹏飞;洪晓光;;基于XML大文档的动态索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
中国重要报纸全文数据库 前10条
1 秦林;《XML完全探索》[N];中华读书报;2001年
2 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
3 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年
4 ;分化并不能阻止XML发展[N];中国计算机报;2000年
5 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年
6 ;为XML标准定标准[N];中国计算机报;2001年
7 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年
8 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年
9 彭芳;搜索也专业[N];中国计算机报;2004年
10 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
中国博士学位论文全文数据库 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
4 叶晓峰;基于XML的冲压模具设计知识重用技术研究[D];华中科技大学;2010年
5 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
6 张晨静;XML关键字过滤技术[D];复旦大学;2011年
7 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
8 汪源;XML事务模型及并发控制研究[D];浙江大学;2006年
9 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
10 许建军;对结构化和半结构化数据的关键字搜索研究[D];复旦大学;2007年
中国硕士学位论文全文数据库 前10条
1 火善栋;基于XML的Deep Web信息抽取系统的研究与初步实现[D];昆明理工大学;2006年
2 宋艳娟;基于XML的HTML和PDF信息抽取技术的研究[D];福州大学;2006年
3 刘洋;Web教学资源抽取技术及其应用研究[D];东北师范大学;2007年
4 余淼;主题搜索引擎的信息抽取和索引的研究[D];重庆大学;2007年
5 朱南丽;基于DOM的网页主体信息块抽取[D];昆明理工大学;2006年
6 史西兵;基于XML的Web信息抽取技术研究[D];西北大学;2008年
7 任军;基于网页结构特征的垂直搜索引擎研究与实现[D];上海交通大学;2008年
8 田宇;基于XML的WEB信息抽取系统研究与实现[D];内蒙古大学;2011年
9 卢睿;基于XML的Web信息抽取研究[D];大连海事大学;2005年
10 张宏丽;基于XML/XSL与设备无关Web服务的研究[D];内蒙古大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026