收藏本站
《电脑编程技巧与维护》 2009年15期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于Boost.Regex的网页信息抽取

吴鹏飞  马凤娟  
【摘要】:正则表达式是一种用于字符串模式匹配和替换的强有力工具。介绍了在VC++中如何配置Boost.Regex,实现基于正则表达式网页信息抽取类CHtmlcodeIE,从而完成了网页信息高效抽取。
【分类号】:TP393.092

【引证文献】
中国期刊全文数据库 前1条
1 胡军伟;秦奕青;张伟;;正则表达式在Web信息抽取中的应用[J];北京信息科技大学学报(自然科学版);2011年06期
【参考文献】
中国期刊全文数据库 前3条
1 曹光琦;;Boost.Regex——C++正则表达式快速入门[J];程序员;2004年04期
2 程冲,黄水清;利用正则表达式解析新闻网页的算法研究[J];农业图书情报学刊;2005年04期
3 杜冬梅;许彩欣;苏健;;浅谈正则表达式在web系统中的应用[J];计算机系统应用;2007年08期
【共引文献】
中国期刊全文数据库 前10条
1 王成;杨建华;蒋光伟;;正则表达式在测量数据处理中的应用[J];测绘科学;2011年02期
2 丁浩;李跃华;;广告审查系统中绝对化词语自动审查的实现[J];电脑知识与技术;2009年28期
3 孙乐;方自金;;基于互联网的信息采集系统的设计与实现[J];河北大学成人教育学院学报;2010年04期
4 白琳;;正则表达式在动态网页开发中的应用[J];湖南科技学院学报;2009年04期
5 李宏伟;史培中;张素智;;一种可行的Web数据抽取包装器的设计方法[J];计算机应用与软件;2009年03期
6 孟莉;;基于TRS论文提交管理系统的优化研究[J];农业图书情报学刊;2011年06期
7 谷俊;;基于互联网的信息采集系统的设计与实现[J];情报探索;2008年12期
8 陈艳军;;利用正则表达式开发动态网页[J];数字技术与应用;2010年02期
9 李宏伟;史培中;张素智;;一种高效Web数据抽取包装器的设计与实现[J];计算机技术与发展;2009年02期
10 赵仁杰;李众立;;网页清洗系统基于静态正则表达式的实现[J];微计算机信息;2007年36期
中国重要会议论文全文数据库 前1条
1 王春元;张韬;;一种获取网页主要中文信息的方法[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
中国博士学位论文全文数据库 前1条
1 王春元;公共网络信息系统安全管理的研究[D];合肥工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 田鹤楠;质检总局舆情监控系统中信息抽取的研究[D];北京邮电大学;2011年
2 任剑洪;基于Web的网络智能教学系统设计与实现[D];华南理工大学;2011年
3 张维华;基于聚类的中文元搜索引擎技术研究[D];南京邮电大学;2011年
4 史国强;基于RBF神经网络的网页分类技术研究[D];中国石油大学;2011年
5 汪光庆;基于SVM的网页分类技术研究[D];中国石油大学;2011年
6 何丹丹;社交网络视频分享测量平台的设计与实现[D];华中科技大学;2011年
7 连璐;WEB主题信息采集系统的设计与实现[D];电子科技大学;2011年
8 刘磊;基于文本过滤的校友信息搜索系统实现[D];上海交通大学;2007年
9 #4,;XML压缩技术的研究与应用[D];华中科技大学;2006年
10 程兆辉;基于开源框架开发Web应用的研究与实现[D];西安建筑科技大学;2008年
【同被引文献】
中国期刊全文数据库 前4条
1 崔继馨,张鹏,杨文柱;基于DOM的Web信息抽取[J];河北农业大学学报;2005年03期
2 张静;张妍;;正则表达式及其在信息抽取中的应用[J];电脑知识与技术;2009年15期
3 杨文柱,徐林昊,陈少飞,郝亚南,李天柱;基于XPath的Web信息抽取的设计与实现[J];计算机工程;2003年16期
4 蒲筱哥;;基于Web的信息抽取技术研究综述[J];现代情报;2007年10期
中国硕士学位论文全文数据库 前1条
1 轩艳艳;基于XML的Web信息抽取研究与实现[D];武汉理工大学;2008年
【二级引证文献】
中国期刊全文数据库 前3条
1 汪材印;;正则表达式在网络蜘蛛抽取问答系统信息中的应用[J];宿州学院学报;2012年05期
2 李良杰;牟永敏;张志华;;面向嵌入式系统函数动态调用路径拆分与匹配[J];数据通信;2012年04期
3 程元斌;;正则表达式的动态集合扩展与实现[J];计算机系统应用;2012年10期
中国硕士学位论文全文数据库 前1条
1 梅泽勇;图书网站信息集成系统的构建[D];郑州大学;2012年
【二级参考文献】
中国期刊全文数据库 前2条
1 闫宏飞,李晓明;关于中国Web的大小、形状和结构[J];计算机研究与发展;2002年08期
2 周源远,王继成,郑刚,张福炎;Web页面清洗技术的研究与实现[J];计算机工程;2002年09期
【相似文献】
中国期刊全文数据库 前10条
1 李丽莉;李娅;周琪云;;正则表达式在网络信息监控分析系统中的应用[J];信息技术;2008年04期
2 顾潇华;郭军城;;网页超链抓取及自动分类技术实现[J];河北大学学报(自然科学版);2007年01期
3 熊洛;王志;;基于Applet的网页分析技术[J];现代计算机(专业版);2010年10期
4 陈立娜;;面向制造业的主动搜索平台的研究与实现[J];现代计算机(专业版);2009年02期
5 范新龙;张华;;探讨编程管理网络设备[J];电脑编程技巧与维护;2010年20期
6 张文典;LAG—一个词法分析程序的生成程序[J];小型微型计算机系统;1985年08期
7 Gary Chan;Java咖啡馆(9)——一个压缩归档实用软件[J];电脑爱好者;2004年19期
8 施佺;王恒山;肖仰华;丁卫平;;面向主题的垂直搜索引擎系统的研究与实现[J];微电子学与计算机;2011年07期
9 张太芳;;基于正则表达式技术的数据验证及应用[J];甘肃科技纵横;2006年04期
10 项润华;段红勇;柳汉雄;;正则表达式的使用以及在VC6.0的应用[J];洛阳工业高等专科学校学报;2006年05期
中国重要会议论文全文数据库 前10条
1 韩近强;赵静;杨冬青;唐世渭;姚小波;;基于领域知识的网页筛选系统[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 王辉;丁明君;杨进;;正则表达式在企业信息管理开发中的应用[A];2010年MIS/S&A学术交流会议论文集(中国造船工程学会学术论文集)[C];2010年
3 王晓峰;刘惟一;;从用户需求到网页集团的模糊变换[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 吴倩;杨逍;张兆心;;基于视觉特征的网页信息提取[A];第六届全国信息检索学术会议论文集[C];2010年
5 罗阳;季铎;张桂平;王莹莹;;面向单一网页的双语资源挖掘方法[A];第六届全国信息检索学术会议论文集[C];2010年
6 曾雨薇;许向众;;基于正则表达式的税源数据解析方案的研究[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
7 张贯虹;乌达巴拉;巩政;;基于向量空间模型的网页文本句子对齐方法研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 梁兴开;赵泽茂;黄亮;;Web应用中的ReDoS检测方法研究[A];浙江省电子学会2011学术年会论文集[C];2011年
9 李佳;魏更宇;胡楠;王枞;杨义先;;基于特征自生成的畸形SIP信令检测算法[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(下册)[C];2010年
10 袁真;;构造正则表达式的几种NFA算法的分析和比较[A];2006年全国理论计算机科学学术年会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 壮壮;批量保存网页信息[N];电脑报;2004年
2 彭福祥 张钧;ASP.NET基本数值处理技巧[N];计算机世界;2006年
3 ;在论坛中自动显示超链接[N];计算机世界;2006年
4 东方早报记者 李伟;要名还是要利,这是个问题[N];东方早报;2011年
5 金山软件副总裁 杨桓;着力“三大系统” 构筑网络安全屏障[N];中国电子报;2009年
6 清水编译;Apache 2.2.0带来了什么?[N];计算机世界;2006年
7 郭京霞;枫叶之都状告百度恶意排名一审败诉[N];中国知识产权报;2007年
8 路人甲;请个专家来贴图[N];电脑报;2005年
9 夏凌;搜索引擎排名纠纷百度胜出[N];中华工商时报;2007年
10 钱鹏;网尽Web页中的好东东[N];电脑报;2004年
中国博士学位论文全文数据库 前10条
1 焦斌星;用于搜索的网页可视化摘要技术研究[D];中国科学技术大学;2012年
2 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
3 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
4 陈曙晖;基于内容分析的高速网络协议识别技术研究[D];国防科学技术大学;2007年
5 胡圣明;基于内存自动机与模式的动态引擎构造技术研究[D];西安电子科技大学;2009年
6 徐建国;网络化制造系统中虚拟加工若干关键技术研究[D];南京理工大学;2007年
7 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
8 刘守群;海量网络视频快速检索关键技术研究[D];中国科学技术大学;2010年
9 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年
10 段瑞雪;基于依存关系的用户意图的研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 于洪波;中文网页自动采集与分类系统设计与实现[D];北京邮电大学;2010年
2 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
3 张航;主题爬虫的实现及其关键技术研究[D];武汉理工大学;2010年
4 冯明远;深度网络信息爬取关键技术研究与实现[D];浙江大学;2010年
5 邓科;智能搜索中的中文网页分类研究[D];兰州理工大学;2011年
6 党春辉;网页消重和聚类算法在高校搜索引擎中的研究与应用[D];东华大学;2010年
7 马伟瑜;基于改进的PageRank的网页信息可信度评估方法研究[D];河北大学;2011年
8 任斌;基于本体的主动学习主题爬行的研究与实现[D];吉林大学;2010年
9 张志安;WEB主题信息采集系统的设计与实现[D];电子科技大学;2009年
10 任兰鹏;基于代表样本的中文网页分类研究[D];山东大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026