收藏本站
《江西师范大学学报(自然科学版)》 2013年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于组合验证的Web页面抽取算法研究

耿耘  蒋严冰  郭岩  刘悦  余钧  程学旗  
【摘要】:通过研究抽取算法的本质和抽取算法之间的关系,对抽取算法的互补性进行分析,提出了一种多算法组合验证机制,该机制能检测出抽取算法的错误,并通过结合动态阈值调整的方法,提高抽取算法的抽取准确率.
【作者单位】北京大学软件与微电子学院;中国科学院计算技术研究所;
【分类号】:TP393.092

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 于薇;;包装器的自动生成方法介绍[J];才智;2009年28期
2 祝伟华;卢熠;刘斌斌;;基于HMM的Web信息抽取算法的研究与应用[J];计算机科学;2010年02期
3 王立建;尹四清;;基于Web页面有效信息抽取的分类方法[J];电脑开发与应用;2010年06期
4 仲华;崔志明;;基于XML的信息抽取和多层向量空间技术研究[J];计算机技术与发展;2007年07期
5 耿焕同;宋庆席;何宏强;;一种基于视觉分块的Web信息抽取方法研究[J];情报理论与实践;2009年03期
6 钟艳花,余伟红,余永权;Web文本挖掘系统及其关键技术研究[J];计算机工程与应用;2003年34期
7 王胜,朱明;基于最大熵马尔可夫模型的地址信息抽取[J];计算机工程与应用;2005年21期
8 苗颖;;Web页面信息自主抽取技术的研究[J];中国科技信息;2007年23期
9 彭文滔;叶飞跃;李霞;员红娟;;信息抽取中基于DOM树的过滤器方法的研究[J];微计算机信息;2008年30期
10 韩普;王泽;;基于重复模式的论坛信息抽取研究[J];南京师范大学学报(工程技术版);2010年03期
中国重要会议论文全文数据库 前10条
1 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
2 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
3 徐云风;蒋文蓉;;Web页面信息抽取的分析与研究[A];IT服务促进企业信息化——第十一届中国Java技术及应用交流大会文集[C];2008年
4 王海燕;谷明哲;王静;孟小峰;;基于预定义模式的Web信息抽取[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 陈少飞;郝亚南;李天柱;张志强;张波;;Web信息抽取规则的优化[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
6 杨高峰;杨岳湘;;基于RSS的个性化科技信息聚合门户的设计与实现[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
7 陈滢;张宜红;王能斌;;Web视图技术研究[A];第十六届全国数据库学术会议论文集[C];1999年
8 陈佳;王腾蛟;;基于相关实例的异构网页提取模式的自动发现[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
9 周春姐;孟小峰;文洁;;Flickr中的复合事件检测[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
10 梁勇;张文;;网络舆情采集系统的设计[A];2011年全国通信安全学术会议论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
2 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
3 何召卫;受限本体相似[D];北京邮电大学;2008年
4 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年
5 方巍;基于本体的Deep Web信息集成关键技术研究[D];苏州大学;2009年
6 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
7 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年
8 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
9 赵旭剑;中文新闻话题动态演化及其关键技术研究[D];中国科学技术大学;2012年
10 费玉莲;面向电子商务的谈判支持系统研究[D];浙江工商大学;2011年
中国硕士学位论文全文数据库 前10条
1 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
2 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
3 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
4 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年
5 王花;Web信息抽取技术研究[D];西北农林科技大学;2010年
6 杨秀丽;基于网页内容分析的Web信息抽取技术及其应用[D];河北科技大学;2010年
7 蒋伟华;搜索引擎中的信息抽取技术研究[D];湖南大学;2001年
8 张绍华;基于实例的Web信息抽取[D];河北大学;2001年
9 朱道辉;基于条件随机域的Web信息抽取研究[D];南华大学;2010年
10 全福亮;面向精确Web信息抽取的自动数据记录分析和识别技术研究[D];南京大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026