收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于多学习策略的网页信息抽取方法

朱明  李香  郑烇  
【摘要】:由于网页信息具有异构和动态的特点,致使现有的大多数网页信息抽取方法都存在适用性差的问题。为此,将传统的文本分类器和隐式马尔可夫学习策略结合起来,提出了一种基于多学习策略的网页信息抽取方法。该方法在获得网页文本记录的局部最优分类抽取结果基础上,还利用了整个网页文本结构信息对抽取结果进行进一步优化。实验结果表明,该方法不需要对新的站点进行学习,就能获得较高的信息召回率和抽取精度,具有较强的适用性。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 何召卫;陈俊亮;;基于本体关系匹配的信息抽取[J];计算机工程;2007年21期
2 史西兵;王浩鸣;;隐马尔可夫模型解决信息抽取问题的仿真研究[J];计算机仿真;2010年05期
3 邓健爽;郑启伦;彭宏;林旭东;;基于关键词聚类和节点距离的网页信息抽取[J];计算机科学;2007年04期
4 周法国;王映龙;杨炳儒;宋泽锋;;非结构化信息抽取关键技术研究探讨[J];计算机工程与应用;2009年14期
5 朱青;吕晓旭;;基于机器学习的HTML标题抽取[J];微计算机信息;2010年09期
6 祝伟华;卢熠;刘斌斌;;基于HMM的Web信息抽取算法的研究与应用[J];计算机科学;2010年02期
7 张煜斌;陆建峰;李文林;陈涤平;;基于Meta-Bootstrapping的中医医案结构化研究[J];微电子学与计算机;2009年10期
8 洪娜;张智雄;刘建华;;基于Ontology的信息抽取技术方法分析[J];情报理论与实践;2009年02期
9 黄红华,俞勇;CW IWSK——从半结构化中抽取信息的归纳规则方法[J];上海交通大学学报;2003年03期
10 赵琦;刘建华;冯浩然;;从ACE会议看信息抽取技术的发展趋势[J];现代图书情报技术;2008年03期
11 张智雄;吴振新;刘建华;徐健;洪娜;赵琦;;当前知识抽取的主要技术方法解析[J];现代图书情报技术;2008年08期
12 徐健;张智雄;吴振新;;实体关系抽取的技术方法综述[J];现代图书情报技术;2008年08期
13 游贵荣;陆玉昌;;基于统计和机器学习的中文Web网页正文内容抽取[J];福建商业高等专科学校学报;2009年02期
14 方莹,葛寒松;基于聚类的分级信息抽取方法初探[J];电脑知识与技术;2005年30期
15 周俊生;戴新宇;尹存燕;陈家骏;;自然语言信息抽取中的机器学习方法研究[J];计算机科学;2005年03期
16 陈慧炜;;公安领域案件文本信息抽取研究综述[J];文教资料;2010年18期
17 周雪忠;吴朝晖;;文本知识发现:基于信息抽取的文本挖掘[J];计算机科学;2003年01期
18 金明;杨欢欢;单广荣;;藏语命名实体识别研究[J];西北民族大学学报(自然科学版);2010年03期
19 黄丽琼;何中市;;基于统计语义和结构特征的自动文摘[J];广西师范大学学报(自然科学版);2006年04期
20 马涛;姜晓菊;庞丽丽;韩志强;;信息抽取技术与网络情报资源快速获取[J];情报学报;2006年S1期
中国重要会议论文全文数据库 前10条
1 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
3 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 谢世朋;胡茂林;;基于局部仿射区域对稀疏纹理分类的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
5 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
6 张郴;;基于神经网络集成的旅游需求预测模型[A];中国地理学会百年庆典学术论文摘要集[C];2009年
7 吴宪祥;于培松;万旻;倪伟;郭宝龙;;RoboCup中智能体的参数优化和学习[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
8 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
9 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
10 杨磊;黎志成;胡斌;;基于人工神经网络的调度规则确定专家系统[A];第七届计算机模拟与信息技术学术会议论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 何斌;基于可拓逻辑的机器学习理论与方法[D];华南理工大学;2005年
2 王国胜;支持向量机的理论与算法研究[D];北京邮电大学;2008年
3 胡崇海;基于图的半监督机器学习[D];浙江大学;2008年
4 刘长安;基于实例归纳的工艺规划方法及集成CAPP系统研究[D];山东大学;2003年
5 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
6 钟志;基于异常行为辨识的智能监控技术研究[D];上海交通大学;2008年
7 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
8 徐海祥;基于支持向量机方法的图像分割与目标分类[D];华中科技大学;2005年
9 牛晓太;多模式智能谈判支持系统的理论与方法研究[D];武汉大学;2004年
10 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨永贵;中文信息抽取关键技术研究与实现[D];北京邮电大学;2008年
2 樊聪;利用web抽取双语翻译对的研究与实现[D];重庆大学;2007年
3 许晖;关键词抽取和结构化列表包装的方法研究[D];清华大学;2005年
4 刘斌斌;基于HMM模型的Web信息抽取方法的研究与改进[D];重庆大学;2008年
5 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
6 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
7 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
8 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
9 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年
10 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
中国重要报纸全文数据库 前10条
1 黎骊/文 [美] Tom M.Mitchell 著;机器学习与智能化社会[N];中国邮政报;2003年
2 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年
3 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
4 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
5 本报记者 张晔通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
6 记者 何边;网络化激活人工智能[N];计算机世界;2001年
7 彭芳;搜索也专业[N];中国计算机报;2004年
8 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
9 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
10 傅秋瑛;默默耕耘数十载 自主创新结硕果[N];科技日报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978