收藏本站
《信息记录材料》 2019年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

面向深网网页的信息抽取算法研究

李丹  
【摘要】:海量结构化数据隐藏在深网中(Deep Web),对有价值的深网数据抽取研究变得十分重要。提出一种面向深网网页的信息抽取算法,创新性引入序列比对算法进行页面噪声去除,实验结果表明抽取效率和准确率大幅提升,同时具有较好的召回率和查准率。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 邓松;万常选;吁亮;刘德喜;雷刚;王映龙;;非合作结构化深网数据源摘要的动态更新[J];微电子学与计算机;2014年04期
中国硕士学位论文全文数据库 前1条
1 张策;基于web的改进信息抽取算法的设计与实现[D];电子科技大学;2014年
【共引文献】
中国硕士学位论文全文数据库 前1条
1 崔琳爽;煤化工领域数据抽取及可视化应用[D];北京林业大学;2016年
【二级参考文献】
中国期刊全文数据库 前2条
1 万常选;邓松;刘喜平;廖国琼;刘德喜;江腾蛟;;Web数据源选择技术[J];软件学报;2013年04期
2 范举;周立柱;;基于关键词的深度万维网数据库选择[J];计算机学报;2011年10期
中国硕士学位论文全文数据库 前3条
1 孟庆祥;基于XML元素处理的Web信息抽取研究与实现[D];北京交通大学;2009年
2 张净;Web信息自动抽取技术的研究与实现[D];武汉理工大学;2009年
3 任仲晟;基于树形结构的Web信息抽取技术研究[D];厦门大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 李丹;;面向深网网页的信息抽取算法研究[J];信息记录材料;2019年01期
2 王加楠;鲁强;;基于模式的远监督关系抽取算法[J];中文信息学报;2017年04期
3 陆爱东;;非重复随机数抽取算法研究[J];福建电脑;2012年06期
4 张庆军;徐德智;陈建二;;基于推理的本体映射抽取算法及修正[J];计算机科学;2009年05期
5 李满荣;赵宏安;董文静;耿国华;周明全;;基于优先权过滤的自动摘要抽取算法[J];西北大学学报(自然科学版);2017年03期
6 胡志敏;;基于综合权重的多文档关键词抽取算法[J];计算机与数字工程;2010年06期
7 高阳,陆鑫,李宁,陈世福;一种自适应概率规划规则抽取算法[J];南京大学学报(自然科学版);2003年02期
8 周南,崔屹;基于数学形态学的骨架抽取算法[J];计算机工程与应用;1997年05期
9 吴琴霞;高峰;刘永革;;基于上下文语义的甲骨文领域概念抽取算法的研究[J];科学技术与工程;2014年26期
10 彭绪富;;基于窗口的随机数抽取算法研究[J];计算机工程与设计;2007年03期
中国重要会议论文全文数据库 前10条
1 穆亚东;周秉锋;;基于信念传播的图像抽取算法[A];中国感光学会第七次全国会员代表大会暨学术年会和第七届青年学术交流会论文摘要集[C];2006年
2 周毅;;基于逻辑行列切分树的表格数据抽取算法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
3 胡佳妮;郭军;徐蔚然;;一种基于短文本的独立语义特征抽取算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
4 王盛;吴长刚;孙慰迟;;带约束星形序列比对复杂性的研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
5 唐超;刘辰;杨正球;;使用多层迭代分析和分类网页文档的方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
6 吴月红;;科技期刊网页的制作[A];学报编辑论丛(第十集)[C];2002年
7 彭渊;赵铁军;郑德权;于浩;;基于特征句抽取的网页去重研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 罗勇;周超;许超;;文本分类在商品广告分类中的应用[A];全国第五届信号和智能信息处理与应用学术会议专刊(第一册)[C];2011年
9 林政;吕雅娟;刘群;马希荣;;基于双语混和网页的平行语料挖掘[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 熊德兰;鄢靖丰;陈静;;基于论坛主题的网页褒贬倾向性识别[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 北京 徐楠;渐变效果让你的网页更炫[N];电脑报;2002年
2 福建 陈旭波;网页图片切割能手[N];电脑报;2002年
3 天津 武茂芹;轻松实现网页特效[N];电脑报;2003年
4 柏章兰;都匀市“万村千乡”网页建设工作实现乡村全覆盖[N];黔南日报;2011年
5 贞;网页特效与瘦身专家[N];中国电脑教育报;2002年
6 吴仁耀;用Visio制作特殊网页[N];中国电脑教育报;2004年
7 江苏 许向前;把网页特效移到Authorware中[N];电脑报;2003年
8 刘夫之;自己制作网页特效软件[N];中国电脑教育报;2003年
9 世纪鸟作坊 何勇平;网页图像效果[N];电脑报;2001年
10 河北 霍林涛;用ADG Panorama Tools创建网页3D图像[N];电脑报;2002年
中国博士学位论文全文数据库 前6条
1 张春云;实体关系抽取算法研究[D];北京邮电大学;2015年
2 唐玉荣;生物信息学中的序列比对算法研究[D];中国农业大学;2004年
3 李玉岗;生物大分子序列比对和蛋白质结构分类算法[D];中国科学院研究生院(计算技术研究所);2004年
4 姜子恒;特征构建算法及其在图像语义标注与信息抽取中的应用研究[D];北京理工大学;2015年
5 陈洁;基于概念融合的网页筛选技术研究[D];北京邮电大学;2013年
6 穆一夫;基于认知的非结构化信息抽取关键技术与算法研究[D];中国矿业大学(北京);2013年
中国硕士学位论文全文数据库 前10条
1 杜晓东;基于深度网络的药物关系抽取算法研究[D];西北大学;2018年
2 李智超;图文知识图谱中的关系抽取算法研究[D];北京邮电大学;2018年
3 张策;基于web的改进信息抽取算法的设计与实现[D];电子科技大学;2014年
4 丁溪源;基于大规模语料的中文新词抽取算法的设计与实现[D];南京理工大学;2011年
5 赵永平;基于改进随机抽取算法的信息论题库和智能组卷系统的设计与实现[D];中国地质大学(北京);2015年
6 邓昱;中文问答系统中的答案抽取算法研究[D];北京邮电大学;2009年
7 皮珊;Web信息抽取系统的设计与实现[D];浙江工业大学;2013年
8 李丹;基于序列比对的动态Web信息抽取算法研究[D];吉林大学;2009年
9 丁乔毅;Web信息抽取系统的设计与实现[D];哈尔滨工业大学;2012年
10 张鹏;中文意见挖掘的特征层次构建和抽取算法[D];重庆大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026