收藏本站
《电脑开发与应用》 2007年06期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于Web的包装器技术的现状与发展

贺令亚  柳佳刚  
【摘要】:Web信息抽取技术已成为当前一个研究热点,信息抽取的主要工作由包装器来完成。根据包装器的原理,对现有的信息抽取技术进行了分类,并结合典型的系统讨论各抽取技术的特点,提出了以本体来构建包装器的规则模型。
【作者单位】湖南工学院 湖南工学院
【分类号】:TP311.10

【引证文献】
中国期刊全文数据库 前5条
1 李宏伟;史培中;张素智;;一种可行的Web数据抽取包装器的设计方法[J];计算机应用与软件;2009年03期
2 朱建华;;一种基于Web的新闻抽取方法[J];情报杂志;2010年S2期
3 李宏伟;史培中;张素智;;一种高效Web数据抽取包装器的设计与实现[J];计算机技术与发展;2009年02期
4 陈高维;邓天权;曾云磊;王维国;张龙;;基于垂直搜索引擎的旅游线路评价模型的设计[J];科技创新导报;2010年18期
5 王红卫;马红;张素智;赵宇;;基于预定义模式的Web网页结构化数据抽取[J];郑州轻工业学院学报(自然科学版);2008年06期
中国硕士学位论文全文数据库 前3条
1 汪晖;基于本体的Web数据抽取Wrapper研究与实现[D];东华大学;2009年
2 杨洋;基于多Agent系统的专利采集系统研究[D];北京工业大学;2010年
3 韩杰;中文BBS信息提取与分类[D];武汉邮电科学研究院;2009年
【参考文献】
中国期刊全文数据库 前2条
1 李善平,尹奇韡,胡玉杰,郭鸣,付相君;本体论研究综述[J];计算机研究与发展;2004年07期
2 王庆一,王继成,周源远,袁春风;多信息块Web页面的信息抽取[J];计算机应用研究;2002年10期
【共引文献】
中国期刊全文数据库 前10条
1 唐琨皓;杨贯中;刘燕玲;;基于本体的任务模型研究与应用[J];办公自动化;2009年02期
2 刘椿年,宋霞;基于Boosting的半结构化信息抽取[J];北京工业大学学报;2005年02期
3 梁晔;周海燕;;本体论与语义Web[J];北京联合大学学报(自然科学版);2007年01期
4 牟冬梅;王丽伟;;知识组织系统中关系模式的应用比较[J];图书与情报;2006年05期
5 何章鸿;董守斌;;基于XPath的广告数据提取研究[J];江西师范大学学报(自然科学版);2008年02期
6 何友全;徐澄;徐小乐;唐华姣;;一种基于统计学特征和DOM树的网页去噪技术[J];重庆理工大学学报(自然科学版);2011年01期
7 祝小诗;;情报学与计算机科学在同一信息技术领域的研究比较[J];重庆图情研究;2007年02期
8 李春梅;吴云峰;;基于Ontology的语义信息检索及应用[J];楚雄师范学院学报;2006年09期
9 江河;;基于知识本体的个性化网页检索系统设计与实现[J];常州工学院学报;2010年06期
10 李绍英;;基于代理技术的比较购物研究[J];当代经理人;2006年10期
中国重要会议论文全文数据库 前10条
1 陈红兵;;基于XML的电子政务信息集成框架[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
3 刘秉权;王喻红;葛冬梅;李佳;;基于结构树解析的网页正文抽取方法[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
4 ;A Classification Method for Web Information Extraction[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年
5 姚文琳;王莉;王璀民;;基于Ontology的知识检索系统的设计与实现[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
6 汪建伟;高军;王腾蛟;杨冬青;;一种基于显示属性的网页信息提取方法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
7 叶娜;吴雪军;朱靖波;陈文亮;;基于相似计算的信息抽取模板自动获取方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 叶娜;罗海涛;朱靖波;张斌;;基于归纳逻辑编程的多槽信息抽取规则自动学习方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 左南;李涓子;唐杰;;基于SVM的肖像照片抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 周扬;面向中药药性多维表征体系的中药本体研究[D];山东中医药大学;2010年
2 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
3 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
4 王强;空间信息服务聚合的关键技术研究[D];解放军信息工程大学;2010年
5 赵娜;基于知识地图的多领域本体语义互联研究[D];吉林大学;2011年
6 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
7 萧毅鸿;基于本体的复杂决策任务表示方法与求解技术研究[D];南京大学;2011年
8 曾帅;普适计算环境下的信任管理研究[D];北京邮电大学;2011年
9 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
10 尹胜;网络化协作加工资源优化配置方法及其加工支持系统研究[D];重庆大学;2011年
中国硕士学位论文全文数据库 前10条
1 樊敬川;Deep Web数据库的选择研究[D];河北大学;2009年
2 厉颖;基于本体的服装领域知识表示的建模研究[D];山东科技大学;2010年
3 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
4 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年
5 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
6 赵阳耀;基于本体的数据源映射方法与策略[D];哈尔滨工程大学;2010年
7 徐济成;面向农业领域的本体学习建模研究[D];安徽农业大学;2010年
8 吉喆;基于本体的茶树虫害智能诊断系统研究[D];安徽农业大学;2010年
9 刘召栋;基于电子政务平台的政府竞争情报系统研究[D];湘潭大学;2010年
10 潘拓宇;融入用户行为上下文的个性化推荐模型[D];湘潭大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 王茹,宋瀚涛,陆玉昌;基于树自动机的网页数据抽取[J];北京理工大学学报;2004年09期
2 洪亮;田支斌;;浅析中文环境下的Apach Commons HttpClient编程[J];电脑知识与技术;2008年22期
3 李向阳,陆建江,张亚非;基于竞争分类的Web信息抽取[J];电子学报;2004年11期
4 还书国;邱海霞;;WEB信息抽取的研究[J];消费导刊;2008年12期
5 张洪斌;危胜军;;基于超图的并行信息采集系统任务划分方法[J];广西师范大学学报(自然科学版);2008年01期
6 荆涛,左万利;基于可视布局信息的网页噪音去除算法[J];华南理工大学学报(自然科学版);2004年S1期
7 叶卫国,卢正鼎,王天江;基于Hyperlink聚类的网页分类研究[J];华中科技大学学报(自然科学版);2004年12期
8 李善平,尹奇韡,胡玉杰,郭鸣,付相君;本体论研究综述[J];计算机研究与发展;2004年07期
9 王琦,唐世渭,杨冬青,王腾蛟;基于DOM的网页主题信息自动提取[J];计算机研究与发展;2004年10期
10 宋晖,张岭,叶允明,马范援;基于标记树对象抽取技术的Hidden Web获取研究[J];计算机工程与应用;2002年23期
中国博士学位论文全文数据库 前2条
1 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
2 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年
中国硕士学位论文全文数据库 前10条
1 贺智平;Web信息自动抽取技术研究[D];西安电子科技大学;2006年
2 任函;大规模中文网页的自动分类研究[D];华中师范大学;2006年
3 成光;基于XML/XSLT的动态网页自动生成系统研究与实现[D];苏州大学;2006年
4 陈佳;基于XML的Web信息抽取技术的应用研究[D];武汉理工大学;2007年
5 孙敏;面向Agent的电子竞标软件模型研究[D];南京航空航天大学;2007年
6 高岭;Deep Web分类搜索引擎关键技术研究[D];苏州大学;2007年
7 胡燕;Web信息内容及其特征提取方法研究[D];河北农业大学;2008年
8 李莉;基于CPN的Multi-Agent调度系统建模与仿真[D];北京工业大学;2008年
9 陈莉勤;分布式信息检索中移动Agent技术的应用研究[D];武汉理工大学;2008年
10 姚晓娜;BBS热点话题挖掘与观点分析[D];大连海事大学;2008年
【二级引证文献】
中国期刊全文数据库 前3条
1 田素端;;专利检索系统中专利信息采集模块的研究[J];科技致富向导;2012年11期
2 蔡李;单艳;薛化建;苏国平;;维吾尔文网页正文抽取系统的研究与实现[J];计算机工程与设计;2012年02期
3 詹佳佳;;基于Web-Harvest的Web信息抽取系统的设计与应用[J];现代图书情报技术;2010年03期
中国硕士学位论文全文数据库 前8条
1 任昌;基于多特征融合的网页对象自动定位技术研究[D];中北大学;2011年
2 肖军;TBM系统开发中若干关键技术的研究与应用[D];湖南大学;2009年
3 禾文汇;基于BI的专利数据整合分析研究及实现[D];北京工业大学;2011年
4 朱媛媛;基于本体的电子商务信息抽取系统研究[D];河北大学;2011年
5 周洪波;山西旅游线路优化研究[D];山西大学;2011年
6 吴俊霖;基于半自动化WEB数据抽取器的信息集成研究[D];西南大学;2010年
7 高亚;Deep Web数据集成系统中数据抽取与语义标注研究[D];河北大学;2010年
8 杨俊丰;文本信息抽取与分类系统研究与设计[D];湖南大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 陈刚,金芝,陆汝钤;虚拟企业及其协作模型[J];电子学报;2002年S1期
2 陆汝钤,石纯一,张松懋,毛希平,徐晋晖,杨萍,范路;面向Agent的常识知识库[J];中国科学E辑:技术科学;2000年05期
3 武成岗,焦文品,田启家,史忠植;基于本体论和多主体的信息检索服务器[J];计算机研究与发展;2001年06期
4 陈晓明,俞时,谢莉莉,陈家训;基于本体模型的异构企业信息系统协作[J];计算机工程与应用;2003年01期
5 邓志鸿,唐世渭,杨冬青;基于本体的多Agent分布式数字图书馆资源信息发现服务模型之研究[J];计算机工程;2002年06期
6 周永华,陈禹六,赵天奇;经营过程建模[J];计算机集成制造系统-CIMS;2002年01期
7 李瑜,黄必清,刘文煌,吴澄;虚拟企业伙伴选择问题领域的目标本体论[J];计算机集成制造系统-CIMS;2002年02期
8 金芝;基于本体的需求自动获取[J];计算机学报;2000年05期
9 曹存根;国家知识基础设施的意义[J];中国科学院院刊;2001年04期
10 陈刚,陆汝钤,金芝;基于领域知识重用的虚拟领域本体构造[J];软件学报;2003年03期
【相似文献】
中国期刊全文数据库 前10条
1 柳佳刚;陈山;贺令亚;;基于本体和DOM相结合的Web信息抽取器[J];现代图书情报技术;2009年05期
2 周霜菊;;基于本体的教学信息抽取设计[J];现代情报;2009年03期
3 高文利;;基于本体的军备情报抽取系统的设计与实现[J];现代图书情报技术;2010年01期
4 侯锟;罗海龙;;Web页面列表信息的自主抽取[J];科技广场;2007年03期
5 翟东升,余旸;国际贸易技术壁垒信息采集系统设计与实现[J];情报杂志;2005年08期
6 侯锟;刘斌;;Web页面信息抽取技术的研究[J];荆楚理工学院学报;2009年11期
7 侯锟;罗海龙;;Web页面表格信息的自主抽取[J];科技广场;2006年04期
8 彭同坠;;Web新闻正文信息抽取技术研究[J];科教文汇(下旬刊);2008年12期
9 刘继勇;曲文龙;;一种面向属性的论坛自动抽取方法[J];科学技术与工程;2009年24期
10 谢红薇;周慧;李娟莉;;基于应急案例本体的信息抽取的模型及应用[J];电脑开发与应用;2006年02期
中国重要会议论文全文数据库 前10条
1 袁鸿雁;;Web表格信息抽取技术的研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
2 赵泽宗;;比喻推理建构[A];逻辑今探——中国逻辑学会第五次代表大会暨学术讨论会论文集[C];1996年
3 戴佐培;宋春林;李净;;基于本体的中医经络知识库的设计与开发[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
4 伍伟;李兵;曾诚;;基于本体的语义Web服务注册平台研究[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
5 陈冬菊;张发军;宫玉梅;何天白;;在嵌段共聚物本体与薄膜中结晶形貌的研究[A];2005年全国高分子学术论文报告会论文摘要集[C];2005年
6 广凯;魏鲲;金浩;潘金贵;;一种基于本体的上下文模型[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
7 康达周;徐宝文;陆建江;李言辉;;支持语义web模糊本体的描述逻辑(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
8 罗娜;左万利;袁福宇;张靖波;张慧杰;;使用本体语义提高文本聚类(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
9 颜端武;李晓鹏;王磊;成晓;;文本聚类中基于本体的相似性测度(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
10 蔡畅;李宏伟;李勤超;;语义层次的知识推理研究[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年
中国重要报纸全文数据库 前10条
1 黄家艳;川电三公司汽机工程处本体班获“全国质量信得过班组”[N];西南电力报;2002年
2 刘春田;“知识”的本体和现实形态[N];中国知识产权报;2004年
3 中国科学院计算技术研究所 黄瑞史忠植;加强知识的共享与重用[N];计算机世界;2007年
4 大江;锻造本体竞争力[N];中国改革报;2006年
5 深圳报业集团驻京记者 陆云红;改革开放之窗创新活力之都[N];深圳特区报;2006年
6 任玉岭;一本体现时代精神的哲学教材[N];光明日报;2003年
7 郑敏;也谈本体杂文[N];中国文化报;2003年
8 宏图三胞高级副总裁 花贵侃;企业需要一条灵活的“尾巴”[N];电脑商报;2007年
9 左孝 记者蒋寒;世界最大本体装置在天原建成[N];科技日报;2005年
10 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
中国博士学位论文全文数据库 前10条
1 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年
2 安杨;基于本体的网络地理服务中的关键问题研究[D];武汉大学;2005年
3 严亚兰;基于语义Web的知识处理研究[D];武汉大学;2005年
4 罗正鸿;D_4/APAEDMS本体开环共聚及其数学模拟[D];浙江大学;2003年
5 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
6 周明建;基于本体的开放式知识管理研究[D];浙江大学;2004年
7 李景;本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D];中国科学院研究生院(文献情报中心);2004年
8 张凯;基于本体的Web信息集成若干关键技术研究[D];复旦大学;2004年
9 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
10 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
中国硕士学位论文全文数据库 前10条
1 张晓欢;基于本体的产品信息抽取系统的研究[D];天津理工大学;2009年
2 张岩;基于本体的综合评价文本自动生成系统研究[D];中国石油大学;2009年
3 李文泽;个性化垂直搜索引擎研究[D];河南大学;2007年
4 徐东兴;基于Gate框架的信息抽取系统的研究与实现[D];华东师范大学;2007年
5 赵文;基于本体的Web信息抽取系统的研究与实现[D];沈阳工业大学;2007年
6 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
7 王花;Web信息抽取技术研究[D];西北农林科技大学;2010年
8 廉成洋;基于树结构的Web信息抽取技术研究[D];南京航空航天大学;2010年
9 李知颖;基于包装器模型的信息抽取算法研究[D];东北师范大学;2009年
10 孔楠;基于本体的垂直搜索系统的设计与实现[D];北京交通大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026