收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于特征相似度的科技论文元数据提取算法研究

钱建立  吴广茂  蒋路  
【摘要】:通过对论文元数据网页的分析发现论文摘要页面的各种元数据在长度、前置引导词、分隔符等方面都具有特定的规律,并据此提出了基于元数据特征的元数据抽取算法,归纳出了论文元数据的7个形式特征和2个语义特征,定义了确定特征和排除特征,描述了特征相似度算法的6个步骤,给出了分别采用正则表达式方法和特征相似度方法的试验结果,测试表明,采用特征相似度方法的提取成功率从68%提高到了95%,达到了实用水平.

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 张铭,邓志鸿,陈捷,杨冬青,唐世渭;数字图书馆科技文献知识导航[J];计算机工程与应用;2002年17期
2 李朝光,张铭,邓志鸿,杨冬青,唐世渭;论文元数据信息的自动抽取[J];计算机工程与应用;2002年21期
3 常虹;建立天津数字图书馆的几点设想[J];图书馆工作与研究;2002年01期
4 吴金华;地理空间元数据的探讨[J];西安工程学院学报;2002年02期
5 黄清芬;浅谈数字图书馆的资源库建设[J];科技情报开发与经济;2004年03期
6 凌海云,左志宏,陈兰,段恩泽,袁军英;语义标注元数据及其抽取技术[J];计算机应用研究;2004年07期
7 张智雄;信息抽取技术及其在数字图书馆中的应用前景分析[J];现代图书情报技术;2004年06期
8 刘金红,夏阳,陆余良;基于Ontology的网络元数据抽取系统的研究与实现[J];安徽电子信息职业技术学院学报;2004年Z1期
9 杨枫,张莉华,钟乐海;基于Semantic Web的校园网知识检索的设计分析[J];计算机系统应用;2005年09期
10 曾宪文;沈学东;;基于移动Agent的元数据自动抽取研究[J];微型电脑应用;2006年08期
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978