收藏本站
收藏 | 投稿 | 论文排版

基于机器学习的科学数据正式引用识别方法研究

杨宁  张志强  
【摘要】:[研究目的]科学数据已经成为科研产出的重要成果类型之一,通过研究和观察科学数据的使用情况可以发现科学数据的管理需求,提高科研人员共享和重用科学数据的积极性。[研究方法]以生物信息学领域学术论文全文信息作为研究对象,利用规则抽取和人工标注形成了生物信息学引文分类数据集,并对比评估了8种机器学习方法在数据集上的分类和识别效果。[研究结论]实证研究效果显示,机器学习分类方法可以用于科学数据正式引用识别,全文信息和样本集大小对分类效果起到关键性作用。

知网文化
【相似文献】
中国期刊全文数据库 前15条
1 郭学武;;基于引文的科学数据与科技文献关联研究[J];情报科学;2014年04期
2 邱春艳;;美国图书馆参与科学数据管理的经验[J];国家图书馆学刊;2014年01期
3 张静蓓;田野;吕俊生;;科学数据引用规范研究进展[J];图书与情报;2014年05期
4 黄如花;李楠;;国外科学数据引用规范调查分析与启示[J];图书馆学研究;2016年10期
5 夏姚璜;;欧美Data curation的实践及启示[J];信息资源管理学报;2013年01期
6 吴卫娟;;科学数据资源聚合机制研究[J];图书馆学研究;2018年10期
7 张娟;;基于用户需求的高校图书馆科学数据服务研究[J];图书馆学研究;2015年19期
8 邓君;贾晓青;马晓君;宋文凤;;科学数据价值鉴定标准研究[J];情报科学;2013年09期
9 崔雁;;科学数据开放中数据中心政策分析与建议[J];图书情报工作;2016年08期
10 李成赞;黎建辉;王学志;沈志宏;杜一;;基于引文网络社区发现的数据推荐研究[J];情报学报;2021年08期
11 樊向伟;肖仙桃;;科研产出高峰期研究的现状与问题[J];图书情报工作;2015年05期
12 李梅;;开放环境下的数据引用探析[J];河南图书馆学刊;2017年11期
13 吴凤芝;张雯;杨一点;张弛;张玮玮;杨文君;倪胜楼;席宁;周蕾;;作者身份与科研产出力和学术影响力的关系[J];现代中医临床;2018年06期
14 王玥;许丽;徐萍;;2011-2015干细胞领域科研产出分析[J];科学观察;2016年06期
15 张丽娟;李丽萍;;对《高校图书馆科研产出及科研能力分析》的再追踪[J];图书馆工作与研究;2010年08期
中国重要会议论文全文数据库 前14条
1 刘盛博;丁堃;;基于引用内容的引文评价分析[A];第九届中国科技政策与管理学术年会论文集[C];2013年
2 覃吉康;骆秀琼;;西南师大自然科学学报1989-1994年引文统计与分析[A];高校编辑出版文集[C];1995年
3 刘青芬;雷春炳;;引文索引与中文生物医学引文数据库[A];2004年度中国索引学会年会暨学术讨论会论文集[C];2004年
4 雷瑜良;黄颖;;《重庆大学学报》(自然科学版)引文统计与分析[A];编辑工作论丛[C];1997年
5 楼海萍;杜娟;;国内两大引文数据库的比较研究[A];浙江省医学科学院建院55周年院庆论文专辑[C];2005年
6 韩毅;金碧辉;;引文网络主路径分析方法的形成与演化[A];第六届中国科技政策与管理学术年会论文集[C];2010年
7 梁春阳;;《周恩来选集》引文计量研究[A];周恩来百周年纪念-全国周恩来生平和思想研讨会论文集(下)[C];1998年
8 王玉茹;王惠文;;基于区间数据的学科科研产出分析[A];第十二届(2017)中国管理学年会论文集[C];2017年
9 张甜;李桂英;;中国卫生检验杂志2006-2007年引文的统计分析[A];预防医学学科发展蓝皮书·2008卷[C];2008年
10 蒋建生;戴闻;高政祥;;关于恰当使用ISI引文数据库[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(下)[C];2003年
11 黄日昆;;网络引文搜索引擎CiteSeer评析[A];第三届广西青年学术年会论文集(社会科学篇)[C];2004年
12 姜晓辉;;社科引文数据库与社科核心期刊的依存关系[A];全国核心期刊与期刊国际化、网络化研讨会文集[C];2003年
13 叶协杰;;CSTPCD源医学院校核心学报引文指标的比较分析[A];全国核心期刊与期刊国际化、网络化研讨会文集[C];2003年
14 聂素华;;农业大学学报论文的引文统计与分析[A];四川省科技期刊编辑学会论文集[C];1988年
中国博士学位论文全文数据库 前2条
1 马乐荣;面向百科知识库的实体-引文相关性分类技术研究[D];北京理工大学;2018年
2 胡志刚;全文引文分析方法与应用[D];大连理工大学;2014年
中国硕士学位论文全文数据库 前20条
1 田昶;大数据领域机构合作对科研产出的影响研究[D];重庆师范大学;2018年
2 刘松涛;基于引文排序的科技文献检索研究[D];东北师范大学;2010年
3 叶权慧;机器学习领域前沿演进分析与技术机会挖掘[D];山东科技大学;2018年
4 贺婉莹;基于机器学习的论文学术创新力评价研究[D];南京大学;2019年
5 程翔龙;基于机器学习的威胁情报可信分析系统的研究[D];北京邮电大学;2019年
6 张振康;国内学术期刊的引文聚散特征及学科交流度研究[D];曲阜师范大学;2013年
7 李立;基于论文与专利多代次引文网络的知识扩散研究[D];天津大学;2018年
8 张昊;基于引文网络分析的作者和期刊知识角色识别研究[D];重庆大学;2014年
9 孙巍;基于引文的信息检索可视化系统研究[D];黑龙江大学;2007年
10 李翠;计算机学科会议“守门人”与大学科研产出及学科水平的相关性研究[D];山西财经大学;2021年
11 王建芳;网络引文信息的挖掘及其对数字图书馆资源建设的启示[D];山西大学;2004年
12 张曦文;跨学科引文网络链路预测[D];北京林业大学;2020年
13 柏晗;基于加权引文的贝叶斯分类研究[D];南京大学;2016年
14 韩牧哲;基于引文网络的知识扩散研究[D];曲阜师范大学;2016年
15 钟镇;错引现象折射出的科学家群体引文失范行为[D];河南师范大学;2007年
16 王立梅;基于引文内容分析的老子思想域外学术知识扩散趋势研究[D];华东师范大学;2020年
17 胡一鸣;基于表示学习的专利科学引文元数据自动抽取及其内容挖掘研究[D];南京理工大学;2019年
18 乐燕娜;《中华消化外科杂志》2002-2011年载文与引文及著者的统计分析[D];浙江大学;2013年
19 董姝霞;基于引文的科技论文价值分析与可视化[D];北方工业大学;2020年
20 张慧玲;学科交叉期刊识别方法研究[D];山西财经大学;2019年
中国重要报纸全文数据库 前2条
1 本报记者 马海涛;“引文数据库”为科研成果打分[N];中国社会科学院院报;2003年
2 本报记者 张微;文献计量学的基础建设:引文数据库[N];中国社会科学院院报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978