主动学习的科技文献研究对象标引体系研究
【摘要】:【目的】识别论文标题中的研究对象属性实例,试图利用少量标注样本,最大限度地提高研究对象识别的准确率。【方法】分析科技文献中研究对象的语法特征,利用少量样本基于条件随机场序列标注算法,对研究对象进行识别和抽取,并引入基于未标注数据的主动学习的迭代标引体系,提高研究对象识别的准确率。【结果】能够高效利用未标注数据,并最大限度地提高研究对象识别的准确率,标注准确率达到78.3%。【局限】算法运行效率有待进一步优化。【结论】对科技文献中研究对象属性实例具有较好的识别效果,为进一步挖掘科技文献中的知识体系和结构打下基础。
|
|
|
|
1 |
亢成业,陈国秀,张玉娥,许爱萍,张宝琼,王向敏;山西省农业科技文献平台共建共享的思路[J];晋图学刊;2005年04期 |
2 |
杨恒宇;;利用网络技术实现科技文献信息资源共建共享[J];安徽科技;2005年12期 |
3 |
罗紫初;柴玉舟;刘婷婷;;关于大学生利用网上科技文献的调查报告[J];科技文献信息管理;2006年03期 |
4 |
刘爱民,周泰锦,张鸿图,万惠霖;中英文科技文献数据库管理程序设计[J];厦门大学学报(自然科学版);1993年06期 |
5 |
林小平;;图书馆计算机化与科技文献老化速度测定[J];当代图书馆;1998年01期 |
6 |
李励;;推进浙江省科技文献共享平台建设的若干设想[J];信息化建设;2006年06期 |
7 |
李雪仙;;网络环境下地方科技文献共享平台建设——以衢州市科技文献共享平台的建设实践为例[J];图书馆工作与研究;2009年10期 |
8 |
苻福恒;怎样检索舰船科技文献?(一)[J];舰船科学技术;1979年06期 |
9 |
林红薇;我所科技文献自动化管理情况介绍[J];广东电力;1995年04期 |
10 |
刘建华;张智雄;徐健;许雁冬;;自动术语识别——对科技文献进行文本挖掘的重要技术方法[J];现代图书情报技术;2008年08期 |
11 |
褚孝才,贺六连,崔天荣;石油科技文献的主题标引方法[J];大庆石油学院学报;1988年02期 |
12 |
杨则正;数字化图书馆的发展:评述[J];管理科学文摘;1997年03期 |
13 |
孟霞;;电子阅览室的管理及思考[J];天津科技;2005年06期 |
14 |
于德乾;何忠廉;崔太运;孙晓初;;吉林省情报资源检索网络化的探讨[J];情报科学;1990年04期 |
15 |
杨国卿;;科技文献磁带的计算机COBOL检索程序[J];辽宁机械;1984年02期 |
16 |
贺亮;李芳;;基于话题模型的科技文献话题发现和趋势分析[J];中文信息学报;2012年02期 |
17 |
陈航;田树林;付兴奎;;基于Web Service的吉林省科技文献信息共享系统研究[J];现代情报;2009年10期 |
18 |
张华;;探析网络环境下我国开放获取期刊的发展[J];农业网络信息;2010年08期 |
19 |
鲍美英;利用引用结构来提高科技文献分类的质量[J];雁北师范学院学报;2005年02期 |
20 |
孙军凯;赵艳春;王一青;朱虹;;科技文献的数字化与思考[J];人民长江;2009年04期 |
|