收藏本站
《情报学报》 2014年08期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

科技文献副主题词抽取及其在分面检索中的应用

胡昌平  林鑫  陈果  
【摘要】:本文研究了科技文献副主题词的自动抽取问题,并对其在分面检索中的应用进行了探索。为实现副主题词的自动标引,本文提出了以标题作为抽取数据源、基于规则进行抽取的实现方法,并以图情领域文献进行了实验。结果显示,基于规则的抽取方法在召回率和准确率方面表现良好,均超过了90%;但仅以标题作为抽取数据源会导致召回率偏低,仅有49.9%的文献能抽取出副主题词。为探索副主题词在分面检索中的应用,本文以图情领域文献为例构建了原型系统,从使用效果来,副主题词作为独立的检索点价值不大,但和其他检索点配合使用则可以更贴切地表达用户需求,作为分面则能在帮助用户进行探索式检索以及结果筛选方面发挥重要作用。本研究的局限性包括仅采用标题作为副主题词抽取数据源,导致召回率不高;在副主题词抽取时未考虑同时抽取相应的主题词等。

手机知网App
【引证文献】
中国期刊全文数据库 前2条
1 秦春秀;刘杰;刘怀亮;马晓悦;;基于知识元的科技文本内容描述框架研究[J];图书情报工作;2017年10期
2 王新玲;张宏;陈彬;;实用皮肤病医学期刊论文关键词的标引探析[J];实用皮肤病学杂志;2016年04期
中国硕士学位论文全文数据库 前1条
1 王亚坤;融合LDA与TextRank算法的主题信息抽取方法[D];山西大学;2017年
【参考文献】
中国期刊全文数据库 前10条
1 杨柳;;近10年图书馆学研究的主题词分布状态分析——以《中国图书馆学报》为例[J];图书馆学刊;2013年11期
2 林佳瑜;;论文标题与下载和引用的关系[J];大学图书馆学报;2012年04期
3 丁君军;郑彦宁;化柏林;;基于规则的学术概念属性抽取[J];情报理论与实践;2011年12期
4 梁红兵,杨铭魁,黄晓;基于反馈规则学习的医学文献主题自动标引方法[J];计算机工程;2003年11期
5 韩客松,王永成,王刚;生物学文献自动标引系统的理论和实践[J];情报学报;2000年03期
6 苏新宁,邹晓明;文献信息自动标引研究[J];现代图书情报技术;2000年01期
7 鲍文;胡清华;于达仁;;基于K-近邻方法的科技文献分类[J];情报学报;2003年04期
8 侯汉清;章成志;郑红;;Web概念挖掘中标引源加权方案初探[J];情报学报;2005年01期
9 温有奎;温浩;徐端颐;潘龙法;;基于知识元的文本知识标引[J];情报学报;2006年03期
10 化柏林;;图书情报学核心期刊论文标题计量分析研究[J];情报学报;2007年03期
中国硕士学位论文全文数据库 前1条
1 周孟霞;基于规则学习的中医药文献自动标引系统[D];浙江大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 王凯;孙济庆;李楠;;面向学术文献的知识挖掘方法研究[J];现代情报;2017年05期
2 赵蓉英;张心源;;基于知识元抽取的中文智库成果描述规则研究[J];图书与情报;2017年01期
3 李伟;;基于知识元细粒度信息检索研究[J];农业图书情报学刊;2017年02期
4 曹树金;马翠嫦;;信息聚合概念的构成与聚合模式研究[J];中国图书馆学报;2016年03期
5 孙东普;朱鸣华;林鸿飞;;中文专利属性值对抽取技术及应用[J];计算机工程与科学;2016年04期
6 翟劼;裘江南;;基于规则的知识元属性抽取方法研究[J];情报科学;2016年04期
7 贺惠新;刘丽娟;;主动学习的科技文献研究对象标引体系研究[J];现代图书情报技术;2016年03期
8 谢韶亮;;英语专业语言学类硕士论文英语标题的对比研究[J];渭南师范学院学报;2016年06期
9 高国伟;王亚杰;李永先;;我国知识元研究综述[J];情报科学;2016年02期
10 涂志芳;;“青睐”还是“厌烦”:图书情报领域“基于”样式的学术论文研究[J];图书馆论坛;2016年04期
中国硕士学位论文全文数据库 前3条
1 尹仁芳;中医药信息学学科发展战略研究[D];中国中医科学院;2010年
2 白振田;基于向量空间模型与规则匹配相结合的文本层次分类系统的研究[D];南京农业大学;2006年
3 张敏;生物学文献的自动标引系统的研究与开发[D];东华大学;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 冯儒佳;王忠义;王艳凤;马彬;;科技论文的多粒度知识组织框架研究[J];情报科学;2016年12期
2 王宁;刘海园;;基于知识元的突发事件情景演化混合推理模型[J];情报学报;2016年11期
3 边文越;李泽霞;冷伏海;;构建包含知识元分析的科技前沿情报分析框架——以研究甲烷直接制乙烯为例[J];图书情报工作;2016年10期
4 高国伟;王亚杰;李佳卉;李永先;;基于知识元的知识库架构模型研究[J];情报科学;2016年03期
5 杨选辉;李晚照;谷艳红;;基于知识元的教学资源组织模式的构建研究[J];图书情报知识;2016年01期
6 化柏林;;学术论文中方法知识元的类型与描述规则研究[J];中国图书馆学报;2016年01期
7 王颖;张智雄;孙辉;雷枫;;国史知识的语义揭示与组织方法研究[J];中国图书馆学报;2015年04期
8 陈永恒;左万利;林耀进;;作者标签主题模型在科技文献中的应用[J];计算机应用;2015年04期
9 姚东旻;李军林;;条件满足下的效率差异:PPP模式与传统模式比较[J];改革;2015年02期
10 袁建国;后青松;程晨;;企业政治资源的诅咒效应——基于政治关联与企业技术创新的考察[J];管理世界;2015年01期
中国硕士学位论文全文数据库 前1条
1 胡新辰;基于LSTM的语义关系分类研究[D];哈尔滨工业大学;2015年
【二级参考文献】
中国期刊全文数据库 前10条
1 林佳瑜;;论文下载次数与阅读使用次数的调查分析[J];图书馆杂志;2012年03期
2 丁君军;郑彦宁;化柏林;;国内外属性抽取研究综述[J];情报科学;2011年05期
3 化柏林;张新民;;从知识抽取相关概念辨析看知识抽取的特点和发展趋势[J];情报科学;2010年02期
4 化柏林;郭江;;基于规则的高校实验室Web信息抽取的系统设计与实现[J];现代图书情报技术;2009年10期
5 伍星;何中市;黄永文;;基于弱监督学习的产品特征抽取[J];计算机工程;2009年13期
6 吴月萍;陈玉泉;;基于Web的概念属性抽取的研究[J];中国管理信息化;2009年10期
7 赵星;高小强;郭吉安;陶乃航;;基于主题词频和g指数的研究热点分析方法[J];图书情报工作;2009年02期
8 侯跃芳;崔雷;朱利娜;;应用主题词/副主题词关联规则对专题知识的挖掘分析及评价[J];情报理论与实践;2008年02期
9 蔡建霞;刘荷芬;王玉霞;;科技论文题名写作与投稿[J];地域研究与开发;2008年01期
10 王璐;朱东华;任智军;;科技术语属性抽取方法研究[J];现代图书情报技术;2007年05期
【相似文献】
中国期刊全文数据库 前10条
1 徐慧;崔蒙;;病毒性心肌炎主题词和副主题词关联规则分析[J];世界科学技术(中医药现代化);2009年04期
2 田梅;;医学文献主题标引中副主题词使用问题分析[J];中华医学图书情报杂志;2008年02期
3 邢宝山;李欣欣;王丽;;副主题词在医学期刊文献标引中的应用探讨[J];现代情报;2006年12期
4 孔瑞珍;刘丽娟;;CBM专题副主题词使用频率的分析与研究[J];晋图学刊;2008年05期
5 景来江,陈晓红,田学梅,吴红艳;MEDLINE CD-ROM光盘中副主题词对主题词查全率影响的探讨[J];情报科学;1999年01期
6 毕玉侠,于占洋,杨错,许洪军;EM:Drug&Pharmacology与IPA的比较研究[J];中华医学图书情报杂志;2002年03期
7 肖晓旦,朱雷;《MEDLINE》副主题词特点及对医学主题概念间逻辑关系表达[J];情报科学;2000年06期
8 何蛟,崔雷,侯跃芳;面向主题词/副主题词的PubMed数据挖掘软件[J];中华医学图书情报杂志;2005年01期
9 李军莲;李丹亚;孙海霞;冀玉静;李芳;;中文生物医学文献主题标引中副主题词自动组配机制探讨[J];现代图书情报技术;2012年06期
10 钟伟金;;基于概念关联的词汇语义关系识别研究[J];情报杂志;2014年01期
中国硕士学位论文全文数据库 前2条
1 孙瑞涛;分面检索中的交互式导航的设计与实现[D];西北大学;2013年
2 张浩;MEDLINE数据库中生物体类主题词相关语义关系的构建与评价[D];中国医科大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026