收藏本站
收藏 | 投稿 | 论文排版

基于最长顺序频繁词组的Web文献检索结构

王大玲  于戈  鲍玉斌  
【摘要】:目前,大多数Web文献不能满足不同层次科研人员的查询要求.分析了这一问题产生的原因,提出建立辅助的Web文献检索结构以帮助用户更准确地获取所需文献的思想.基于该思想,设计了通过挖掘最长顺序频繁词组抽取文献特征的算法,提出了能够表现特征之间、文献之间、特征与文献之间关系的扩展的特征层次树结构及其构建方法.实验表明,挖掘最长顺序频繁词组在抽取文献特征方面比常用的TFIDF具有更大的优势.理论分析说明,扩展的特征层次树具有压缩的存储结构、词组与文献关系的表现方式和更好的辅助检索功能.

知网文化
【相似文献】
中国期刊全文数据库 前1条
1 王大玲;于戈;鲍玉斌;;基于最长顺序频繁词组的Web文献检索结构[J];软件学报;2006年10期
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978