收藏本站
《计算机与现代化》 2020年09期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

多特征融合的教育资源标签生成算法

李雯  文勇军  唐立军  
【摘要】:利用标签的形式简单有效地对教育资源进行准确描述,对互联网中杂乱、庞大的教育资源进行高效分类,能使用户便捷地浏览和获取教育资源信息并提高教育资源的利用率。自然语言处理中生成文本标签的方法有很多种,但特征描述不全面,因此需要研究多特征融合的标签生成方法。本文结合中文文本的特点,在TextRank算法基础上,加入TF?IDF权重和位置信息权重,考虑词语在语料库中的信息及在文章中的位置信息,生成包括语料库信息和位置信息的标签,形成多特征融合的标签生成算法。测试结果及分析表明,多特征融合后的标签生成算法最高F值为0. 571,其平均值为0.34,优于常用的TextRank算法和TF?IDF算法,有效提高了教育资源标签质量,有利于教育资源更好的利用和管理。

知网文化
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026