收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种改进的基于知网的句子相似度计算方法

李迎凯  徐小良  
【摘要】:针对基于词项的句子相似度计算存在信息冗余干扰和局部最优的缺陷,提出一种改进的基于知网的句子相似度计算方法。该方法通过增加筛选候选语句以降低冗余信息对准确度造成的干扰,同时在分词和词性标注的基础上,采用改进的带权最大二分图匹配算法获得全局最优匹配。实验结果表明,文中提出的方法有效地提高了句子相似度计算的准确度。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 宋国柱;陈俊杰;;基于双字词的动态最大匹配分词算法的研究[J];太原科技大学学报;2009年03期
2 安艳辉;董五洲;游自英;;基于改进的朴素贝叶斯文本分类研究[J];河北省科学院学报;2007年01期
3 蔡勇智;基于最大匹配分词算法的中文词语粗分模型[J];福建电脑;2005年09期
4 刘建舟;刘晓华;;主观题自动批改技术的研究[J];湖北工业大学学报;2006年04期
5 孙伟;邢长征;;关于中文文档复制检测算法的改进[J];计算机工程与科学;2010年08期
6 于淼;王日宏;;语句相似度计算在主观题评判中的应用[J];计算机应用;2008年12期
7 张琳;胡杰;;FAQ问答系统句子相似度计算[J];郑州大学学报(理学版);2010年01期
8 李跃民;王浩;赵生慧;;有词典中文分词算法研究[J];滁州学院学报;2008年03期
9 梁卓明;陈炬桦;;基于专有名词优先的快速中文分词[J];计算机技术与发展;2008年03期
10 周程远;朱敏;杨云;;基于词典的中文分词算法研究[J];计算机与数字工程;2009年03期
11 熊泉浩;;中文分词现状及未来发展[J];科技广场;2009年11期
12 陈烨彬;黄琳;;基于Lucene.Net的知识检索系统的设计与实现[J];现代计算机(专业版);2008年11期
13 康海燕;刘文华;庄祺彦;;受限领域智能问答系统的研究与实践(英文)[J];西华大学学报(自然科学版);2008年02期
14 姚兴山;;基于Hash算法的中文分词研究[J];现代图书情报技术;2008年03期
15 林珊,宁国宁,赵之霖;中文分词在邮件过滤系统中的应用[J];华南理工大学学报(自然科学版);2004年S1期
16 南铉国;崔荣一;;基于多层次融合的语句相似度计算模型[J];延边大学学报(自然科学版);2007年03期
17 王仕仲;宁龙兵;;基于Nutch的中文搜索引擎的研究与实现[J];电脑开发与应用;2009年07期
18 王琦;陈仪香;;基于知网的虚拟人情感建模研究[J];自动化技术与应用;2008年05期
19 姚兴山;;基于哈希算法的中文分词算法的改进[J];图书情报工作;2008年06期
20 吴晶晶;荆继武;聂晓峰;王平建;;一种快速中文分词词典机制[J];中国科学院研究生院学报;2009年05期
中国重要会议论文全文数据库 前10条
1 修驰;宋柔;;基于“大词”实例的中文分词研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 赵海;揭春雨;;基于子串标注的中文分词:寻找更佳的标注单元[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 王敏;叶宽余;薛峰;;一种面向网店商品搜索的中文分词系统设计[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
4 张梅山;邓知龙;车万翔;刘挺;;统计与词典相结合的领域自适应中文分词[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 韩冬煦;常宝宝;;基于边界熵和卡方统计量的多领域适应性中文分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 郝长伶;董强;;知网知识库描述语言[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 彭辉;翟翔;;AutoCAD 2008自动翻译软件研发[A];全国冶金自动化信息网2010年年会论文集[C];2010年
8 宋彦;张桂平;蔡东风;;基于N-gram的句子相似度计算技术[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 王屹林;朱慕华;朱靖波;;针对SVM中文分词特性的个性化后处理设计[A];第三届学生计算语言学研讨会论文集[C];2006年
10 戴莉;周明全;武仲科;王永恒;王燕妮;周曼;;Lucene在智能答疑系统中的应用研究[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 修驰;适应于不同领域的中文分词方法研究与实现[D];北京工业大学;2013年
2 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
3 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
4 刘岩;关于图的最大匹配问题的若干结果[D];郑州大学;2000年
5 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
6 何嘉;基于遗传算法优化的中文分词研究[D];电子科技大学;2012年
7 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
8 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
9 丁建完;陈述式仿真模型相容性分析与约简方法研究[D];华中科技大学;2006年
10 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
中国硕士学位论文全文数据库 前10条
1 周舫;汉语句子相似度计算方法及其应用的研究[D];河南大学;2005年
2 李剑;基于分块的句子语义相似度研究[D];安徽工业大学;2011年
3 张振幸;基于知网的模块化的中文句子相似度计算研究[D];安徽工业大学;2010年
4 薛慧芳;句子相似度计算理论及应用研究[D];西北大学;2011年
5 杨彦;基于Hash结构的机械统计分词系统[D];中南大学;2005年
6 周程远;中文自动分词系统的研究与实现[D];华东师范大学;2010年
7 张静静;基于知网文本相似度的文摘自动评测方法研究[D];中国石油大学;2011年
8 王新梅;基于内容挖掘的垃圾邮件过滤技术[D];武汉理工大学;2006年
9 苏亮;基于多级Hash分词的全文搜索引擎的研究[D];北京邮电大学;2008年
10 郭庆贺;中文文本姓名识别的研究[D];东北师范大学;2009年
中国重要报纸全文数据库 前10条
1 记者 陈磊;中国知网率先推出优先数字出版[N];科技日报;2010年
2 见习记者 廖小珊;中国知网推出优先数字出版 读者可多种数字渠道获取[N];中国新闻出版报;2010年
3 本报记者 杨杨;投资、创业两不误:李童的“新孩子”恒知网[N];21世纪经济报道;2011年
4 记者 王秀萍;“中国知网”集约化印刷华北基地在并建成[N];山西经济日报;2010年
5 程晓龙;中国知网联姻施普林格[N];中国新闻出版报;2008年
6 陈;思科用无线感知网络[N];中国计算机报;2003年
7 李大庆;中国知网与施普林格全面合作[N];科技日报;2008年
8 路华;中华行知网(www.sotrip.com)文化与旅游的契合[N];中国旅游报;2000年
9 记者 薛亚芳;就业机会近三成因供求错位而流失[N];人才市场报;2007年
10 高向东;千家数字图书馆对接“中国知网”数字出版平台[N];山西日报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978