收藏本站
《计算机工程与科学》 2007年03期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于词共现的文本相似度计算

曹恬  周丽  张国煊  
【摘要】:在文本检索中,由于用户需求的表达方式不充分,常会得到大量无关信息,给用户检索带来诸多不便。本文提出的基于词共现的文本相似度计算,可以让用户选择去掉或保留和某一文本相似的文本集,提高用户检索效率。

手机知网App
【引证文献】
中国期刊全文数据库 前5条
1 邹艳珍;刘昌盛;李萌;谢冰;;一种基于Internet的JAR包使用信息收集方法[J];计算机科学;2011年06期
2 周汉平;;Levenshtein距离在编程题自动评阅中的应用研究[J];计算机应用与软件;2011年05期
3 常鹏;冯楠;;基于词共现的文档表示模型[J];中文信息学报;2012年01期
4 魏程;刘鲁;翟铭;;一种四维向量空间模型的Web新闻文本分类方法[J];微计算机应用;2010年03期
5 辛颖梅;钱海峰;倪魏巍;徐冬梅;孙志挥;;关于专利类别间相似度量化方法的研究[J];科技创新导报;2009年15期
中国博士学位论文全文数据库 前2条
1 常鹏;基于词共现的文本主题挖掘模型和算法研究[D];天津大学;2010年
2 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
中国硕士学位论文全文数据库 前7条
1 石安磊;基于文本相似度评分的中医案例分析系统研究与实现[D];西北大学;2011年
2 李琚彪;质检舆情监控系统中信息检索的研究[D];北京邮电大学;2011年
3 唐凌志;基于语义理解的论文相似度研究[D];湘潭大学;2011年
4 马军红;文本相似度计算理论与应用研究[D];西北大学;2011年
5 杨茶;基于UIMA的内容搜索[D];电子科技大学;2008年
6 孙殿余;关联主题的个性化检索模型的研究[D];电子科技大学;2009年
7 邱萌;基于内容的多源新闻聚合关键技术研究与实现[D];华东师范大学;2010年
【参考文献】
中国期刊全文数据库 前2条
1 潘谦红,王炬,史忠植;基于属性论的文本相似度计算[J];计算机学报;1999年06期
2 李珩,朱靖波,姚天顺;基于SVM的中文组块分析[J];中文信息学报;2004年02期
【共引文献】
中国期刊全文数据库 前10条
1 谢飞;;支持向量机及其应用研究[J];安徽教育学院学报;2007年03期
2 敖成龙,苏英,龚元明;基于相似度的复杂数据对象比较[J];北京理工大学学报;2003年05期
3 秦颖;王小捷;钟义信;;级联中文组块识别[J];北京邮电大学学报;2008年01期
4 丁建;范太华;;一种综合的概念语义相似度计算方法[J];电脑知识与技术;2011年03期
5 周如旗;;个性化远程学习的形式化建模方法研究[J];广东教育学院学报;2005年05期
6 谢晓兰,刘建华,陆绮荣;高考招生系统中的决策算法[J];桂林工学院学报;2001年04期
7 张兰芳;;一种基于本体的自然语言语义相似度算法[J];桂林理工大学学报;2012年02期
8 李广原;冯嘉礼;;基于属性坐标的文本信息检索模型[J];广西科学院学报;2005年04期
9 霍林;潘英花;王力;黄俊文;;分布式密文全文检索系统设计及安全性研究[J];广西大学学报(自然科学版);2010年06期
10 李广原;属性论在文本相似度计算中的应用[J];广西师院学报(自然科学版);2000年03期
中国重要会议论文全文数据库 前5条
1 李广原;冯嘉礼;;基于属性坐标的文本信息检索模型[A];广西计算机学会2005年学术年会论文集[C];2005年
2 陈黎黎;冯嘉礼;;基于属性坐标学习和分析的教学质量评估模型[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
3 赵妍妍;秦兵;刘挺;张俐;苏中;;基于多特征融合的句子相似度计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 张运良;张全;;概念优先组合判断研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 臧翰芬;;基于MC-Value的非句蜕广义对象语义块的边界识别[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
2 邵世维;基于几何特征的多尺度矢量面状实体匹配方法研究与应用[D];武汉大学;2011年
3 冯嘉礼;核电站严重事故应急决策支持系统及其计算机实现研究[D];中国原子能科学研究院;2001年
4 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
5 章志勇;三维模型几何相似性比较的研究[D];浙江大学;2005年
6 何清;机器学习与文本挖掘若干算法研究[D];中国科学院研究生院(计算技术研究所);2002年
7 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
8 李宏伟;基于Ontology的地理信息服务研究[D];解放军信息工程大学;2007年
9 邹婷婷;支持向量机回归—近红外光谱法用于药物无损非破坏定量分析的研究[D];吉林大学;2008年
10 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年
中国硕士学位论文全文数据库 前10条
1 王玉丹;基于SVM的汉语依存句法分析研究[D];中国海洋大学;2010年
2 周晓红;基于内容与链接的页面价值算法研究[D];电子科技大学;2010年
3 刘智慧;基于搜索引擎的自动问答系统[D];西安电子科技大学;2010年
4 陈永超;基于字数差别因子的中文文本相似度研究[D];湖北工业大学;2011年
5 吴倩倩;基于语义Web的智能问答系统的研究与实现[D];北京交通大学;2011年
6 王利鑫;文本自动比对研究与应用[D];南京信息工程大学;2011年
7 汪佳俐;化学计量学方法在分子光谱定量分析与原子光谱分类研究中的应用[D];上海师范大学;2011年
8 孙瑞娜;基于最大熵的哈萨克语基本名词短语识别研究[D];新疆大学;2011年
9 李国佳;汉语全文相似度计算的研究及应用[D];电子科技大学;2011年
10 陈飞宏;基于向量空间模型的中文文本相似度算法研究[D];电子科技大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 秦学勇;;基于相似度计算的主观题阅卷系统设计[J];安徽建筑工业学院学报(自然科学版);2010年04期
2 周宏宇;张政;;中文分词技术综述[J];安阳师范学院学报;2010年02期
3 龚书;瞿有利;田盛丰;;基于语义的自动文摘研究综述[J];北京交通大学学报;2009年05期
4 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
5 薛为民;陆玉昌;;文本挖掘技术研究[J];北京联合大学学报(自然科学版);2005年04期
6 李钝;曹元大;万月亮;;Internet中的新词识别[J];北京邮电大学学报;2008年01期
7 蒋溢;丁优;熊安萍;王化晶;;一种基于知网的词汇语义相似度改进计算方法[J];重庆邮电大学学报(自然科学版);2009年04期
8 周新媛;杜洁;何强;;基于共现的词聚类的研究[J];长沙大学学报;2007年02期
9 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;2003年06期
10 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
中国重要会议论文全文数据库 前1条
1 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前6条
1 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
2 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
3 杨梅;现代汉语合成词构词研究[D];南京师范大学;2006年
4 鲁松;自然语言处理中词相关性知识无导获取和均衡分类器构建[D];中国科学院研究生院(计算技术研究所);2001年
5 何清;机器学习与文本挖掘若干算法研究[D];中国科学院研究生院(计算技术研究所);2002年
6 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年
中国硕士学位论文全文数据库 前10条
1 李威;基于向量空间的文本自动分类系统的研究和实现[D];兰州理工大学;2005年
2 代建英;汉语自动分词系统的研究与实现[D];重庆大学;2005年
3 陈治纲;基于向量空间模型的文本分类系统研究与实现[D];天津大学;2005年
4 李飒;基于GATE的中文信息抽取系统的开发和实现[D];中国科学院研究生院(文献情报中心);2006年
5 沈斌;基于分词的中文文本相似度计算研究[D];天津财经大学;2006年
6 王宇;基于TFIDF的文本分类算法研究[D];郑州大学;2006年
7 张玉娟;基于《知网》的句子相似度计算的研究[D];中国地质大学(北京);2006年
8 钟配蓉;基于Web挖掘的文本预处理研究及应用[D];湖南大学;2006年
9 李康;自然语言理解中的语义形式化研究[D];西北工业大学;2007年
10 于歌;搜索引擎中自动分类关键技术研究[D];燕山大学;2006年
【二级引证文献】
中国期刊全文数据库 前1条
1 阮光册;;基于文本挖掘的网络新闻报道差异分析[J];情报科学;2012年01期
中国重要会议论文全文数据库 前1条
1 ;A Mobile Reading Service System Based On Personalized Recommendation[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
中国硕士学位论文全文数据库 前8条
1 戴依若;基于内容的中文流行病新闻主题分类[D];北京邮电大学;2011年
2 郭振强;微博客的多重性应用研究与交互设计[D];北京邮电大学;2011年
3 张晓红;基于信息熵的粗糙集理论的研究和应用[D];安徽大学;2011年
4 徐小乐;搜索引擎个性化检索及用户推荐功能的设计与实现[D];重庆交通大学;2011年
5 郭建;基于云计算的海量电子病历文本分析系统研究[D];上海交通大学;2011年
6 周强;多媒体个性化建模与检索[D];华中科技大学;2011年
7 徐元浩;基于潜在语义分析的专利文献分析与搜索技术的研究[D];浙江大学;2010年
8 王鹏;基于语义体与文本聚类的中文垃圾邮件过滤方法研究[D];兰州理工大学;2012年
【二级参考文献】
中国期刊全文数据库 前5条
1 冯嘉礼,董占球;基于属性抽取和整合的感觉神经检测模型[J];计算机研究与发展;1997年07期
2 李珩;杨峰;朱靖波;姚天顺;;基于增益的隐马尔科夫模型的文本组块分析[J];计算机科学;2004年02期
3 周强,孙茂松,黄昌宁;汉语句子的组块分析体系[J];计算机学报;1999年11期
4 张昱琪,周强;汉语基本短语的自动识别[J];中文信息学报;2002年06期
5 赵军,黄昌宁;基于转换的汉语基本名词短语识别模型[J];中文信息学报;1999年02期
【相似文献】
中国期刊全文数据库 前10条
1 陈明远,管汀鹭;打字能比说话更快——几种高速键盘的设计[J];自然杂志;1980年08期
2 唐亚伟;亚伟中文速录机的诞生与应用[J];中文信息;1994年05期
3 胡宜课;信息高速公路与中文信息处理技术[J];计算机工程;1996年S1期
4 张俊林;曲为民;杜林;孙玉芳;;跨语言信息检索研究进展[J];计算机科学;2004年07期
5 罗燕;中文信息检索系统中的自然语言理解技术研究[J];图书情报工作;2005年04期
6 谢谦;芮建武;吴健;;编码字符集标准及分类研究[J];中文信息学报;2006年05期
7 陈丹;李宁;李亮;;古文字的联机手写识别研究[J];北京机械工业学院学报;2008年04期
8 林浩;韩冰;杨乐华;;一种基于改进最大匹配快速中文分词算法[J];科技创新导报;2009年09期
9 吴新年;数字图书馆技术之进展[J];图书与情报;2000年02期
10 高定国,龚育昌;现代藏字全集的属性统计研究[J];中文信息学报;2005年01期
中国重要会议论文全文数据库 前10条
1 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
2 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
4 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
5 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
6 李毅;亢世勇;孙茂松;孙道功;;基于奥运语料的语义成分标注规范[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 徐志明;丛帅;王宇颖;雷萌;;基于仿生模式识别文本分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
8 诺明花;张立强;刘汇丹;吴健;丁治明;;汉藏短语抽取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 莫锦贤;马常楼;;文本文件转换成语音文件及其合成输出[A];第二届全国人机语音通讯学术会议论文集[C];1992年
10 黄永光;刘挺;车万翔;胡晓光;;面向变异短文本的快速聚类算法[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
中国重要报纸全文数据库 前10条
1 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
2 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
3 倪光南;活力重现的中文信息处理[N];计算机世界;2001年
4 齐悦;速记界泰斗唐亚伟 获中文信息处理领域最高科技奖[N];中国质量报;2006年
5 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年
6 记者 段佳;中文信息处理技术加速前行[N];大众科技报;2009年
7 记者 韩晓玲通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年
8 水手;为IM软件上把锁[N];电脑报;2004年
9 本报记者 毛国兵 通讯员 岚宇;亚伟速录:实现中文信息处理产业化的自主品牌[N];中国贸易报;2008年
10 胡唯元;文字编码新标准:不再为“名”所累[N];科技日报;2006年
中国博士学位论文全文数据库 前10条
1 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
2 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
3 周卫华;面向中文信息处理的现代汉语动宾语义搭配研究[D];华中师范大学;2007年
4 王乐;短语消息聚类相关技术研究[D];国防科学技术大学;2008年
5 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
6 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
7 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
8 吕艳辉;基于语料库的现代汉语手部动词研究[D];山东大学;2008年
9 陈慧;基于DCC动态流通语料库的中文组织名考察与研究[D];北京语言大学;2008年
10 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 陶东成;基于Linux和XIM协议的中文输入法服务器的实现及其应用[D];苏州大学;2004年
2 罗忠毅;数字化中医古籍的理想模式及其相关问题研究[D];成都中医药大学;2005年
3 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
4 党兰学;汉字语法语义智能输入法总体设计与部分实现[D];河南大学;2006年
5 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年
6 白晓梅;校园网中文搜索引掣系统的设计与实现[D];吉林大学;2006年
7 曹林峰;中文文字差错率统计软件的实现[D];西安电子科技大学;2007年
8 刘桂梅;周有光语文改革思想研究[D];山东师范大学;2005年
9 张玉华;基于码本的输入法评测系统的设计和实现[D];苏州大学;2005年
10 杜莹;汉字语法语义智能输入法核心算法及实现技术[D];河南大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026