收藏本站
《计算机应用与软件》 2011年08期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于语义的VSM模型改进

苏喻  郑诚  马中杰  
【摘要】:文本聚类在很多领域都有广泛的应用,传统的文本聚类方法由于并不考虑语义因素,得出的聚类效果并不理想。利用语义对VSM模型进行变换,即基于语义对VSM模型的各维进行扭曲,将原本的正交坐标系基于语义变换为斜角坐标系,然后将文本的特征向量映射到变换后的VSM模型上再进行聚类,相对减小语义相关的特征向量间的语义距离,从而提高了文本聚类的召回率与查准率,并使得聚类的结果更加语义化。

【引证文献】
中国期刊全文数据库 前1条
1 左晓飞;刘怀亮;范云杰;赵辉;;基于概念语义场的文本聚类算法研究[J];情报杂志;2012年05期
中国硕士学位论文全文数据库 前1条
1 苏喻;基于语义的文本聚类搜索研究[D];安徽大学;2011年
【参考文献】
中国期刊全文数据库 前2条
1 姜华;;一种基于本体的概念语义相似度计算研究[J];计算机应用与软件;2009年07期
2 孙吉贵;刘杰;赵连宇;;聚类算法研究[J];软件学报;2008年01期
【共引文献】
中国期刊全文数据库 前10条
1 李广水;宋丁全;;数据分析在森林资源调查中的应用及发展研究[J];安徽农业科学;2009年22期
2 左国才;周荣华;符开耀;;基于DBSCAN算法的电信客户分类的应用研究[J];北京联合大学学报(自然科学版);2012年03期
3 李晓方;武仲科;樊亚春;周明全;柳勇光;;一种新的用于三维检索的快速邻域搜索方法[J];北京师范大学学报(自然科学版);2011年05期
4 章林柯;崔立林;;潜艇机械噪声源分类识别的小样本研究思想及相关算法评述[J];船舶力学;2011年08期
5 孙英娟;杨柳;何昆鸟;;属性离散化算法研究[J];长春师范学院学报(人文社会科学版);2009年12期
6 陈庆枝;陈国龙;郭文忠;陈仕涛;;信息安全评估日志数据的一种混合聚类算法[J];重庆工学院学报(自然科学版);2009年10期
7 殷宏威;赵伟;杨志伟;;蚁群算法在KNN文本分类中的应用[J];长春理工大学学报(自然科学版);2010年01期
8 陆娟;汤国安;张宏;蒋平;吴伟;;犯罪热点时空分布研究方法综述[J];地理科学进展;2012年04期
9 冯晓蒲;张铁峰;;基于实际负荷曲线的电力用户分类技术研究[J];电力科学与工程;2010年09期
10 钱宁;胡永东;吴国新;;P2P网络资源搜索中的用户行为模型[J];东南大学学报(自然科学版);2011年04期
中国重要会议论文全文数据库 前8条
1 曾成;赵锡均;徐红;;基于量子遗传算法的聚类方法[A];第二十九届中国控制会议论文集[C];2010年
2 ;A Fuzzy Neural Network System Modeling Method Based on Data-driven[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
3 刘保政;汪定伟;;基于多因素的相近距离聚类方法研究[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
4 张立涛;张宇峰;;基于聚类分析的大型桥梁结构健康监测数据异常识别研究[A];第21届全国结构工程学术会议论文集第Ⅱ册[C];2012年
5 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
6 余灿玲;王丽珍;张元武;;基于网格密度方向的聚类簇边缘精度加强算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
7 刘尊洋;汪作来;王自荣;余大斌;孙晓泉;;基于谱系法改进FCM的仿造迷彩主色提取方法[A];第九届全国光电技术学术交流会论文集(上册)[C];2010年
8 池晶晶;黄坚;杜博文;;基于VSP分布的北京道路划分[A];第七届中国智能交通年会优秀论文集——智能交通技术[C];2012年
中国博士学位论文全文数据库 前10条
1 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
2 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
3 徐红波;基于空间填充曲线高维空间查询算法研究[D];哈尔滨理工大学;2010年
4 尹可挺;Internet环境中基于QoS的Web服务组合研究[D];浙江大学;2010年
5 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
6 苏晓珂;基于聚类的异常挖掘算法研究[D];东华大学;2010年
7 卓莹;基于拓扑·流量挖掘的网络态势感知技术研究[D];国防科学技术大学;2010年
8 陈彬;面向DEVS的多范式建模与仿真关键技术研究与实现[D];国防科学技术大学;2010年
9 高翠芳;模糊聚类新算法及应用研究[D];江南大学;2011年
10 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘文昊;基于模糊聚类和纹版辅助的织物疵点检测算法研究[D];浙江理工大学;2010年
2 李振;网络舆情预测关键技术研究[D];郑州大学;2010年
3 丁金凤;基于网格与密度的数据流聚类算法研究[D];哈尔滨工程大学;2010年
4 刘萍;软件体系结构恢复的研究与实现[D];大连理工大学;2010年
5 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
6 李丹丹;基于权重设计的聚类融合算法研究及应用[D];辽宁工程技术大学;2009年
7 刘琼;基于群体智能的聚类算法研究[D];长沙理工大学;2010年
8 邵帅;基于数据场的聚类可视化算法研究与应用[D];西北民族大学;2010年
9 孙大朋;入侵检测中模糊C-均值聚类算法研究[D];哈尔滨理工大学;2010年
10 王瑛;基于模糊聚类的入侵检测算法研究[D];江西理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 臧哲慧;冯静;;语义场理论与英语词汇教学管窥[J];边疆经济与文化;2011年07期
2 冯少荣;肖文俊;;基于语义距离的高效文本聚类算法[J];华南理工大学学报(自然科学版);2008年05期
3 冯少荣;肖文俊;;基于密度的DBSCAN聚类算法的研究及应用[J];计算机工程与应用;2007年20期
4 易宝林;伍仪强;丰大洋;张小莉;;基于DBSCAN的批量更新聚类算法[J];计算机工程;2009年02期
5 金阳;左万利;;一种基于动态近邻选择模型的聚类算法[J];计算机学报;2007年05期
6 荣秋生,颜君彪,郭国强;基于DBSCAN聚类算法的研究与实现[J];计算机应用;2004年04期
7 白旭;靳志军;;K-中心点聚类算法优化模型的仿真研究[J];计算机仿真;2011年01期
8 袁军鹏;朱东华;李毅;李连宏;黄进;;文本挖掘技术研究进展[J];计算机应用研究;2006年02期
9 姜华;;一种基于本体的概念语义相似度计算研究[J];计算机应用与软件;2009年07期
10 廖莎莎;江铭虎;;中文文本分类中基于概念屏蔽层的特征提取方法[J];中文信息学报;2006年03期
中国重要会议论文全文数据库 前1条
1 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前2条
1 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年
2 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
中国硕士学位论文全文数据库 前6条
1 戴涛;聚类分析算法研究[D];清华大学;2005年
2 周昭涛;文本聚类分析效果评价及文本表示研究[D];中国科学院研究生院(计算技术研究所);2005年
3 苏映雪;特征选择算法研究[D];国防科学技术大学;2006年
4 于智航;改进的密度聚类算法研究[D];大连理工大学;2007年
5 李伯阳;文本聚类方法研究及其应用[D];厦门大学;2008年
6 孔静;基于语义和领域相关的文本聚类研究[D];中国石油大学;2009年
【二级参考文献】
中国期刊全文数据库 前1条
1 李洁;高新波;焦李成;;基于特征加权的模糊聚类新算法[J];电子学报;2006年01期
【相似文献】
中国期刊全文数据库 前10条
1 姜宁,史忠植;文本聚类中的贝叶斯后验模型选择方法[J];计算机研究与发展;2002年05期
2 韩腊萍,余雪丽;一个分布式入侵检测系统框架设计[J];计算机工程;2004年13期
3 郭庆琳,樊孝忠;基于文本聚类和NLU的自动文摘系统的研究与实现[J];现代电力;2004年04期
4 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
5 郭庆琳;樊孝忠;柳长安;;基于文本聚类的自动文摘系统的研究与实现[J];计算机工程;2006年04期
6 巩知乐;张德贤;;文本挖掘理论概述[J];福建电脑;2008年09期
7 姚清耘;刘功申;李翔;;基于向量空间模型的文本聚类算法[J];计算机工程;2008年18期
8 门国尊;;用于信息检索的文本聚类技术[J];今日科苑;2008年20期
9 李众;梁志剑;;一种改进的文本聚类算法[J];陕西科技大学学报(自然科学版);2008年06期
10 张春炉;沈建京;;基于SOM算法的文本聚类实现[J];计算机与现代化;2010年01期
中国重要会议论文全文数据库 前10条
1 张猛;王大玲;于戈;;一种基于自动阈值发现的文本聚类方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 董婧灵;李芳;何婷婷;涂新辉;万剑;;基于LDA模型的文本聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 王乐;田李;贾焰;韩伟红;;一个并行的文本聚类混合算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
4 张宝艳;王庆辉;;中文文本聚类的研究与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
5 张刚;周昭涛;王斌;;基于主题的分布式信息检索研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
6 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 王莹;刘杨;;维基百科的文本聚类方法分析[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
8 黎琳;;Web内容挖掘在数字图书馆中的应用[A];中国工程物理研究院第七届电子技术青年学术交流会论文集[C];2005年
9 彭怡;;从数据挖掘文章聚类分析看其发展趋势[A];现代工业工程与管理研讨会会议论文集[C];2006年
10 朱强生;田英;周延泉;何华灿;;基于非负因子分析的模糊文本挖掘[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
中国重要报纸全文数据库 前2条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
2 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
2 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
3 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
4 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
5 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
6 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
7 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
8 宣照国;文本挖掘算法及其在知识管理中的应用研究[D];大连理工大学;2008年
9 王乐;短语消息聚类相关技术研究[D];国防科学技术大学;2008年
10 杨创新;基于机器学习的高性能中文文本分类研究[D];华南理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 何晏成;基于近邻传播和凝聚层次的文本聚类方法[D];哈尔滨工业大学;2010年
2 张金;个性化信息检索系统中文本聚类的研究[D];东北师范大学;2010年
3 庞俊;基于确定话题和情感极性的博客文本聚类研究[D];武汉理工大学;2010年
4 李梅;改进的K均值算法在中文文本聚类中的研究[D];安徽大学;2010年
5 王飞;基于蚁群优化的模糊文本聚类算法研究[D];河南工业大学;2010年
6 赵颖;基于Ontology的Web文本聚类研究[D];西华大学;2011年
7 盛江涛;网络论坛话题发现与跟踪技术研究[D];哈尔滨工业大学;2010年
8 刘延亮;一种文本聚类原型系统的设计与实现[D];大连理工大学;2006年
9 谷波;基于粗集模型的聚类方法及其在文献过滤系统中的应用[D];山西大学;2004年
10 胡海龙;基于改进的后缀树算法的中英文聚类引擎的实现[D];吉林大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026