收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

特征加权距离与软子空间学习相结合的文本聚类新方法

王骏  王士同  邓赵红  
【摘要】:文本数据维数高、数据分布稀疏、不同类别的特征相互重叠,这为聚类分析提出了挑战.针对文本数据的这一特点,将特征加权技术与软子空间相结合,基于模糊聚类的算法框架,提出了一种适用于高维文本数据的软子空间模糊聚类新方法.首先,基于加权范数理论,提出了新的特征加权距离计算方法.接着,将其与软子空间学习的理论框架相结合,提出了面向模糊聚类的新的目标学习准则.通过向约束条件中引入熵指数r,从而扩展了模糊指数m的取值范围,并给出了物理解释.基于Zangwill收敛定理对算法的全局收敛性给出理论证明.实验表明,文中算法可以使软子空间学习和聚类分析同时进行,其性能比现有的相关算法有了较大的提高.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘海峰;姚泽清;刘守生;;一种基于模糊加权的改进文本聚类方法[J];微电子学与计算机;2011年09期
2 胡宁静,王靖;基于模糊c均值算法文档聚类问题的研究[J];长沙电力学院学报(自然科学版);2004年04期
3 王月;柴瑞敏;;减聚类的模糊C-均值算法在文本分类中的应用[J];计算机系统应用;2010年03期
4 杜长海;吉根林;;模糊聚类在中文文本分类中的应用研究[J];计算机工程与应用;2006年08期
5 郭庆琳,樊孝忠;基于文本聚类和NLU的自动文摘系统的研究与实现[J];现代电力;2004年04期
6 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
7 郭庆琳;樊孝忠;柳长安;;基于文本聚类的自动文摘系统的研究与实现[J];计算机工程;2006年04期
8 巩知乐;张德贤;;文本挖掘理论概述[J];福建电脑;2008年09期
9 姚清耘;刘功申;李翔;;基于向量空间模型的文本聚类算法[J];计算机工程;2008年18期
10 门国尊;;用于信息检索的文本聚类技术[J];今日科苑;2008年20期
11 李众;梁志剑;;一种改进的文本聚类算法[J];陕西科技大学学报(自然科学版);2008年06期
12 张春炉;沈建京;;基于SOM算法的文本聚类实现[J];计算机与现代化;2010年01期
13 王和春;宫迅凯;;用模糊聚类Fuzzy C-Means算法实现图像分割[J];光学精密工程;1991年04期
14 纪丰民;罗辽复;;核酸序列的模糊聚类与分子进化[J];内蒙古大学学报(自然科学版);1992年02期
15 马玉春,宋瀚涛;基于搜索引擎的知识发现[J];计算机工程与应用;2004年30期
16 董晨,方晓彤,陈国龙;模糊聚类在个性化搜索引擎中的应用[J];福建电脑;2004年12期
17 马辉民;李卫华;吴良元;;VSM在中文文本聚类中的应用及实证分析[J];武汉理工大学学报(信息与管理工程版);2006年04期
18 张刚;周昭涛;王斌;;基于主题的分布式信息检索技术研究[J];计算机工程;2006年12期
19 曲皎;李白桦;;基于KL准则层次文本聚类[J];辽宁师范大学学报(自然科学版);2008年01期
20 李华云;;基于潜在语义分析的中文文本聚类方法研究[J];科技情报开发与经济;2008年27期
中国重要会议论文全文数据库 前10条
1 江宝钏;张森;胡兰清;;无指导的模糊聚类的多回波脑部磁共振图像分割[A];中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C];1998年
2 李小平;焦李成;;信息颗粒在数据模糊聚类中的应用与构造[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
3 王克刚;耿国华;;基于小波平滑直方图的模糊聚类图像分割方法[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
4 杨志清;柳本民;郭忠印;杜晓丽;齐莹菲;;一种基于模糊聚类的高速公路网分区算法[A];第一届中国智能交通年会论文集[C];2005年
5 石鸿雁;贝肇宇;;基于蚁群算法的图像匹配方法[A];2009中国控制与决策会议论文集(3)[C];2009年
6 何宁;周田华;;模糊聚类在颜色识别中的应用[A];2005年海峡两岸三地无线科技学术会论文集[C];2005年
7 朱辉;李在铭;;基于模糊聚类的图像阀值处理方法及其在医学中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
8 赵锋;赵荣椿;;基于多特征图象、模糊聚类的分层分块的纹理分割方法[A];中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C];1998年
9 潘薇;游志胜;吴鹍;王宁;;基于模糊聚类和卡尔曼滤波的运动目标检测[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
10 王丽丽;肖德贵;;基于小波变换的彩色图像分割[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
中国博士学位论文全文数据库 前10条
1 李春生;模糊聚类的组合方法及其应用研究[D];湖南大学;2010年
2 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
3 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
4 王晓丹;基于模糊聚类及神经网络的纹理分割方法研究[D];西北工业大学;2000年
5 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
6 高翠芳;模糊聚类新算法及应用研究[D];江南大学;2011年
7 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
8 赵恒;数据挖掘中聚类若干问题研究[D];西安电子科技大学;2005年
9 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
10 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
中国硕士学位论文全文数据库 前10条
1 王飞;基于蚁群优化的模糊文本聚类算法研究[D];河南工业大学;2010年
2 何晏成;基于近邻传播和凝聚层次的文本聚类方法[D];哈尔滨工业大学;2010年
3 张金;个性化信息检索系统中文本聚类的研究[D];东北师范大学;2010年
4 李梅;改进的K均值算法在中文文本聚类中的研究[D];安徽大学;2010年
5 赵颖;基于Ontology的Web文本聚类研究[D];西华大学;2011年
6 刘延亮;一种文本聚类原型系统的设计与实现[D];大连理工大学;2006年
7 谷波;基于粗集模型的聚类方法及其在文献过滤系统中的应用[D];山西大学;2004年
8 胡海龙;基于改进的后缀树算法的中英文聚类引擎的实现[D];吉林大学;2008年
9 张猛;文本聚类中参数自动设置技术的研究与实现[D];东北大学;2005年
10 涂继亮;基于数据挖掘的智能客户关系管理系统研究[D];哈尔滨理工大学;2005年
中国重要报纸全文数据库 前1条
1 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978