收藏本站
收藏 | 投稿 | 论文排版

基于初始中心优化的遗传K-means聚类新算法

孙秀娟  刘希玉  
【摘要】:一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力。传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出了一种优化初始中心的K-means算法,该算法选择相距最远的处于高密度区域的k个数据对象作为初始聚类中心。实验表明该算法不仅具有对初始数据的弱依赖性,而且具有收敛快,聚类质量高的特点。为体现聚类的有效性,获得更高精度的聚类结果,提出了将优化的K-means算法(PKM)和遗传算法相结合的混合算法(PGKM),该算法在提高紧凑度(类内距)和分离度(类间距)的同时自动搜索最佳聚类数k,对k个初始中心优化后再聚类,不断地循环迭代,得到满足终止条件的最优聚类。实验证明该算法具有更好的聚类质量和综合性能。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨晓庆;左为恒;李昌春;;基于K-Means变异算子的混合PSO算法聚类研究[J];微电子学与计算机;2011年07期
2 仝雪姣;孟凡荣;王志晓;;对k-means初始聚类中心的优化[J];计算机工程与设计;2011年08期
3 黄韬;刘胜辉;谭艳娜;;基于k-means聚类算法的研究[J];计算机技术与发展;2011年07期
4 陶惠;张妍;郝光权;;基于向量空间的文档聚类算法分析[J];电脑知识与技术;2011年20期
5 吴夙慧;成颖;郑彦宁;潘云涛;;K-means算法研究综述[J];现代图书情报技术;2011年05期
6 韦相;李志勇;朱永缤;;基于质心的样本加权聚类算法[J];成都大学学报(自然科学版);2011年02期
7 刘海峰;姚泽清;刘守生;;一种基于模糊加权的改进文本聚类方法[J];微电子学与计算机;2011年09期
8 贾丙静;吴长勤;葛华;;Web文本聚类的研究与实现[J];长春师范学院学报;2011年06期
9 丁明;熊才权;;群体研讨环境中面向主张的关联规则分析[J];计算机与数字工程;2011年06期
10 张宇;邵良杉;邱云飞;刘威;;基于竞争学习的K质心组合聚类算法[J];计算机工程;2011年15期
11 袁可红;李艳晓;郭海湘;诸克军;;一种用于储层含油性识别的蚁群聚类算法[J];计算机工程;2011年13期
12 李玮;薛惠锋;詹海亮;;基于划分采样的初始聚类中心算法[J];太原理工大学学报;2011年04期
13 陈英;何中市;;关联规则在高职学生综合素质测评分析中的应用[J];西南师范大学学报(自然科学版);2011年04期
14 李洪波;;基于减法聚类和快速紧密性函数的SF-FCM[J];控制与决策;2011年07期
15 ;基于模糊聚类的网络文本数据检测方法[J];技术与市场;2011年07期
16 钟映春;戚剑;刘小林;张淼;;从图像中提取离散点状神经功能束边缘的研究[J];系统仿真学报;2011年07期
17 张大明;符茂胜;罗斌;;基于广义积分平方误差谱选择的图像分割[J];模式识别与人工智能;2011年02期
18 纪则轩;潘瑜;陈强;孙权森;夏德深;;无监督模糊C均值聚类自然图像分割算法[J];中国图象图形学报;2011年05期
19 钟将;刘龙海;梁传伟;;基于成对约束的主动半监督文本聚类[J];计算机工程;2011年13期
20 陈伟;陈璟;孙俊;须文波;;一种量子行为粒子群优化动态聚类算法[J];计算机应用研究;2011年07期
中国重要会议论文全文数据库 前10条
1 高翠芳;吴小俊;;基于二阶差分的聚类数自动确定方法[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
2 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
3 毕硕本;裴安平;陈济民;闾国年;;聚类算法在姜寨一期聚落考古中的应用研究[A];中国地理学会2004年学术年会暨海峡两岸地理学术研讨会论文摘要集[C];2004年
4 李芬;吴俊杰;张际春;;基于数据挖掘的移动通信业客户细分研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
5 陈伯伦;陈崚;王俊生;;一种基于距离调节的聚类算法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
6 王珺;刘希玉;;基于BIRCH算法和K-MEANS算法相结合的数据挖掘聚类技术[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年
7 蔡军;袁华鹏;陈金海;施伯乐;;一种基于相似性分析的聚类新算法:PDS算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
8 饶金通;董槐林;姜青山;;基于孤立因子的层次聚类算法与应用[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 张勇斌;梁荣华;马杰;马玉书;;神经网络数据挖掘聚类优化算法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
10 付振中;赵合计;董玉振;;基于HSL颜色空间的模糊C均值彩色图像分割方法[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 曲建华;基于群体智能的聚类分析[D];山东师范大学;2010年
2 宗瑜;聚类质量改进方法的研究[D];大连理工大学;2010年
3 邱浪波;基因芯片表达数据分析相关问题研究[D];国防科学技术大学;2007年
4 李艳灵;基于聚类的图像分割算法研究[D];华中科技大学;2009年
5 刘慧婷;基于经验模态分解及动态数据挖掘的商务数据分析方法研究[D];合肥工业大学;2008年
6 陈伟;群体智能算法及其在基因表达数据聚类中的应用[D];江南大学;2011年
7 覃桂敏;复杂网络模式挖掘算法研究[D];西安电子科技大学;2012年
8 李翠玲;粗糙集理论研究及其在虚拟装配系统中的应用[D];同济大学;2007年
9 舒振宇;网格曲面的分割算法及其应用[D];浙江大学;2010年
10 刘守群;海量网络视频快速检索关键技术研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨军;聚类分析及其在大类别汉字识别中的应用[D];华南理工大学;2007年
2 赵兴旺;基于信息熵的聚类个数确定方法研究[D];山西大学;2011年
3 万明傲;聚类分析在大连供电公司CRM系统上的应用研究[D];大连交通大学;2008年
4 查丰;引力聚类及其应用研究[D];安徽大学;2011年
5 杨凌;聚类分析中聚类数的确定问题[D];武汉科技大学;2001年
6 叶蕾;数据挖掘在电信客户细分领域的应用[D];昆明理工大学;2004年
7 黄彦;基于高校人力资源的数据挖掘技术研究[D];天津大学;2004年
8 于亚飞;基于划分和密度的聚类算法研究[D];安徽大学;2011年
9 陈爱平;基于Hadoop的聚类算法并行化分析及应用研究[D];电子科技大学;2012年
10 姚世通;基于隐马尔可夫模型的时间序列聚类的研究[D];上海交通大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978