收藏本站
《计算机技术与发展》 2011年07期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于k-means聚类算法的研究

黄韬  刘胜辉  谭艳娜  
【摘要】:分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机选取初始聚类中心的影响较大的缺点,提出一种改进算法。通过将对数据集的多次采样,选取最终较优的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响度大大降低;同时,在选取初始聚类中心后,对初值进行数据标准化处理,使聚类效果进一步提高。通过UCI数据集上的数据对新算法Hk-means进行检测,结果显示Hk-means算法比原始的k-means算法在聚类效果上有显著的提高,并对相关领域有借鉴意义。

【引证文献】
中国期刊全文数据库 前6条
1 王晶;孙世群;邵超;孙尔宝;;模糊聚类分析法在水质监测断面优化中的应用[J];广州化工;2012年07期
2 吴琰嘉;唐正宁;李俊锋;;CIEL*a*b*色空间中基于爬山聚类算法的网点面积率检测研究[J];包装工程;2012年19期
3 米晓萍;张建峰;;网络舆情算法的研究与应用[J];计算机光盘软件与应用;2012年22期
4 杨通辉;高玲;臧丽;;基于相似性的商品陈列研究[J];微型机与应用;2012年05期
5 詹辉煌;朱敏琛;;一种改进的动态K-means聚类算法[J];微型机与应用;2012年20期
6 张磊;张公让;张金广;;一种网格化聚类算法的MapReduce并行化研究[J];计算机技术与发展;2013年02期
中国重要会议论文全文数据库 前1条
1 林泽桢;白雪;;基于密度流的聚类算法[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
中国硕士学位论文全文数据库 前6条
1 鲍存军;动态重传网络隐蔽信道的研究[D];南京理工大学;2011年
2 刘云芳;利用卫星定位系统数据分析交通问题[D];华中师范大学;2012年
3 米也塞·艾尼玩;基于Python的维吾尔文文本聚类系统设计与实现[D];新疆大学;2012年
4 刘超;无预设类别数的大数据量聚类算法研究[D];南京师范大学;2012年
5 杨欢;邻域重叠社团结构的动态证券网络研究[D];华东师范大学;2012年
6 王晶;巢湖流域地表水环境监测网络优化研究[D];合肥工业大学;2012年
【参考文献】
中国期刊全文数据库 前6条
1 周水庚,周傲英,曹晶,胡运发;一种基于密度的快速聚类算法[J];计算机研究与发展;2000年11期
2 毕华;梁洪力;王珏;;重采样方法与机器学习[J];计算机学报;2009年05期
3 赵伟;张姝;李文辉;;改进K-means的空间聚类算法[J];计算机应用研究;2008年07期
4 孙吉贵;刘杰;赵连宇;;聚类算法研究[J];软件学报;2008年01期
5 雷小锋;谢昆青;林帆;夏征义;;一种基于K-Means局部最优性的高效聚类算法[J];软件学报;2008年07期
6 聂跃光;陈立潮;陈湖;;基于密度的空间聚类算法研究[J];计算机技术与发展;2008年08期
【共引文献】
中国期刊全文数据库 前10条
1 李广水;宋丁全;;数据分析在森林资源调查中的应用及发展研究[J];安徽农业科学;2009年22期
2 左国才;周荣华;符开耀;;基于DBSCAN算法的电信客户分类的应用研究[J];北京联合大学学报(自然科学版);2012年03期
3 李晓方;武仲科;樊亚春;周明全;柳勇光;;一种新的用于三维检索的快速邻域搜索方法[J];北京师范大学学报(自然科学版);2011年05期
4 章林柯;崔立林;;潜艇机械噪声源分类识别的小样本研究思想及相关算法评述[J];船舶力学;2011年08期
5 孙英娟;杨柳;何昆鸟;;属性离散化算法研究[J];长春师范学院学报(人文社会科学版);2009年12期
6 陈庆枝;陈国龙;郭文忠;陈仕涛;;信息安全评估日志数据的一种混合聚类算法[J];重庆工学院学报(自然科学版);2009年10期
7 殷宏威;赵伟;杨志伟;;蚁群算法在KNN文本分类中的应用[J];长春理工大学学报(自然科学版);2010年01期
8 张平;党选举;陈皓;杨文雷;;基于熵特征优选分组聚类的相似重复记录检测[J];传感器与微系统;2011年11期
9 陆娟;汤国安;张宏;蒋平;吴伟;;犯罪热点时空分布研究方法综述[J];地理科学进展;2012年04期
10 冯晓蒲;张铁峰;;基于实际负荷曲线的电力用户分类技术研究[J];电力科学与工程;2010年09期
中国重要会议论文全文数据库 前10条
1 曾成;赵锡均;徐红;;基于量子遗传算法的聚类方法[A];第二十九届中国控制会议论文集[C];2010年
2 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
3 ;A Fuzzy Neural Network System Modeling Method Based on Data-driven[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
4 刘保政;汪定伟;;基于多因素的相近距离聚类方法研究[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
5 张立涛;张宇峰;;基于聚类分析的大型桥梁结构健康监测数据异常识别研究[A];第21届全国结构工程学术会议论文集第Ⅱ册[C];2012年
6 宫蕊;舒红平;郭远远;;基于DBSCAN的密度聚类算法的研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
7 刘彤;孙永香;张振洪;;一种有效的基于密度和层次的聚类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
8 康卫鲜;叶德谦;;基于CURE的聚类算法研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
9 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
10 王鲲;;重采样技术[A];定量药理研究方法学培训班讲义[C];2010年
中国博士学位论文全文数据库 前10条
1 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
2 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
3 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
4 徐红波;基于空间填充曲线高维空间查询算法研究[D];哈尔滨理工大学;2010年
5 尹可挺;Internet环境中基于QoS的Web服务组合研究[D];浙江大学;2010年
6 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
7 苏晓珂;基于聚类的异常挖掘算法研究[D];东华大学;2010年
8 卓莹;基于拓扑·流量挖掘的网络态势感知技术研究[D];国防科学技术大学;2010年
9 陈彬;面向DEVS的多范式建模与仿真关键技术研究与实现[D];国防科学技术大学;2010年
10 高翠芳;模糊聚类新算法及应用研究[D];江南大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘文昊;基于模糊聚类和纹版辅助的织物疵点检测算法研究[D];浙江理工大学;2010年
2 李振;网络舆情预测关键技术研究[D];郑州大学;2010年
3 张书春;数据挖掘技术在SMS系统中的应用研究[D];郑州大学;2010年
4 丁金凤;基于网格与密度的数据流聚类算法研究[D];哈尔滨工程大学;2010年
5 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
6 刘萍;软件体系结构恢复的研究与实现[D];大连理工大学;2010年
7 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
8 王丹丹;基于数据挖掘的煤矿瓦斯事故预测方法研究[D];辽宁工程技术大学;2010年
9 李丹丹;基于权重设计的聚类融合算法研究及应用[D];辽宁工程技术大学;2009年
10 刘琼;基于群体智能的聚类算法研究[D];长沙理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 焦誉;赖建章;柯佳;;一种基于密度的网格动态聚类算法的研究[J];安徽大学学报(自然科学版);2007年01期
2 蔺照兰;王岩;张宪涛;解加成;孔明;;灰色聚类法在东昌湖水体富营养化评价中的应用[J];安徽农业科学;2010年22期
3 马飞;蒋莉;;河流水质监测断面优化设置研究——以南运河为例[J];环境科学与管理;2006年08期
4 李文斌;刘椿年;陈嶷瑛;;基于特征信息增益权重的文本分类算法[J];北京工业大学学报;2006年05期
5 陈路;李小东;;基于数字图像处理的印刷品网点面积率检测研究[J];包装工程;2005年06期
6 王晓红;衣永政;;印刷网点图像模糊聚类分割方法的研究[J];包装工程;2006年03期
7 高军;李学伟;张建;;彩色印刷品质量检测系统图像预处理算法的研究[J];包装工程;2007年01期
8 杨建强,林年丰;多目标模糊优选模型在环境质量评价中的应用[J];长春科技大学学报;2000年04期
9 王金龙;徐从富;徐娇芬;骆国靖;;利用销售数据的商品影响关系挖掘研究[J];电子科技大学学报;2007年06期
10 罗薇,邵秘华,周立新;聚类分析功能在大连港水域环境质量评价中的应用[J];大连海事大学学报;2004年04期
中国硕士学位论文全文数据库 前10条
1 陈松生;基于模糊聚类的非监督学习研究[D];南京师范大学;2007年
2 韦鲁玉;基于Agent的个性化智能信息检索系统[D];哈尔滨理工大学;2007年
3 姚清耘;基于向量空间模型的中文文本聚类方法的研究[D];上海交通大学;2008年
4 孙守义;基于聚类的教育资源个性化信息服务[D];南京师范大学;2008年
5 吴传伟;网络协议隐写检测技术的研究[D];南京理工大学;2008年
6 郑韫旸;基于k-平均算法的文本聚类系统研究与实现[D];武汉理工大学;2008年
7 张睿;基于k-means的中文文本聚类算法的研究与实现[D];西北大学;2009年
8 高娟;基于K-means算法的文本聚类的研究与实现[D];江西理工大学;2010年
9 刘慧;基于KNN的中文文本分类算法研究[D];西南交通大学;2010年
10 李梅;改进的K均值算法在中文文本聚类中的研究[D];安徽大学;2010年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 马思琦;基于即时语音通信的信息隐藏技术研究[D];南京理工大学;2012年
【二级参考文献】
中国期刊全文数据库 前4条
1 李洁;高新波;焦李成;;基于特征加权的模糊聚类新算法[J];电子学报;2006年01期
2 周水庚,周傲英,曹晶,胡运发;一种基于密度的快速聚类算法[J];计算机研究与发展;2000年11期
3 周水庚,范晔,周傲英;基于数据取样的DBSCAN算法[J];小型微型计算机系统;2000年12期
4 何中胜;刘宗田;庄燕滨;;基于数据分区的并行DBSCAN算法[J];小型微型计算机系统;2006年01期
【相似文献】
中国期刊全文数据库 前10条
1 茹蓓;赵芳;;聚类算法在图书馆中的应用[J];新乡学院学报(自然科学版);2011年01期
2 杨照峰;樊爱宛;樊爱京;;改进的SOM和K-Means结合的入侵检测方法[J];制造业自动化;2010年15期
3 李业丽;秦臻;;一种改进的k-means算法[J];北京印刷学院学报;2007年02期
4 黄韬;刘胜辉;谭艳娜;;基于k-means聚类算法的研究[J];计算机技术与发展;2011年07期
5 袁方;周志勇;宋鑫;;初始聚类中心优化的k-means算法[J];计算机工程;2007年03期
6 韩晓红;胡彧;;K-means聚类算法的研究[J];太原理工大学学报;2009年03期
7 张红荣;张峰;;传统的K-means聚类算法的研究与改进[J];咸阳师范学院学报;2010年04期
8 孙友友;郭晓燕;;决策树与聚类算法在数据挖掘中的研究及应用[J];科技创新导报;2007年34期
9 谭庆;;基于k-means聚类算法的试卷成绩分析研究[J];河南大学学报(自然科学版);2009年04期
10 耿筱媛;张燕平;闫屹;;改进的K-means算法在电信客户细分中的应用[J];计算机技术与发展;2008年05期
中国重要会议论文全文数据库 前10条
1 孙浩军;孔令俊;刘志辉;;利用高斯分布生成数据对聚类算法的比较[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
2 郑健;皮德常;;基于共享最近邻的聚类和孤立点检测算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
3 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
4 刘彤;孙永香;张振洪;;一种有效的基于密度和层次的聚类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
5 余琳;邓玲;;常见聚类算法的比较以及DSS系统中的应用[A];湖北省通信学会、武汉通信学会2009年学术年会论文集[C];2009年
6 武森;金海燕;高学东;;数据挖掘中CABOSFV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
7 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
8 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
9 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
10 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
2 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
3 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
4 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
5 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
6 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
7 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
8 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
9 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
10 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 谷垒;聚类算法及其在电信收入保障系统中的应用研究[D];湖南大学;2010年
2 高世光;基于模糊聚类的数据挖掘技术研究[D];国防科学技术大学;2002年
3 刘赫;一个基于聚类算法的推荐系统的设计与实现[D];吉林大学;2005年
4 孙玉侠;数据挖掘中的谱聚类算法研究[D];中国海洋大学;2010年
5 张树魁;网络文本信息聚类算法研究与应用[D];北京交通大学;2009年
6 李红;数据挖掘中特征选择与聚类算法研究[D];大连理工大学;2010年
7 刘方;数据挖掘中半监督K-均值聚类算法的研究与改进[D];吉林大学;2010年
8 刘凌云;基于数据挖掘的银行信用风险管理方法研究[D];广东工业大学;2005年
9 孙晓霞;聚类分析在客户细分领域的应用研究[D];西北大学;2006年
10 岳峰;聚类的边界点检测算法研究[D];郑州大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026