收藏本站
《计算机科学》 2002年07期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

初始中心优化的K-Means聚类算法

李飞  薛彬  黄亚楼  
【摘要】:正 1.引言聚类分析(clustering)是人工智能研究的重要领域。聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域。各种聚类方法中,基于目标函数的K-Means聚类方法应用极为广泛,根据聚类结果的表达方式又可分为硬K-Means(HCM)算法、模糊K-Means算法(FCM)和概率K-Means算法(PCM)。各种K-Means算法都以确定的目标函数来测度聚类的效果,最佳的聚类效果对应于目标函数的极值点。由于目标函数局部极小值点的存在以及算法的贪心性,导致聚类结果对初始中心敏感,往往达不到全局最优。

知网文化
【引证文献】
中国期刊全文数据库 前10条
1 谷波,张永奎;文本聚类算法的分析与比较[J];电脑开发与应用;2003年11期
2 贾丙静;吴长勤;葛华;;Web文本聚类的研究与实现[J];长春师范学院学报;2011年06期
3 杨昕;彭玉青;;结合蚂蚁算法的K-Means聚类分析[J];河北工业大学学报;2007年03期
4 朱贵良;赵凯;赵锋;;基于组合优化方法的K-means聚类算法实现[J];华北水利水电学院学报;2007年05期
5 蒋庆丰;李梓;程晓旭;;K-Means聚类算法研究及图形演示的实现[J];信息技术;2010年03期
6 孙祥;赵勇;;基于就业吸引力的大学生区域流向分类研究[J];黄冈师范学院学报;2010年03期
7 赵锋;薛惠锋;王伟;;基于复合形遗传算法的K-means优化聚类方法[J];航空计算技术;2006年05期
8 龚静;李英杰;;文本聚类算法的分析与比较[J];湖南环境生物职业技术学院学报;2006年03期
9 吴铁洲;孙杨;夏防震;;有标记的文本聚类方法研究[J];舰船电子工程;2009年04期
10 邱苏林;王丽珍;;基于Ward’s方法的k-平均优化算法及其应用[J];计算机工程与应用;2008年31期
中国重要会议论文全文数据库 前1条
1 孙祥;庆承松;;大学生就业区域流向成因研究[A];中国企业运筹学[C];2009年
中国博士学位论文全文数据库 前4条
1 薛士龙;船舶电力推进仿真装置及其关键技术的研究[D];上海海事大学;2006年
2 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
3 强彦;数据库负载自适应技术研究[D];太原理工大学;2010年
4 任鸿;基于异构网络的知识挖掘与服务关键技术研究[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘巍;基于聚类的孤立点发现技术研究及其在审计中的应用[D];中国海洋大学;2010年
2 钟晓旭;基于Web招聘信息的文本挖掘系统研究[D];合肥工业大学;2010年
3 何革;基于决策树的短期负荷预测系统研究与实现[D];华中科技大学;2010年
4 栾丽华;聚类算法研究[D];南京师范大学;2004年
5 陈浩;基于二阶上下文的无导词义消歧研究[D];华中师范大学;2005年
6 谢芳;特定领域术语的自动获取[D];华中师范大学;2006年
7 陈斌;中国现代化支付系统模式分析的关键技术研究[D];上海交通大学;2006年
8 赵锋;数据挖掘技术及其在超市CRM中的应用[D];西北工业大学;2007年
9 范光平;一种基于变长编码的遗传K均值算法研究[D];浙江大学;2007年
10 吕青普;科技文档的分类与查重[D];天津财经大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 陈键;;浅析常用聚类分析算法[J];安徽电子信息职业技术学院学报;2007年01期
2 张燕平;提取特征规则的重复覆盖算法(RCA)[J];安徽大学学报(自然科学版);2002年02期
3 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
4 张红云,石阳,马垣;数据挖掘中聚类算法比较研究[J];鞍山钢铁学院学报;2001年05期
5 李季,迟呈英;中文问答系统的研究[J];鞍山科技大学学报;2003年06期
6 崔柔刚,温阳东;数据挖掘技术在医院信息管理中的应用[J];安徽水利水电职业技术学院学报;2004年01期
7 税仪冬;瞿有利;黄厚宽;;周期分类和Single-Pass聚类相结合的话题识别与跟踪方法[J];北京交通大学学报;2009年05期
8 孙雪;李昆仑;胡夕坤;赵瑞;;基于半监督K-means的K值全局寻优算法[J];北京交通大学学报;2009年06期
9 胡俊峰,俞士汶;唐宋诗之计算机辅助深层研究[J];北京大学学报(自然科学版);2001年05期
10 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
中国重要会议论文全文数据库 前7条
1 侯士江;刘国华;余靖;褚兵义;;空间网络数据库中的k个最近邻查询算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
2 塔娜;刘慧;邵大欣;;网络系统可用度全面评估方法研究[A];中国企业运筹学[C];2009年
3 龚才春;贺敏;张华平;许洪波;程学旗;;大规模语料的频繁模式快速发现算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
4 张普;;流通度在IT术语识别中的应用分析——关于术语、术语学、术语数据库的研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
5 李伟;苑春法;黄锦辉;李文捷;;基于关键句矢量模型的文本相似性计算[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
6 颜伟;荀恩东;;基于WordNet的英语词语相似度计算[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 赵妍妍;秦兵;刘挺;张俐;苏中;;基于多特征融合的句子相似度计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国重要报纸全文数据库 前1条
1 金华职业技术学院院长 王振洪;[N];浙江日报;2011年
中国博士学位论文全文数据库 前10条
1 范九伦;模糊聚类新算法与聚类有效性问题研究[D];西安电子科技大学;1998年
2 李玉榕;信息融合与智能处理的研究[D];浙江大学;2001年
3 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
4 洪安祥;基于内容的图像检索若干论题研究[D];浙江大学;2003年
5 杨风召;高维数据挖掘中若干关键问题的研究[D];复旦大学;2003年
6 王莉;数据挖掘中聚类方法的研究[D];天津大学;2004年
7 胡四泉;并行和分布式仿真的建模和性能分析研究[D];中国科学院研究生院(软件研究所);2004年
8 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
9 王鸿雁;多电平逆变器PWM新方法及相关技术[D];浙江大学;2005年
10 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
2 郑洪英;数据挖掘聚类算法的分析和应用研究[D];重庆大学;2002年
3 孙孝萍;基于聚类分析的数据挖掘算法研究[D];西南石油学院;2002年
4 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
5 陈耿;数据挖掘技术及其在用户行为分析系统中的应用[D];西南交通大学;2003年
6 周永锋;基于密度的海量数据增量式挖掘技术研究[D];中国人民解放军国防科学技术大学;2002年
7 苏守宝;基于遗传算法的聚类挖掘研究[D];安徽大学;2004年
8 文安邦;基于网络流量日志的分析与安全审计[D];大连海事大学;2004年
9 刘卓;基于KNN算法的中文文本自动分类[D];吉林大学;2004年
10 刘鹏宇;基于内容的图像特征提取算法的研究[D];吉林大学;2004年
【二级引证文献】
中国期刊全文数据库 前10条
1 李忠哗;王凤利;何丕廉;;关联规则挖掘在课程相关分析中的应用[J];河北农业大学学报;2010年03期
2 王晓;赵军;;浅论Apriori算法的改进[J];电脑学习;2009年05期
3 张春琴;;决策树算法在高校成绩分析中的应用研究[J];电脑编程技巧与维护;2009年12期
4 王锋;;关联规则在教学评价数据挖掘中的应用[J];电脑编程技巧与维护;2009年22期
5 高燕飞;陈俊杰;强彦;;自适应数据库中基于特征向量的聚类算法的研究与改进[J];电脑开发与应用;2008年07期
6 王木林;;基于关联规则数据挖掘技术在教学管理中的应用[J];电脑知识与技术(学术交流);2007年08期
7 王安志;李明东;李超;;各种聚类算法及改进算法的研究[J];电脑知识与技术;2008年25期
8 魏丽;;浅谈数据挖掘技术在大学生心理问题中的应用[J];电脑知识与技术;2009年09期
9 樊旭亮;;基于中文Blog的话题识别方法探讨[J];大众科技;2008年02期
10 范冬梅;卢志茂;张汝波;潘树燊;;基于信息增益改进贝叶斯模型的汉语词义消歧[J];电子与信息学报;2008年12期
中国重要会议论文全文数据库 前4条
1 李亚玲;李启安;朱添福;;改进K-means算法在多晶硅来料质量检验中的分析及应用[A];2011国际信息技术与应用论坛论文集(《计算机科学》2011.7)[C];2011年
2 刘宏鑫;易小祺;;“十二五”规划方针指导下大学生就业对策浅析[A];第八届沈阳科学学术年会论文集[C];2011年
3 耿元骊;;三十年来中国古籍数字化研究综述(1979-2009)[A];第二届中国古籍数字化国际学术研讨会论文集[C];2009年
4 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
中国博士学位论文全文数据库 前10条
1 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
2 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
3 王菁华;文本中知识的获取[D];北京邮电大学;2008年
4 刘鹏远;基于知识自动获取的无指导译文消歧方法研究[D];哈尔滨工业大学;2008年
5 王瑞琴;基于语义处理技术的信息检索模型研究[D];浙江大学;2009年
6 王小芳;文本主题域划分与无监督特征提取[D];吉林大学;2009年
7 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
8 杨霁琳;不完备信息系统知识约简方法及应用研究[D];西南交通大学;2010年
9 朱锁玲;命名实体识别在方志内容挖掘中的应用研究[D];南京农业大学;2011年
10 贺琳;基于数据挖掘的道路运行安全风险分析[D];大连海事大学;2012年
中国硕士学位论文全文数据库 前10条
1 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
2 李翠;基于车辆自动识别的智能计重监控系统的研究与设计[D];郑州大学;2010年
3 刘振广;一种改进的k_means聚类算法研究[D];哈尔滨工程大学;2010年
4 耿倩;基于文本相似度计算的文本聚类算法研究与实现[D];哈尔滨工程大学;2010年
5 张丛辉;船舶燃气轮机—发电系统稳定性研究[D];哈尔滨工程大学;2010年
6 杨琳;电力推进系统对船舶电网稳定的影响研究[D];哈尔滨工程大学;2010年
7 王森;基于主题树的自上而下文本复制检测研究[D];大连理工大学;2010年
8 孙红艳;改进的小生境遗传聚类算法应用研究[D];辽宁工程技术大学;2010年
9 张媛;基于数据挖掘的选修课成绩分析系统[D];中国海洋大学;2010年
10 李富城;多极化SAR图像地物分类技术研究[D];解放军信息工程大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 贺杨成;王士同;江南;;成对约束的属性加权半监督模糊核聚类算法[J];计算机工程与应用;2011年24期
2 贺杨成;王士同;江南;;特征空间属性加权混合C均值模糊核聚类算法[J];计算机工程与应用;2011年23期
3 赵犁丰;王栋;;基于加权多宽度高斯核函数的聚类算法[J];现代电子技术;2011年10期
4 冯霞;闫冠男;李娟娟;;一种基于潜在语义索引的谱聚类方法研究[J];中国民航大学学报;2011年03期
5 王东;罗可;;基于变异粒子群的聚类挖掘[J];计算机工程与应用;2011年21期
6 张宇;邵良杉;邱云飞;刘威;;基于竞争学习的K质心组合聚类算法[J];计算机工程;2011年15期
7 刘悦婷;;基于ISFLA的K均值聚类算法[J];工业仪表与自动化装置;2011年04期
8 黄韬;刘胜辉;谭艳娜;;基于k-means聚类算法的研究[J];计算机技术与发展;2011年07期
9 吴佳;罗可;;改进的模糊C均值的增量聚类算法[J];计算机工程与应用;2011年23期
10 阎晓娜;赵犁丰;;基于支持向量机的改进高斯核函数聚类算法研究[J];现代电子技术;2011年13期
中国重要会议论文全文数据库 前10条
1 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
2 袁里驰;钟义信;;一种新颖的词聚类算法[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
3 覃华;徐燕子;张敏;;基于巢模板的核空间蚁群聚类算法的研究[A];广西计算机学会2010年学术年会论文集[C];2010年
4 高炳岩;刘悦;;基于熵权的改进ISODATA聚类算法的研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
6 莫锦萍;陈琴;马琳;苏一丹;;使用K-Means优化蚁群聚类模型[A];广西计算机学会2008年年会论文集[C];2008年
7 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
8 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
9 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
10 刘海涛;老松杨;吴玲达;;基于段落自适应聚类的自动文摘系统研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 刘霞;中国南北方人基因差异0.3%[N];上海科技报;2009年
2 刘婉;美认为基因差异决定狗的品种[N];中国医药报;2004年
3 陈立希;科学家“画”出人类基因“突变”图[N];新华每日电讯;2006年
4 刘曙甲 刘志伟;人与黑猩猩的基因差异只有0.75%[N];科技日报;2003年
5 南方医科大学南方医院肿瘤中心教授 罗荣城;肺癌诊治 聚焦基因差异[N];健康报;2007年
6 ;黄种人、白种人、黑种人基因差异极微[N];科技日报;2001年
7 朱芙蓉;基因差异:一人一本不同“天书”[N];科技日报;2008年
8 编译 王金元;欧洲人皮肤白色源于基因变异[N];北京科技报;2007年
9 肖恩·B·卡罗尔尼古拉斯·格姆培尔 本杰明·普鲁德赫姆 张红超 编译;动物形态迥异之谜[N];第一财经日报;2008年
10 彭兴庭;政府“出手” 要有度[N];中华工商时报;2004年
中国博士学位论文全文数据库 前10条
1 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
2 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
3 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
4 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
5 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
6 孙国;基于稀疏模态响应的结构损伤识别方法[D];大连理工大学;2006年
7 管宝云;基于混合智能算法的高校时间表及自动组卷问题研究[D];天津大学;2005年
8 曹付元;面向分类数据的聚类算法研究[D];山西大学;2010年
9 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
10 陈红;循环型农业发展进程中地方政府行为研究[D];东北林业大学;2007年
中国硕士学位论文全文数据库 前10条
1 刘荣辉;基于主动学习的半监督谱聚类算法研究[D];重庆大学;2011年
2 彭丽;数据挖掘中几种划分聚类算法的比较及改进[D];大连理工大学;2008年
3 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
4 吴艳文;聚类中的特征学习研究[D];合肥工业大学;2007年
5 徐丽娜;数据流中基于区间划分的高维聚类算法研究[D];燕山大学;2010年
6 孙玉侠;数据挖掘中的谱聚类算法研究[D];中国海洋大学;2010年
7 谷垒;聚类算法及其在电信收入保障系统中的应用研究[D];湖南大学;2010年
8 高世光;基于模糊聚类的数据挖掘技术研究[D];国防科学技术大学;2002年
9 丁光华;基于BIRCH和GAD的谱聚类算法研究[D];暨南大学;2010年
10 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026