收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于K近邻和优化分配策略的密度峰值聚类算法

孙林  秦小营  徐久成  薛占熬  
【摘要】:密度峰值聚类(density peak clustering, DPC)是一种简单有效的聚类分析方法.但在实际应用中,对于簇间密度差别大或者簇中存在多密度峰的数据集,DPC很难选择正确的簇中心;同时,DPC中点的分配方法存在多米诺骨牌效应.针对这些问题,提出一种基于K近邻(K-nearest neighbors,KNN)和优化分配策略的密度峰值聚类算法.首先,基于KNN、点的局部密度和边界点确定候选簇中心;定义路径距离以反映候选簇中心之间的相似度,基于路径距离提出密度因子和距离因子来量化候选簇中心作为簇中心的可能性,确定簇中心.然后,为了提升点的分配的准确性,依据共享近邻、高密度最近邻、密度差值和KNN之间距离构建相似度,并给出邻域、相似集和相似域等概念,以协助点的分配;根据相似域和边界点确定初始聚类结果,并基于簇中心获得中间聚类结果.最后,依据中间聚类结果和相似集,从簇中心到簇边界将簇划分为多层,分别设计点的分配策略;对于具体层次中的点,基于相似域和积极域提出积极值以确定点的分配顺序,将点分配给其积极域中占主导地位的簇,获得最终聚类结果.在11个合成数据集和27个真实数据集上进行仿真实验,与最新的基于密度峰值的聚类算法作对比,结果表明:所提算法在纯度、F度量、准确度、兰德系数、调整兰德系数和标准互信息上均表现出良好的聚类性能.

知网文化
【相似文献】
中国期刊全文数据库 前12条
1 杜淑颖;;基于大型数据集的聚类算法研究[J];软件;2016年01期
2 于本成;鲍宇;曹天杰;朱作付;;面向大型数据集的聚类算法的优化与融合[J];计算机工程与设计;2014年05期
3 罗丹;毛先成;邓浩;;一种基于密度峰值的半监督聚类算法[J];地理与地理信息科学;2017年02期
4 孟海东;杨彦侃;;并行聚类算法的设计与研究[J];计算机与现代化;2010年08期
5 吴昊;周建涛;祁瑞东;;密度峰值自动检测聚类算法[J];计算机与数字工程;2021年12期
6 姜美羡;;基于密度的半监督聚类算法研究[J];现代计算机(专业版);2018年23期
7 张维群;陈文浩;;基于高维分步投影的多重分区聚类算法[J];统计与信息论坛;2017年02期
8 薛丽香;邱保志;;基于变异系数的边界点检测算法[J];模式识别与人工智能;2009年05期
9 俞磊;朱铮;蒋超;肖爽;;自适应局部核的最优邻域多核聚类[J];控制工程;2022年01期
10 瞿原;邓维斌;胡峰;张其龙;王鸿;;基于Spark的点排序识别聚类结构算法[J];计算机科学;2018年01期
11 蒋盛益;苗邦;王连喜;;面向不平衡数据的特征加权聚类算法[J];小型微型计算机系统;2013年08期
12 李金磊;朱晓莲;朱海燕;;一种基于投票策略的聚类融合算法[J];计算机仿真;2008年03期
中国重要会议论文全文数据库 前20条
1 郭景峰;杜京;马倩;邹晓红;;一种基于数据集性质的快速等差模式聚类算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 刘彤;孙永香;张振洪;;一种有效的基于密度和层次的聚类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
3 陈德华;解维;李悦;;面向大规模图数据的分布式并行聚类算法研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
4 赖桃桃;冯少荣;张东站;;一种基于划分和密度的快速聚类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
5 郝芸;田野;康辉;;分布式聚类算法的研究[A];第九届中国通信学会学术年会论文集[C];2012年
6 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
7 吴晓璇;倪志伟;倪丽萍;;基于分形维数的选择性聚类融合算法[A];中国系统工程学会第十八届学术年会论文集——A05系统工程理论应用与创新[C];2014年
8 娄冬梅;陈明;朱有娜;;一种基于密度的无参数聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
9 葛鹏程;李建中;张兆功;何震瀛;;一种基于势能的快速聚类算法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
10 彭小宏;阳东升;刘忠;;基于聚类算法的组织协作网设计[A];2006中国控制与决策学术年会论文集[C];2006年
11 殷志君;周敏子;王轶彤;周皓峰;汪卫;施伯乐;;GC-Clustering:基于描述长度的自适应的聚类算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
12 孙焕良;刘俊岭;于戈;鲍玉斌;王大玲;;一种基于CD-Tree的高效聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
13 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
14 蔡军;袁华鹏;陈金海;施伯乐;;一种基于相似性分析的聚类新算法:PDS算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
15 王玉辉;张乐;祁颖;;基于马尔可夫的属性图聚类算法[A];中国计算机用户协会网络应用分会2018年第二十二届网络新技术与应用年会论文集[C];2018年
16 谢坤武;陈世强;;一种分类数据的聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
17 张望;王辉;;个性化服务中的并行K-Means聚类算法[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
18 罗丹;邓浩;毛先成;;一种基于密度的半监督聚类算法[A];第十五届全国数学地质与地学信息学术研讨会论文集[C];2016年
19 李浪波;傅彦;刘红;;基于范例推理的网格和密度聚类算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
20 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
中国博士学位论文全文数据库 前20条
1 刘翔宇;基因表达分析中双聚类算法研究[D];山东大学;2021年
2 徐晓;面向复杂数据的密度峰值聚类算法研究[D];中国矿业大学;2021年
3 王振佳;基于基因表达数据的双聚类算法研究[D];山东大学;2016年
4 姜磊;混合演化聚类算法研究及其应用[D];武汉大学;2012年
5 陈梅;面向复杂数据的聚类算法研究[D];兰州大学;2016年
6 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
7 张强;聚类算法的维度分析[D];天津大学;2007年
8 冀进朝;针对多维混合属性数据的聚类算法研究[D];吉林大学;2013年
9 许玉杰;云计算环境下海量数据的并行聚类算法研究[D];大连海事大学;2014年
10 陈加顺;海洋环境下聚类算法的研究[D];南京航空航天大学;2014年
11 李龙龙;半监督聚类算法研究及植物叶片识别应用[D];西北农林科技大学;2017年
12 朱红;粒度聚类方法研究[D];中国矿业大学;2013年
13 刘丽敏;选择性聚类融合算法研究[D];中南大学;2013年
14 王佐;基于粗糙集的聚类算法研究[D];吉林大学;2013年
15 李飒;数据流软聚类理论及其在瓦斯灾害预警中的应用[D];辽宁工程技术大学;2014年
16 魏立梅;聚类分析新方法的研究与应用[D];西安电子科技大学;1998年
17 王骏;无监督学习中聚类和阈值分割新方法研究[D];南京理工大学;2011年
18 刘雪娟;面向大数据的聚类算法研究[D];南京航空航天大学;2019年
19 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
20 王贵参;重叠社区发现中的边聚类算法研究[D];吉林大学;2016年
中国硕士学位论文全文数据库 前20条
1 胡艺杰;密度峰值聚类算法改进及其应用研究[D];华中师范大学;2021年
2 崔世琦;基于自动检测密度峰值的聚类算法研究[D];长春工业大学;2020年
3 姜东;密度峰值聚类算法的改进及应用[D];山东师范大学;2021年
4 魏媛;基于自动确定类数技术的聚类算法研究[D];西安电子科技大学;2021年
5 牛品菽;基于图模型的高效聚类算法研究[D];北京交通大学;2016年
6 王秀丽;基于多层核心集的凝聚聚类算法[D];南京航空航天大学;2012年
7 陈西伟;基于谱方法的聚类算法及其应用的研究[D];兰州大学;2014年
8 尚俊平;基于距离的聚类和孤立点检测算法研究[D];郑州大学;2005年
9 耿锦威;聚类算法及基于簇模式聚类集成研究[D];安徽大学;2011年
10 李翔宇;针对环形与非环形簇结构的聚类算法选择研究[D];福建师范大学;2013年
11 邵珠全;高维类别数据集的粗糙聚类算法的研究与应用[D];大连海事大学;2017年
12 高倩倩;基因表达数据的聚类算法研究及其实现[D];江南大学;2009年
13 张业嘉诚;划分聚类与基于密度聚类算法的改进方法研究[D];大连理工大学;2007年
14 刘政;最优协方差密度峰值聚类算法的研究[D];广西大学;2020年
15 郭跃军;基于信息瓶颈算法的运动轨迹聚类及可视化[D];天津大学;2016年
16 高昇;基于密度聚类算法的改进方法研究[D];大连理工大学;2007年
17 吴晶晶;传粉策略在聚类算法中的研究与应用[D];重庆邮电大学;2020年
18 梁荣德;聚类融合算法的实验评价方法[D];广东工业大学;2015年
19 于智航;改进的密度聚类算法研究[D];大连理工大学;2007年
20 徐军莉;分布式聚类算法研究及其应用[D];南昌大学;2009年
中国重要报纸全文数据库 前20条
1 金水高 刘丽华 陶庄;基本数据集标准新进展[N];计算机世界;2006年
2 本报记者 刘霞;AI助力抗“疫” 美发布新冠病毒数据集[N];科技日报;2020年
3 本报记者 武晓莉;给冰冷的算法注入温暖[N];中国消费者报;2021年
4 本报记者 苏晓梅 岳付玉;算法推荐能否告别野蛮生长?[N];天津日报;2022年
5 记者 彭晓玲;大数据和算法的未来 “道德自动化”还是“哲人工程师”[N];第一财经日报;2022年
6 光明日报联合调研组 执笔人 北京市习近平新时代中国特色社会主义思想研究中心特约研究员 毛湛文 本报记者 白雪蕾;如何远离算法之“算计”?[N];光明日报;2022年
7 中青报·中青网见习记者 罗希;中青校媒联合上交大媒体与传播学院发起《提高“算法素养”倡议》[N];中国青年报;2021年
8 王轶辰;算法也要有“说法”[N];经济日报;2022年
9 记者 王思北 阳娜 周琳 颜之宏;大数据“杀熟”不能再“杀”了,算法推荐不能乱“推”了[N];新华每日电讯;2022年
10 本报记者 祖爽;剑指行业乱象 算法推荐进入严监管时代[N];中国商报;2022年
11 新华社记者 余俊杰;规范算法推荐活动,明确用户知情权选择权[N];新华每日电讯;2022年
12 湖北日报评论员 周磊;“算法”不是“算计”[N];湖北日报;2022年
13 刘俊;促进算法推荐技术规范健康发展[N];人民日报;2022年
14 李贞;共促算法推荐健康有序发展[N];人民日报海外版;2022年
15 记者 毛振华;算法不能变算计[N];新华每日电讯;2022年
16 记者 任震宇;强化算法实施方的举证责任[N];中国消费者报;2021年
17 见习记者 陈友敏;消保委呼吁尽快出台算法规制[N];上海法治报;2021年
18 赵熙熙;科学家开发出纠错新算法[N];中国科学报;2017年
19 重庆市第四中级人民法院 艾庆平;赛博世界的算法规制[N];人民法院报;2020年
20 本报记者 赵语涵;数据算法推荐告别野蛮生长[N];北京日报;2022年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978