一种密度和划分结合的聚类算法
【摘要】: 基于密度的DBSCAN聚类算法和基于划分的k-means聚类算法各有其优缺点。文中在k-means和DBSCAN聚类算法的基础上,以减少聚类算法对参数和数据点输入顺序的敏感性,发现任意形状的簇,提高聚类挖掘的质量为目标,提出了一种密度和划分结合的聚类算法—DDCA。该算法首先计算数据点的密度,以密度不小于给定阈值的中心点以及在其密度范围内的点组合成各个基本簇;再依据两个簇中心点之间的距离合并基本簇;最后把没有划分到任意簇的点划分到与其距离最近的簇中。理论分析和基于KDD CUP 99数据集的实验结果表明,提出的DDCA算法能够发现任意形状的簇,对数据点的输入顺序以及参数不敏感,在时间开销仅略有增加的情况下可获得更高的聚类准确度,其总体性能优于k-means。
1
周傲英,周水庚,曹晶,范晔,胡运发;Approaches for Scaling DBSCAN Algorithm to Large Spatial Databases [J];Journal of Computer Science and Technology;2000年06期
2
;Scaling up the DBSCAN Algorithm for Clustering Large Spatial Databases Based on Sampling Technique [J];Wuhan University Journal of Natural Sciences;2001年Z1期
3
岳士弘,李平,郭继东,周水庚;Using Greedy algorithm: DBSCAN revisited II [J];Journal of Zhejiang University Science;2004年11期
4
蔡颖琨,谢昆青,马修军;屏蔽了输入参数敏感性的DBSCAN改进算法 [J];北京大学学报(自然科学版);2004年03期
5
宋明,刘宗田;基于数据交叠分区的并行DBSCAN算法 [J];计算机应用研究;2004年07期
6
孙志伟,赵政;DBSCAN在非空间属性处理上的扩展 [J];计算机应用;2005年06期
7
熊忠阳,孙思,张玉芳,王秀琼;一种基于划分的不同参数值的DBSCAN算法 [J];计算机工程与设计;2005年09期
8
何中胜;刘宗田;庄燕滨;;基于数据分区的并行DBSCAN算法 [J];小型微型计算机系统;2006年01期
9
李杰;贾瑞玉;张璐璐;;一个改进的基于DBSCAN的空间聚类算法研究 [J];计算机技术与发展;2007年01期
10
冯少荣;肖文俊;;基于密度的DBSCAN聚类算法的研究及应用 [J];计算机工程与应用;2007年20期
11
徐仰彬;刘志镜;;基于DBSCAN的簇共享对象的处理办法 [J];计算机技术与发展;2007年07期
12
吴贞珍;黄建华;;DBSCAN聚类算法在异常检测中的应用 [J];计算机安全;2007年08期
13
冯少荣;肖文俊;;DBSCAN聚类算法的研究与改进 [J];中国矿业大学学报;2008年01期
14
谭颖;胡瑞飞;殷国富;;多密度阈值的DBSCAN改进算法 [J];计算机应用;2008年03期
15
蔡永旺;杨炳儒;;适用于公交站点聚类的DBSCAN改进算法 [J];计算机工程;2008年10期
16
冯少荣;肖文俊;;一种提高DBSCAN聚类算法质量的新方法 [J];西安电子科技大学学报;2008年03期
17
曹亮;舒红平;刘魁;;基于观测数据偏差修正的DBSCAN改进算法 [J];计算机工程与设计;2009年13期
18
夏鲁宁;荆继武;;SA-DBSCAN:一种自适应基于密度聚类算法 [J];中国科学院研究生院学报;2009年04期
19
王桂芝;王广亮;;改进的快速DBSCAN算法 [J];计算机应用;2009年09期
20
何震凯;阳爱民;刘永定;邱密;;一种使用DBSCAN聚类的网络流量分类方法 [J];计算机应用研究;2009年09期