收藏本站
收藏 | 投稿 | 论文排版

一种密度和划分结合的聚类算法

王玉雷  李玲娟  
【摘要】:基于密度的DBSCAN聚类算法和基于划分的k-means聚类算法各有其优缺点。文中在k-means和DBSCAN聚类算法的基础上,以减少聚类算法对参数和数据点输入顺序的敏感性,发现任意形状的簇,提高聚类挖掘的质量为目标,提出了一种密度和划分结合的聚类算法—DDCA。该算法首先计算数据点的密度,以密度不小于给定阈值的中心点以及在其密度范围内的点组合成各个基本簇;再依据两个簇中心点之间的距离合并基本簇;最后把没有划分到任意簇的点划分到与其距离最近的簇中。理论分析和基于KDD CUP 99数据集的实验结果表明,提出的DDCA算法能够发现任意形状的簇,对数据点的输入顺序以及参数不敏感,在时间开销仅略有增加的情况下可获得更高的聚类准确度,其总体性能优于k-means。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 周傲英,周水庚,曹晶,范晔,胡运发;Approaches for Scaling DBSCAN Algorithm to Large Spatial Databases[J];Journal of Computer Science and Technology;2000年06期
2 ;Scaling up the DBSCAN Algorithm for Clustering Large Spatial Databases Based on Sampling Technique[J];Wuhan University Journal of Natural Sciences;2001年Z1期
3 岳士弘,李平,郭继东,周水庚;Using Greedy algorithm: DBSCAN revisited II[J];Journal of Zhejiang University Science;2004年11期
4 蔡颖琨,谢昆青,马修军;屏蔽了输入参数敏感性的DBSCAN改进算法[J];北京大学学报(自然科学版);2004年03期
5 宋明,刘宗田;基于数据交叠分区的并行DBSCAN算法[J];计算机应用研究;2004年07期
6 孙志伟,赵政;DBSCAN在非空间属性处理上的扩展[J];计算机应用;2005年06期
7 熊忠阳,孙思,张玉芳,王秀琼;一种基于划分的不同参数值的DBSCAN算法[J];计算机工程与设计;2005年09期
8 何中胜;刘宗田;庄燕滨;;基于数据分区的并行DBSCAN算法[J];小型微型计算机系统;2006年01期
9 李杰;贾瑞玉;张璐璐;;一个改进的基于DBSCAN的空间聚类算法研究[J];计算机技术与发展;2007年01期
10 冯少荣;肖文俊;;基于密度的DBSCAN聚类算法的研究及应用[J];计算机工程与应用;2007年20期
11 徐仰彬;刘志镜;;基于DBSCAN的簇共享对象的处理办法[J];计算机技术与发展;2007年07期
12 吴贞珍;黄建华;;DBSCAN聚类算法在异常检测中的应用[J];计算机安全;2007年08期
13 冯少荣;肖文俊;;DBSCAN聚类算法的研究与改进[J];中国矿业大学学报;2008年01期
14 谭颖;胡瑞飞;殷国富;;多密度阈值的DBSCAN改进算法[J];计算机应用;2008年03期
15 蔡永旺;杨炳儒;;适用于公交站点聚类的DBSCAN改进算法[J];计算机工程;2008年10期
16 冯少荣;肖文俊;;一种提高DBSCAN聚类算法质量的新方法[J];西安电子科技大学学报;2008年03期
17 曹亮;舒红平;刘魁;;基于观测数据偏差修正的DBSCAN改进算法[J];计算机工程与设计;2009年13期
18 夏鲁宁;荆继武;;SA-DBSCAN:一种自适应基于密度聚类算法[J];中国科学院研究生院学报;2009年04期
19 王桂芝;王广亮;;改进的快速DBSCAN算法[J];计算机应用;2009年09期
20 何震凯;阳爱民;刘永定;邱密;;一种使用DBSCAN聚类的网络流量分类方法[J];计算机应用研究;2009年09期
中国重要会议论文全文数据库 前8条
1 马帅;宋国杰;唐世渭;杨冬青;王腾蛟;;基于单元划分的DBSCAN聚类算法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 朵春红;王翠茹;;基于取样的DBSCAN聚类算法及其遗传优化[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
3 庞洋;李海林;郭义喜;;基于DBSCAN算法的日志信息聚类研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
4 宫蕊;舒红平;郭远远;;基于DBSCAN的密度聚类算法的研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
5 张健沛;许慧;杨静;崔洪晶;;基于数据分区、QR~*-树的并行DBSCAN算法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
6 Yi-Chun Xu;Man Zhu;Zunhai Ke;Yong Liu;Suifa Sun;;Isolating Ships from Shape Curve with DBSCAN[A];第25届中国控制与决策会议论文集[C];2013年
7 范晔;周水庚;曹晶;周傲英;;通过数据取样扩展基于密度的聚类算法[A];第十六届全国数据库学术会议论文集[C];1999年
8 曹晶;周水庚;范晔;周傲英;;数据分区:一种改善基于密度的聚类算法的方法[A];第十六届全国数据库学术会议论文集[C];1999年
中国硕士学位论文全文数据库 前10条
1 罗启福;基于云计算的DBSCAN算法研究[D];武汉理工大学;2013年
2 吴林敏;针对非均匀数据集的DBSCAN过滤式改进算法[D];重庆大学;2009年
3 黄毅磊;DBSCAN算法及在城市网格化管理中的应用[D];上海交通大学;2010年
4 孙思;利用遗传思想进行数据划分的DBSCAN算法研究[D];重庆大学;2005年
5 虞倩倩;基于数据划分的DBSCAN算法研究[D];江南大学;2013年
6 许慧;基于数据分区和QR*树的并行DBSCAN算法研究[D];哈尔滨工程大学;2007年
7 王雅光;基于Hadoop平台的DBSCAN算法应用研究[D];广东工业大学;2013年
8 李静;结合蚁群算法与基于划分的DBSCAN聚类算法的研究[D];东北师范大学;2011年
9 王莹;基于粒子群优化的带障碍约束DBSCAN算法研究[D];哈尔滨工程大学;2011年
10 张枫;基于网格的DBSCAN算法和聚类边界技术的研究[D];郑州大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978