收藏本站
《软件学报》 2008年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于层次划分的最佳聚类数确定方法

陈黎飞  姜青山  王声瑞  
【摘要】:确定数据集的聚类数目是聚类分析中一项基础性的难题.常用的trail-and-error方法通常依赖于特定的聚类算法,且在大型数据集上计算效率欠佳.提出一种基于层次思想的计算方法,不需要对数据集进行反复聚类,它首先扫描数据集获得CF(clusteringfeature,聚类特征)统计值,然后自底向上地生成不同层次的数据集划分,增量地构建一条关于不同层次划分的聚类质量曲线;曲线极值点所对应的划分用于估计最佳的聚类数目.另外,还提出一种新的聚类有效性指标用于衡量不同划分的聚类质量.该指标着重于簇的几何结构且独立于具体的聚类算法,能够识别噪声和复杂形状的簇.在实际数据和合成数据上的实验结果表明,新方法的性能优于新近提出的其他指标,同时大幅度提高了计算效率.

【引证文献】
中国期刊全文数据库 前10条
1 杨震;段立娟;赖英旭;;基于字符串相似性聚类的网络短文本舆情热点发现技术[J];北京工业大学学报;2010年05期
2 姚宇婕;陈毓芬;;引导型专题数据分级处理研究[J];测绘工程;2012年01期
3 高辉;王沙沙;傅彦;;Web舆情的长期趋势预测方法[J];电子科技大学学报;2011年03期
4 刘丹;高世臣;;K-均值算法聚类数的确定[J];硅谷;2011年06期
5 刘燕驰;;基于密度的最佳聚类数确定方法[J];中国管理信息化;2011年09期
6 赵兴旺;梁吉业;曹付元;;符号数据最佳聚类个数的确定方法[J];广西师范大学学报(自然科学版);2009年03期
7 高燕飞;陈俊杰;;自治数据库系统中聚类算法的研究与设计[J];电脑开发与应用;2012年07期
8 姚玉钦;李金广;;一种基于网格的层次聚类算法[J];河南师范大学学报(自然科学版);2009年04期
9 屈喜琴;陈忠贵;;基于系统聚类的矿产储量研究[J];能源研究与管理;2011年02期
10 邓富强;庞全;;一种改进的模糊C-均值(FCM)彩色图像分割算法[J];机电工程;2010年09期
中国博士学位论文全文数据库 前10条
1 梁成军;网球技战术决策支持系统研究与应用[D];上海体育学院;2011年
2 张沙清;不确定环境下模具制造多项目动态调度建模与仿真[D];广东工业大学;2011年
3 孙佳龙;近海雷达卫星测高数据质量改善及在南海海潮模型中的应用研究[D];山东科技大学;2011年
4 周世兵;聚类分析中的最佳聚类数确定方法研究及应用[D];江南大学;2011年
5 陈黎飞;高维数据的聚类方法研究与应用[D];厦门大学;2008年
6 胡俊;数据挖掘可视化模型及其应用研究[D];北京交通大学;2009年
7 于鷃;基于一维SOM神经网络的聚类及数据分析方法研究[D];天津大学;2009年
8 陈韬伟;基于脉内特征的雷达辐射源信号分选技术研究[D];西南交通大学;2010年
9 赵洁;基于粒计算的Web使用挖掘研究[D];华南理工大学;2010年
10 胡健;面向企业关系价值分析的数据挖掘方法研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 庄怡雯;基于聚类算法的Web日志挖掘应用研究[D];东华大学;2011年
2 邓富强;显微细胞图像的拼接、融合及染色目标提取方法的研究[D];杭州电子科技大学;2011年
3 王沙沙;基于类模型的Web舆情趋势预测[D];电子科技大学;2011年
4 方志鹤;恶意代码分类的研究与实现[D];国防科学技术大学;2011年
5 赵兴旺;基于信息熵的聚类个数确定方法研究[D];山西大学;2011年
6 季晓锋;基于模糊C均值聚类的彩色图像分割算法研究[D];南京理工大学;2012年
7 姚宇婕;引导型专题地图制作关键技术研究[D];解放军信息工程大学;2011年
8 王洪波;基于差分进化计算的聚类算法研究[D];山东师范大学;2012年
9 陈峰;基于Web日志的用户兴趣聚类研究[D];合肥工业大学;2008年
10 姜浩;基于可变规模粒子群的聚类分析方法[D];延边大学;2009年
【参考文献】
中国期刊全文数据库 前3条
1 范九伦,吴成茂;可能性划分系数和模糊变差相结合的聚类有效性函数[J];电子与信息学报;2002年08期
2 孙才志,王敬东,潘俊;模糊聚类分析最佳聚类数的确定方法研究[J];模糊系统与数学;2001年01期
3 诸克军,苏顺华,黎金玲;模糊C-均值中的最优聚类与最佳聚类数[J];系统工程理论与实践;2005年03期
【共引文献】
中国期刊全文数据库 前10条
1 张晓杰,王巍巍;基于C—均值模糊聚类的工程结构构件自动归并方法研究[J];四川建筑科学研究;2005年04期
2 李晓红;田军委;;面向FCM聚类阈值分割的聚类有效性判别函数[J];安徽大学学报(自然科学版);2007年05期
3 曹安照,张斌,张永荣,庆先好;模糊聚类在电力负荷预测中的应用[J];安徽工程科技学院学报(自然科学版);2005年01期
4 叶良艳;;基于改进后的K-means聚类算法的网吧用户行为聚类[J];安徽科技学院学报;2009年04期
5 贾丙静;葛华;王传安;赵海燕;;Web日志挖掘在校园网建设中的应用研究[J];安徽科技学院学报;2010年03期
6 孙雪;李昆仑;胡夕坤;赵瑞;;基于半监督K-means的K值全局寻优算法[J];北京交通大学学报;2009年06期
7 牛琨;张舒博;陈俊亮;;采用属性聚类的高维子空间聚类算法[J];北京邮电大学学报;2007年03期
8 高玉欣;郑文瑞;;模糊聚类分析方法在吉林农业经济划分中的应用[J];长春大学学报;2008年08期
9 贺文莲;;信用卡数据仓库建设方案[J];重庆科技学院学报(自然科学版);2008年03期
10 刘耀年,王卫,杨冬峰;基于模糊划分聚类的中长期用电量预测[J];东北电力学院学报;2004年04期
中国重要会议论文全文数据库 前4条
1 ;A Hybrid Clustering Algorithm Based on Grid Density and Rough Sets[A];第二十七届中国控制会议论文集[C];2008年
2 卢建昌;孙伟;李健强;;RMLPNN模型在短期负荷预测中的应用[A];2005中国控制与决策学术年会论文集(上)[C];2005年
3 ;A Semi-supervised Clustering Algorithm Based on Rough Reduction[A];2009中国控制与决策会议论文集(3)[C];2009年
4 赵爽;李晓奇;沙秀艳;;特征加权模糊C均值聚类算法在划分劳动报酬中的应用[A];第三届中国智能计算大会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 刘润涛;基于序的空间数据索引及查询算法研究[D];哈尔滨理工大学;2009年
2 魏建香;学科交叉知识发现及其可视化研究[D];南京大学;2010年
3 黎刚果;基因模块识别与分析相关问题研究[D];国防科学技术大学;2010年
4 勾轶;基于免疫算法和多传感器信息融合的电机故障综合诊断方法研究[D];沈阳工业大学;2010年
5 檀敬东;文本挖掘的若干关键算法研究[D];中国科学技术大学;2010年
6 孙越泓;基于粒子群优化算法的图像分割研究[D];南京理工大学;2010年
7 彭柳青;高维高噪声数据聚类中关键问题研究[D];西安电子科技大学;2011年
8 刘向阳;多流形数据建模及其应用[D];上海交通大学;2011年
9 张沙清;不确定环境下模具制造多项目动态调度建模与仿真[D];广东工业大学;2011年
10 王利;冷轧全流程生产计划与动态调度方法的研究与应用[D];大连理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
2 高兆梓;基于专利分析的竞争对手分类系统研究[D];山东科技大学;2010年
3 杨海陆;公路收费系统数据分析与挖掘[D];哈尔滨工程大学;2010年
4 常靖宇;基于演化计算的多峰函数研究[D];武汉理工大学;2010年
5 陈红;聚类技术及其应用研究[D];福建师范大学;2010年
6 林琴;基于OLAP和数据挖掘的电信客户消费行为分析[D];中南林业科技大学;2007年
7 刘小龙;K-Means聚类算法在犯罪数据挖掘中的应用[D];东华大学;2011年
8 王慧;C-均值聚类算法的改进研究[D];河南大学;2011年
9 宫晓宇;基于LEACH的无线传感器网络分簇路由算法的研究与改进[D];吉林大学;2011年
10 邓富强;显微细胞图像的拼接、融合及染色目标提取方法的研究[D];杭州电子科技大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 李婧;周德华;;基于Illustrator的专题图制作及应用[J];安徽地质;2006年02期
2 周文;曹琳;;时间序列在干旱区棉花需水量预测中的应用[J];安徽农业科学;2008年23期
3 吕效国;缪雪晴;;用折扣最小二乘法建立线性自回归模型预测粮食产量[J];安徽农业科学;2008年30期
4 胡锡衡;;正向最大匹配法在中文分词技术中的应用[J];鞍山师范学院学报;2008年02期
5 李玉鑑;;分层子树合并聚类算法[J];北京工业大学学报;2006年05期
6 ;CABOSFV algorithm for high dimensional sparse data clustering[J];Journal of University of Science and Technology Beijing(English Edition);2004年03期
7 杨文华,高梅国;基于平面变换技术的脉冲信号分选[J];北京理工大学学报;2005年02期
8 刘玉龙,曹元大;分布网络环境主观信任模型研究[J];北京理工大学学报;2005年06期
9 吴萍;宋瀚涛;牛振东;张利萍;张聚礼;;基于SS/OSF实现高维稀疏数据对象的聚类[J];北京理工大学学报;2006年03期
10 石剑飞;闫怀志;牛占云;;基于凝聚的层次聚类算法的改进[J];北京理工大学学报;2008年01期
中国博士学位论文全文数据库 前10条
1 谢超;自适应地图可视化关键技术研究[D];解放军信息工程大学;2009年
2 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
3 范九伦;模糊聚类新算法与聚类有效性问题研究[D];西安电子科技大学;1998年
4 刘小军;人脸识别技术研究[D];中国科学院电子学研究所;2001年
5 王宏漫;人面部的代数特征与几何特征的提取及识别[D];大连理工大学;2003年
6 阮备军;Web使用挖掘若干关键问题研究[D];复旦大学;2004年
7 李忠新;图像镶嵌理论及若干算法研究[D];南京理工大学;2004年
8 张志兵;空间数据挖掘关键技术研究[D];华中科技大学;2004年
9 张爱华;基于模糊聚类分析的图像分割技术研究[D];华中科技大学;2004年
10 邵国晨;基于数据挖掘的决策支持系统及应用研究[D];辽宁工程技术大学;2005年
中国硕士学位论文全文数据库 前10条
1 邢远凯;基于决策树和遗传算法的神经网络研究及应用[D];浙江大学;2010年
2 魏士杰;基于PSO和DE优化神经网络的柴油机故障诊断研究[D];中北大学;2011年
3 李鑫;改进的模糊C均值聚类与连续属性离散化算法研究[D];太原科技大学;2011年
4 谭世恒;一种新型的群智能优化算法—细胞膜优化算法及其应用[D];华南理工大学;2011年
5 廖仁;模具虚拟企业项目调度研究[D];广东工业大学;2003年
6 张亮;数据挖掘在机械制造业外购件供应系统的应用[D];重庆大学;2004年
7 侯舒维;图像拼接技术研究[D];西安电子科技大学;2005年
8 王宏威;油田数据挖掘技术的研究与应用[D];大庆石油学院;2005年
9 于乐源;支持向量机和分类问题的算法研究[D];大连理工大学;2006年
10 金伟;多镜头无缝拼接成像系统的设计与研究[D];浙江大学;2006年
【二级引证文献】
中国期刊全文数据库 前10条
1 王寿超;李杰;王菊;徐志璐;房春生;;R型聚类与模糊聚类分析在源解析中的应用[J];安徽农业科学;2011年29期
2 张朝元;陈丽;吴琢了;;基于主成分聚类分析的大理州经济发展综合评价[J];安徽农业科学;2012年10期
3 陈霞;陈桂芬;;基于可视化的时空数据挖掘研究与应用[J];安徽农业科学;2012年17期
4 黄美璇;;基于主题发现的舆情分析系统的设计与实现[J];北京联合大学学报(自然科学版);2012年01期
5 李小平;任恩恩;;异构数据库相似语义属性聚类过程研究[J];铁道科学与工程学报;2012年02期
6 魏槟泽;;相似发现技术在时态数据挖掘中的应用[J];硅谷;2012年10期
7 李浩;吴雪松;;改进K-均值算法在雷达辐射源信号预分选中的应用[J];航空电子技术;2012年02期
8 范黎林;王娟;;基于粗糙集的混合属性数据聚类算法[J];计算机应用;2010年12期
9 李小雷;王雷;;基于各向异性质心Voronoi图的网络异常检测技术[J];计算机应用;2011年09期
10 杨玲;钟云飞;王彬;;基于模糊规则的印刷图像专色分色[J];计算机应用;2012年06期
中国重要会议论文全文数据库 前1条
1 杜琦;巩政;;基于字符串相似度的自动评分算法实现[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
中国博士学位论文全文数据库 前4条
1 罗勇江;宽带数字侦察接收机若干关键技术研究及应用[D];西安电子科技大学;2011年
2 高雅田;基于MAS的数据挖掘模型自动选择方法研究[D];东北石油大学;2011年
3 周世兵;聚类分析中的最佳聚类数确定方法研究及应用[D];江南大学;2011年
4 宗瑜;聚类质量改进方法的研究[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨彦玲;一种基于GWRN模型的自组织神经网络算法的研究及应用[D];南昌大学;2010年
2 迟崇巍;机场围界远程激光光电感应报警系统的开发与应用[D];大连交通大学;2010年
3 周毅;网络购买决策关键影响因素挖掘研究[D];东华大学;2011年
4 田凤珍;基于Web的用户个性化服务研究[D];河北农业大学;2011年
5 史亚;雷达辐射源个体识别中的分类器设计与子空间学习[D];西安电子科技大学;2011年
6 关庆;增强的软子空间聚类技术的研究[D];江南大学;2011年
7 周向南;港口机械金属结构故障可视化及安全性评价系统研究[D];武汉理工大学;2011年
8 苏永昌;基于粒度原理的聚类分析及规则挖掘技术研究[D];武汉理工大学;2011年
9 翟姗姗;基于用户兴趣聚类的电子政务信息资源整合研究[D];华中师范大学;2011年
10 姜健;基于空间模糊聚类的可视化变量施肥决策系统[D];吉林农业大学;2011年
【二级参考文献】
中国期刊全文数据库 前2条
1 范九伦,裴继红,谢维信;基于可能性分布的聚类有效性[J];电子学报;1998年04期
2 范九伦,裴继红,谢维信;模糊相关度与聚类有效性[J];西安电子科技大学学报;1998年01期
中国博士学位论文全文数据库 前1条
1 范九伦;模糊聚类新算法与聚类有效性问题研究[D];西安电子科技大学;1998年
【相似文献】
中国期刊全文数据库 前10条
1 周世兵;徐振源;唐旭清;;新的K-均值算法最佳聚类数确定方法[J];计算机工程与应用;2010年16期
2 周世兵;徐振源;唐旭清;;基于近邻传播算法的最佳聚类数确定方法比较研究[J];计算机科学;2011年02期
3 周世兵;徐振源;唐旭清;;一种基于近邻传播算法的最佳聚类数确定方法[J];控制与决策;2011年08期
4 朱牧;孟凡荣;周勇;;一种确定聚类数目的自组织特征映射网络[J];微电子学与计算机;2009年08期
5 周世兵;徐振源;唐旭清;;K-means算法最佳聚类数确定方法[J];计算机应用;2010年08期
6 董一鸿;大型数据库中基于邻域连接的层次聚类算法[J];计算机工程与应用;2003年32期
7 郭俊,樊彦国;一种改进的CURE聚类算法[J];内蒙古石油化工;2005年08期
8 吴琪,左万利;一种基于距离的增量聚类算法[J];湖南工程学院学报(自然科学版);2005年03期
9 汤周文;叶东毅;;基于层次聚类的差异化属性约简算法[J];计算机应用;2009年02期
10 林治;;聚类分析在学生成绩管理中的应用探析[J];福建电脑;2009年12期
中国重要会议论文全文数据库 前10条
1 朱牧;孟凡荣;周勇;;一种确定聚类数目的自组织特征映射网络[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
2 高翠芳;吴小俊;;基于二阶差分的聚类数自动确定方法[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
3 张琦;乔卫勇;;RACF介绍[A];第二次计算机安全技术交流会论文集[C];1987年
4 梁一平;邓左祥;周小平;;一种多关系数据挖掘中元组ID传播的设计与实现[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
5 杨建武;;Web检索结果的层次聚类研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 吾守尔·斯拉木;吴启南;;基于层次聚类方法[A];第六届全国计算机应用联合学术会议论文集[C];2002年
7 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 彭楠赟;王厚峰;凌晨添;;基于层次聚类的网络新闻热点发现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 宿太学;王钲旋;吕天阳;邢玉辉;;两个自动终止聚类算法应用于三维模型数据集的效果研究[A];第十二届全国图象图形学学术会议论文集[C];2005年
10 康卫鲜;叶德谦;;基于CURE的聚类算法研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 杨学聪;本市将建立主要统计指标发布制度[N];北京日报;2007年
2 中共中央党校社会学教研室教授 吴忠民;统计指标的缺陷[N];北京日报;2010年
3 本报记者 高远;国家统计局将首次发布主要统计指标环比数据[N];中国信息报;2011年
4 京文;统计指标要满足民众的基本知情权[N];中国改革报;2010年
5 刘铮;薪酬结构和差异将进入统计指标[N];中国改革报;2010年
6 ;常州市主要银行业金融机构统计指标[N];常州日报;2010年
7 本报记者 高慧斌;价格温和上涨不会引发新通胀[N];辽宁日报;2009年
8 记者 宋蕾;2009年中国出口全球第一确立[N];第一财经日报;2010年
9 先耀;最好的统计指标在人们心中[N];中国经济导报;2009年
10 李俏;浙江制定文化大省统计指标评价体系[N];中国文化报;2005年
中国博士学位论文全文数据库 前10条
1 宗瑜;聚类质量改进方法的研究[D];大连理工大学;2010年
2 纳赛尔 阿里 穆罕默德 巴拉卡特;复杂化学数据的知识发现新型化学计量学算法研究[D];湖南大学;2005年
3 曹付元;面向分类数据的聚类算法研究[D];山西大学;2010年
4 丁伟东;神经锋电位信号识别方法研究[D];上海交通大学;2008年
5 吕天阳;三维模型检索中基于聚类与基于语义方法的研究[D];吉林大学;2007年
6 苏晓珂;基于聚类的异常挖掘算法研究[D];东华大学;2010年
7 曲建华;基于群体智能的聚类分析[D];山东师范大学;2010年
8 段江娇;基于模型的时间序列数据挖掘[D];复旦大学;2008年
9 马洁;蛋白质组肽段鉴定质量控制方法的研究与应用[D];中国人民解放军军事医学科学院;2010年
10 于秀娟;加工过程的质量异常预测与诊断方法研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 瞿俊;基于重叠度的层次聚类算法研究及其应用[D];厦门大学;2007年
2 张剑;复杂网络中的层次社团发现与应用[D];北京邮电大学;2011年
3 查丰;引力聚类及其应用研究[D];安徽大学;2011年
4 孙琼;我国房地产企业流动性指标体系研究[D];中南大学;2009年
5 吴伟;联机手写蒙古文字识别技术的研究与实现[D];内蒙古大学;2005年
6 周晓昕;基于多属性特征的时态近似周期挖掘和应用[D];浙江工业大学;2008年
7 万里春;代理服务器的网页预取研究[D];西华大学;2006年
8 李海波;基于通信行为挖掘的犯罪网络分析技术研究与应用[D];上海交通大学;2007年
9 张鲲;一种混合无监督图像分割算法[D];江南大学;2008年
10 郑鹏;基于商务智能的物流客户市场细分方法研究[D];武汉科技大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026