收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

不确定数据的高效聚类算法

李云飞  王丽珍  周丽华  
【摘要】:不确定数据聚类是数据挖掘领域中的一个重要的研究热点。本文介绍了不确定数据聚类的uk-means算法及其改进算法ck-means。由于ck-means算法必须计算每个簇到所有对象的质心的距离,因此当聚类的样本很大时,聚类效率依然不是很好。本文提出的kd-means算法只需要计算对象到部分质心的距离,因此可以很大程度地提高ck-means算法的效率。该方法是基于kd树索引而提出的改进策略,并用大量的实验来证明改进算法的有效性。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王华秋;王越;曹长修;;并行多层关联规则的挖掘算法研究[J];计算机应用;2006年02期
2 郭有强;;一种高效的关联规则维护算法研究与实现[J];计算机技术与发展;2007年10期
3 靳继红;刘淑芝;徐龙;;一种约束最大频繁项目集快速挖掘算法研究[J];海南大学学报(自然科学版);2009年04期
4 郭有强;胡学钢;;快速挖掘频繁模式算法研究与实现[J];微电子学与计算机;2007年12期
5 郭有强;;关联规则快速聚焦算法研究与实现[J];微电子学与计算机;2008年02期
6 李芸;李青山;;基于约束的最大频繁项集挖掘算法[J];计算机工程与应用;2007年17期
7 郭有强;;减量式频集快速维护算法研究与实现[J];计算机应用与软件;2010年03期
8 倪志伟;叶红云;曹欢欢;;基于均值约束满足度剪枝策略的高效序列模式挖掘算法[J];中国科学技术大学学报;2007年02期
9 梁茵;;分类回归树算法的探讨[J];广东技术师范学院学报;2008年06期
10 王卉,李庆华,马传香,李肯立;频繁模式挖掘中的剪枝策略[J];计算机工程与科学;2003年04期
11 蒋艳凰,杨学军,赵强利;具有高可理解性的二分决策树生成算法研究(英文)[J];软件学报;2003年12期
12 黎娅;郭江娜;;决策树的剪枝策略研究[J];河南科学;2009年03期
13 王卉;张红君;;关联挖掘研究综述[J];软件导刊;2009年03期
14 马洋;张继福;张素兰;;基于剪枝的约束概念格的渐进式构造算法[J];计算机应用;2009年05期
15 张德龙;杜宇;于薄天;杨鹏;;基于四叉树的气象图像的编码与压缩[J];内蒙古科技与经济;2011年05期
16 王丹;张浩;陆剑峰;;针对高项频繁集的关联规则改进算法[J];计算机工程;2006年24期
17 段富;曾祥东;牛保宁;;决策树方法在煤炭物流客户分析中的应用[J];计算机工程与应用;2010年10期
18 李军,刘晓明,刘贤梅;提高连续语音识别速度的策略[J];大庆石油学院学报;2005年04期
19 高伟;赵致琢;李慧琪;昌杰;;Gdel语言控制机制的研究与实现[J];智能系统学报;2009年04期
20 胡立华;张继福;张素兰;;基于剪枝的概念格渐进式构造[J];计算机应用;2006年07期
中国重要会议论文全文数据库 前10条
1 孙永佼;王国仁;;P2P环境中不确定数据Top-k查询处理算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 陆叶;王丽珍;张晓峰;;从不确定数据集中挖掘频繁Co-location模式[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
3 周帅印;李晨;王勇;张阳;;FDTU:针对不确定数据的快速决策树生成算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
4 田春艳;杨保安;赵林;;基于神经网络的规则抽取技术在贷款风险预警研究中的应用[A];管理科学与系统科学研究新进展——第8届全国青年管理科学与系统科学学术会议论文集[C];2005年
5 曾薇;孟祥旭;杨承磊;黄磊;李学庆;;基于离散隐Markov模型的在线手写体识别系统[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
6 周逊;李建中;石胜飞;;不确定数据上聚集查询的分布式处理算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
7 张潮;李晨;王勇;张阳;;uPOSC4.5:一种针对不确定数据的PU学习决策树算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 高波;孙维连;孟庆佳;范文静;;ZL101A铝合金车轮热处理工艺的优化研究[A];全国材料科学中的数学应用研讨会论文集[C];2010年
9 王彤;;对Web使用记录挖掘算法的改进[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
10 陈丹雯;吴玲达;;一种基于互增强原则的视频检索重排序方法[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 高明;不确定数据的世系管理和相似性查询[D];复旦大学;2011年
2 张晨;数据流聚类分析与异常检测算法[D];复旦大学;2009年
3 陶煜波;基于图形硬件的快速电磁计算方法与系统[D];浙江大学;2009年
4 吴庆阳;线结构光三维传感中关键技术研究[D];四川大学;2006年
5 安玉娥;应用于大规模动力系统中的基于SVD-Krylov的模型简化方法[D];上海大学;2010年
6 李先通;图数据查询技术的研究[D];哈尔滨工业大学;2009年
7 叶明;多级混流生产线动态调度系统关键技术研究与应用[D];南京航空航天大学;2007年
8 董杰;基于位表的关联规则挖掘及关联分类研究[D];大连理工大学;2009年
9 余光柱;高效用关联规则的挖掘[D];东华大学;2008年
10 李笕列;流程企业模型与数据管理研究[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 李云飞;大型不确定数据库的有效聚类[D];云南大学;2011年
2 王烁;关联规则数据挖掘中经典频集算法改进的研究[D];天津大学;2003年
3 朱倩;属性不确定数据关联分类算法研究[D];大连理工大学;2011年
4 郭聪敏;图集的子图查询算法研究[D];燕山大学;2012年
5 由军平;基于粗糙集理论的决策树剪枝[D];东北师范大学;2006年
6 何丽娟;无线传感器网络中不确定数据处理的研究[D];安徽工程大学;2011年
7 迟庆云;基于决策树的分类算法研究和应用[D];山东师范大学;2005年
8 高聪;Deep Web下不确定数据处理的研究[D];东北大学;2008年
9 覃香菊;不确定数据上的关联分类器[D];西北农林科技大学;2011年
10 陈慧;基于概念格的多数据源中分类规则挖掘研究[D];合肥工业大学;2006年
中国重要报纸全文数据库 前10条
1 记者潘跃;职业道德“双十佳”将获全国五一劳动奖状奖章[N];人民日报;2003年
2 王娇萍;全国职工职业道德建设“双十佳”评选揭晓[N];工人日报;2004年
3 记者张淑会;河北农大学子深入山区搞服务[N];河北日报;2002年
4 本报记者 李忱 王方杰;“香梨之乡”新事多[N];人民日报;2002年
5 姚桂林;提高品质是国产水果必由之路[N];中华合作时报;2002年
6 姚桂林;水果竞争呼唤质量标准[N];中国消费者报;2002年
7 编译 刘光强 许继楠;风险管理智能了,金融创新不怕了[N];中国计算机报;2010年
8 郑智文;“入世”后我国中药材种植所面临的几大困惑[N];中国中医药报;2002年
9 毛文波;从“三国演义”到“楚汉相争”[N];科技日报;2004年
10 本报记者 扎巴贡觉;十位青年获全国各族青年团结进步杰出奖[N];西藏日报;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978