收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

属性加权的类属型数据非模聚类

陈黎飞  郭躬德  
【摘要】:类属型数据广泛分布于生物信息学等许多应用领域,其离散取值的特点使得类属数据聚类成为统计机器学习领域一项困难的任务.当前的主流方法依赖于类属属性的模进行聚类优化和相关属性的权重计算.提出一种非模的类属型数据统计聚类方法.首先,基于新定义的相异度度量,推导了属性加权的类属数据聚类目标函数.该函数以对象与簇之间的平均距离为基础,从而避免了现有方法以模为中心导致的问题.其次,定义了一种类属型数据的软子空间聚类算法.该算法在聚类过程中根据属性取值的总体分布,而不仅限于属性的模,赋予每个属性衡量其与簇类相关程度的权重,实现自动的特征选择.在合成数据和实际应用数据集上的实验结果表明,与现有的基于模的聚类算法和基于蒙特卡罗优化的其他非模算法相比,该算法有效地提高了聚类结果的质量.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘芳,何飞;一种基于聚类树的增量式数据清洗算法[J];华中科技大学学报(自然科学版);2005年03期
2 戴颖;李兴国;赵启飞;;一种相似重复记录检测算法的改进研究[J];计算机技术与发展;2010年07期
3 李小妹;王能超;;三角网格模型的快速树搜索算法及可设计性分析[J];计算机科学;2005年12期
4 龚科华;邱桃荣;熊树洁;徐苏;;基于覆盖粗糙集模型的层次聚类算法[J];计算机工程与设计;2009年22期
5 管宇,邹林灿,陈为,彭群生;基于粒子系统的实时瀑布模拟[J];系统仿真学报;2004年11期
6 许宏丽;须德;林恩爱;;一种基于子空间聚类的图像分层索引方法[J];中国图象图形学报;2009年01期
7 郑君君;夏胜平;李新光;祝一薇;刘建军;谭立球;;基于RSOM树的图像K近邻求解算法[J];山东大学学报(工学版);2011年02期
8 陈钢,冯志勇,金辉;基于GT编码的零件聚类树的建立[J];中国制造业信息化;2003年06期
9 李士进;朱跃龙;刘净;;一种基于k-prototype的多层次聚类改进算法[J];河海大学学报(自然科学版);2007年03期
10 温济川;;基于自寻优层次聚类的孤立点分析[J];计算机系统应用;2008年04期
11 王妍;宋宝燕;张佳旸;张洪梅;李晓光;;基于标签编码的Deep Web查询接口识别方法[J];计算机应用;2011年05期
12 梁斌梅;韦琳娜;宋庆祯;;一种基于层次聚类的全局孤立点识别方法[J];计算机应用研究;2011年05期
13 刘燕;邝颖杰;;基于聚类索引树的高维近似检索算法[J];现代计算机;2007年03期
14 葛诗利;陈潇潇;;文本聚类在大学英语作文自动评分中应用[J];计算机工程与应用;2009年06期
15 王磊;杜利民;王劲林;;基于音频的电视新闻节目的主题检索和聚类[J];电子与信息学报;2007年10期
16 刘建军;祝一薇;李新光;夏胜平;郁文贤;;基于超图模型的图像目标识别[J];计算机工程;2010年21期
17 陈园园;侯庆;;粒子系统和LOD技术在三维场景中的运用[J];贵州工业大学学报(自然科学版);2006年02期
18 余肖生;周宁;张芳芳;;高维数据可视化方法研究[J];情报科学;2007年01期
19 王瑢瑢;邱显杰;王文中;王兆其;;一种视频驱动的三维人体动画合成方法[J];系统仿真学报;2007年08期
20 谢坤武;陈世强;毕晓玲;;关联规则发现中的聚类方法[J];计算机科学;2007年08期
中国重要会议论文全文数据库 前10条
1 钱卫宁;钱海蕾;周傲英;;构造准确的多粒度聚类树:一种交互式的方法[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 钱海蕾;钱卫宁;周傲英;;对于聚合聚类终止条件的研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
3 钱卫宁;钱海蕾;周傲英;;聚类树合并——聚类超大规模数据库[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
4 郑君君;李新光;祝一薇;刘建军;夏胜平;谭立球;;海量图像集中K近邻求解的高效算法[A];第十五届全国图象图形学学术会议论文集[C];2010年
5 谭立球;谷士文;夏胜平;;基于RSOM和KNN的图像内容检索[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
6 谢坤武;陈世强;;一种分类数据的聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
7 陈怀松;严新平;;铁谱图像分类及磨粒识别的两种方法和应用[A];第二届全国工业摩擦学大会暨第七届全国青年摩擦学学术会议会议论文集[C];2004年
8 王保红;李兰娟;李旻;张梦晖;赵立平;;一四世家庭肠道菌群群结构和代谢组模式特征的研究[A];中华医学会全国第九次感染病学学术会议论文汇编[C];2006年
9 任家东;孟丽丽;张冬梅;;一种基于网格的改进的K-Means聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
10 侯跃芳;潘雪;崔雷;;两种内容词聚类方法反映学科热点的效果评价[A];中华医学会第十二次全国医学信息学术会议论文汇编[C];2006年
中国博士学位论文全文数据库 前10条
1 张琳;基于期刊聚类的科学结构研究[D];大连理工大学;2010年
2 李丹;基于流聚类的网络业务识别关键技术研究[D];北京邮电大学;2013年
3 刘建军;基于图像局部不变特征的类属超图构建与目标识别技术研究[D];国防科学技术大学;2010年
4 任艳;基于公理模糊集与支持向量机的知识发现方法与应用研究[D];大连理工大学;2011年
5 柳斌;P2P流的测量与识别方法研究[D];华中科技大学;2008年
6 夏东;智能视频监控中目标检测、跟踪和识别方法研究[D];国防科学技术大学;2012年
7 陈国娟;卧龙自然保护区不同海拔的中国沙棘(Hippophae rhamnoides subsp.sinensis)天然群体的遗传多样性分析[D];中国科学院研究生院(成都生物研究所);2007年
8 杨述林;1.十八个中国地方猪品种遗传多样性分析  2.猪特定群体定位QTL的效率研究[D];华中农业大学;2004年
9 陈红菊;泰山赤鳞鱼BMP11基因表达规律及分子进化研究[D];山东农业大学;2008年
10 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
中国硕士学位论文全文数据库 前10条
1 陈武;多类标聚类树分类方法优化及并行化实现[D];哈尔滨工业大学;2013年
2 王玉瑛;量子聚类及其在社团检测中的应用[D];西安电子科技大学;2014年
3 张琦;基于Hadoop平台并行Overlapping聚类算法研究[D];西南交通大学;2014年
4 陈西伟;基于谱方法的聚类算法及其应用的研究[D];兰州大学;2014年
5 赵峥;基于两种改进的聚类算法对新浪微博用户信息的研究[D];首都经济贸易大学;2014年
6 赖春昉;基于CNM聚类的无向图可视化研究[D];电子科技大学;2010年
7 洪源;自适应多趟聚类算法在无线网络数据中的研究与应用[D];广东工业大学;2014年
8 谭本军;基于K-means聚类融合算法及在移动客户细分中的应用[D];中南大学;2010年
9 冯晓蒲;基于实际负荷曲线的电力用户分类技术研究[D];华北电力大学;2011年
10 杨颖;基于共词分析的学科结构可视化研究[D];中国医科大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978