收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

使用“分裂-合并"策略改进文本聚类集成算法的研究

卢志茂  徐森  刘远超  顾国昌  
【摘要】:探讨了"分裂-合并"(DM)策略对文本聚类集成算法改进的效果。首先在聚类成员生成阶段运行使用DM策略的超球K均值(SKM)算法r次,每次生成较多的文本子簇,并根据子簇的相似性使用凝聚层次聚类方法合并这些子簇,得到r个聚类成员,随后在聚类集成阶段采用两个快速的谱聚类算法进行集成。在6组真实文本集上进行了实验,使用DM策略的两个聚类集成算法获得的平均标准化互信息(NMI)分别比改进前的算法提高了4.6和7.9个百分点,证明了DM策略可以有效提高文本聚类集成算法的聚类质量。

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 徐森;卢志茂;顾国昌;;解决文本聚类集成问题的两个谱算法[J];自动化学报;2009年07期
2 徐森;卢志茂;顾国昌;;文本聚类集成问题中的谱算法[J];控制与决策;2009年08期
3 朱长明;李晶;顾国昌;宫滨生;刘海波;沈晶;;谱聚类集成的淋巴结超声图像分割算法[J];计算机辅助设计与图形学学报;2009年10期
4 徐森;卢志茂;顾国昌;;基于矩阵谱分析的文本聚类集成算法[J];模式识别与人工智能;2009年05期
5 徐森;卢志茂;顾国昌;;使用谱聚类算法解决文本聚类集成问题[J];通信学报;2010年06期
6 郭昆;张岐山;;基于灰关联分析的谱聚类[J];系统工程理论与实践;2010年07期
7 高琰;谷士文;唐琎;蔡自兴;;一种基于互信息的模糊聚类集成算法[J];小型微型计算机系统;2007年06期
8 金慧珍;赵辽英;;大规模数据集的多层聚类算法[J];杭州电子科技大学学报;2008年03期
9 朱庆生;钟洵;杨鹏;;NJW在离群数据挖掘中的应用研究[J];计算机工程与应用;2010年07期
10 罗会兰;危辉;;基于数学形态学的聚类集成算法[J];计算机科学;2010年08期
中国重要会议论文全文数据库 前3条
1 花贵春;张敏;刘奕群;马少平;茹立云;;基于查询聚类的排序学习算法[A];第五届全国信息检索学术会议论文集[C];2009年
2 谢永康;周雅倩;黄萱菁;;一种基于谱聚类的共指消解方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
3 郑建军;甘仞初;贺跃;毕思飞;;一种基于k-means的聚类集成方法[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 孔敏;关联图的谱分析及谱聚类方法研究[D];安徽大学;2006年
2 马杰;硅晶片缺陷模式分析研究[D];天津大学;2006年
3 高琰;基于多特征的Web社区发现关键技术研究[D];中南大学;2007年
4 李东方;Web 2.0环境下互联网信息过滤理论与方法研究[D];中国科学技术大学;2009年
5 幸锐;基于纹理的图像聚类研究[D];浙江大学;2009年
6 罗会兰;聚类集成关键技术研究[D];浙江大学;2007年
7 谷瑞军;基于流形学习的高维空间分类器研究[D];江南大学;2008年
8 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
9 丁军娣;复杂结构的聚类学习及图像分割研究[D];南京航空航天大学;2008年
10 陈远浩;非监督的结构学习及其应用[D];中国科学技术大学;2008年
中国硕士学位论文全文数据库 前10条
1 毕竞;应用于视频内容分析的话者辨识系统[D];北京邮电大学;2008年
2 谢维;基于多线索融合的互联网图像搜索引擎关键技术研究[D];浙江大学;2006年
3 谢永康;一种基于谱聚类的共指消解方法[D];复旦大学;2009年
4 王国栋;相似矩阵与谱聚类[D];北京交通大学;2009年
5 刘净;基于多分类器集成的聚类算法研究[D];河海大学;2007年
6 付艳秋;数据挖掘中模糊聚类与聚类集成研究[D];西南交通大学;2008年
7 施培蓓;数据挖掘技术中聚类算法的研究[D];江南大学;2008年
8 刘华;专家—申请书分组匹配算法和项目申报管理系统[D];北京交通大学;2009年
9 陈应良;图像谱方法分割的研究及应用[D];江南大学;2008年
10 杨丽丽;基于SEAM算法的集成聚类及在文本应用中的研究[D];北京交通大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978