收藏本站
收藏 | 投稿 | 论文排版

K-means聚类算法的研究和应用

熊志斌  朱剑锋  王冬  
【摘要】:介绍了K-means算法的思想,分析了在文档聚类中运用K-means算法的步骤。以开源的机器学习软件Weka为平台,详细论述在Weka上进行文档聚类的前端处理过程,利用搜狗语料库中的文档在Weka上进行了Kmeans算法的聚类测试。实验结果表明,K-means算法在Web文档聚类中表现出较好的效果。根据实验结果,分析了K-means算法存在的不足和聚类分析中特征选择的重要性。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 白莉媛;黄晖;孙增华;;基于变异的迭代k-means算法[J];计算机与数字工程;2007年04期
2 韩晓红;胡彧;;K-means聚类算法的研究[J];太原理工大学学报;2009年03期
3 刘兴波;都春;;K-means算法的改进及其在高师教学技能考评系统中的应用[J];辽宁师专学报(自然科学版);2010年04期
4 郭秀娟;战冬梅;;K-means聚类算法分析及在教师授课质量评价中的应用[J];吉林工程技术师范学院学报;2009年06期
5 柳益君;洑涵妤;蔡秋茹;何晖;罗烨;;数据挖掘在电信客户分群中的应用[J];电脑知识与技术;2008年24期
6 朱艳丽;王全蕊;;改进的K-Means算法在信用卡客户细分中的应用[J];河南科技学院学报(自然科学版);2010年01期
7 梁道雷;黄国兴;金健;;聚类分析在彩色像景织物分色处理中的应用[J];计算机科学;2006年11期
8 谭庆;;基于k-means聚类算法的试卷成绩分析研究[J];河南大学学报(自然科学版);2009年04期
9 张红荣;张峰;;传统的K-means聚类算法的研究与改进[J];咸阳师范学院学报;2010年04期
10 尹帮治;;基于K-means聚类算法的网络个性化学习行为研究[J];荆楚理工学院学报;2010年09期
11 薛军;陈英;;基于AOI的客户行为分析方法[J];计算机应用与软件;2008年06期
12 王智;;改进K-means算法在职高试卷成绩分析中的应用[J];电脑知识与技术;2010年18期
13 茹蓓;赵芳;;聚类算法在图书馆中的应用[J];新乡学院学报(自然科学版);2011年01期
14 毕硕本;裴安平;陈济民;闾国年;;聚类算法在姜寨一期聚落考古中的应用[J];计算机工程;2006年08期
15 夏锋;彭鑫;赵文耘;;基于聚类方法的审计分层抽样算法研究[J];计算机应用与软件;2008年01期
16 单蓉;;文本聚类算法的比较研究[J];内江科技;2008年12期
17 黄如静;钟诚;;融合联机分析和聚类的电信客户细分建模方法与实现[J];现代计算机(专业版);2009年04期
18 张建民;姚亮;胡学钢;;一种面向数据缺失问题的K-means改进算法[J];合肥工业大学学报(自然科学版);2008年09期
19 杨晓庆;左为恒;李昌春;;基于K-Means变异算子的混合PSO算法聚类研究[J];微电子学与计算机;2011年07期
20 孙多;陈志敏;沈洁;;一种新的基于蚁群原理的聚类算法[J];扬州大学学报(自然科学版);2008年02期
中国重要会议论文全文数据库 前10条
1 杨柳;钟诚;陆向艳;;基于P2P网络的分布式聚类算法研究分析[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
2 常郝;周国祥;;基于自组织特征映射神经网络的数据挖掘研究[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
3 李忍;孙晶;刘令君;;一个体育比赛技战术分析数据挖掘工具的设计与实现[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
4 楚红涛;寒枫;张燕;王婷;;基于数据流的挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
5 史金成;胡学钢;;基于约束的数据流聚类研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
6 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
7 朱佳贤;;无指导学习环境下基于属性相关性分析和聚类算法的属性选择问题研究[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
8 潘玉奇;石冰;周劲;袁宁;;基于多维数据模型的聚类分析的研究[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
9 丛杨;唐延东;;基于光流方程和目标匹配的视频图像目标跟踪方法[A];2006年全国光电技术学术交流会会议文集(D 光电信息处理技术专题)[C];2006年
10 彭瑶;孙季丰;;一种基于SGNN和IHS的图像融合新方法[A];第十三届全国图象图形学学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 曹锋;数据流聚类分析算法[D];复旦大学;2006年
2 唐东明;聚类分析及其应用研究[D];电子科技大学;2010年
3 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
4 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
5 魏立梅;聚类分析新方法的研究与应用[D];西安电子科技大学;1998年
6 陈华辉;基于遗忘特性的数据流概要结构及其应用研究[D];复旦大学;2008年
7 陈健美;基于密度聚类和多特征融合的医学图像识别研究[D];江苏大学;2008年
8 赵鹏;复杂网络与互联网个性化信息服务的研究[D];中国科学技术大学;2006年
9 杜修平;基于数据挖掘的证券态势估计系统[D];天津大学;2006年
10 吕天阳;三维模型检索中基于聚类与基于语义方法的研究[D];吉林大学;2007年
中国硕士学位论文全文数据库 前10条
1 谭华琴;基于蚁群算法的数据挖掘方法研究[D];武汉理工大学;2006年
2 左延权;聚类分析算法在图书管理系统中的应用研究[D];大连交通大学;2008年
3 张建辉;K-means聚类算法研究及应用[D];武汉理工大学;2007年
4 方杰;聚类算法及其在页面聚类中的应用研究[D];合肥工业大学;2009年
5 裴蕾;基于Web数据挖掘的电子商务推荐系统研究[D];同济大学;2006年
6 薛明轩;基于聚类分析的医疗保险系统[D];长春理工大学;2006年
7 易鑫;纹理图像的特征提取和聚类算法研究[D];电子科技大学;2008年
8 王天真;基于神经网络的智能数据挖掘方法及应用研究[D];上海海事大学;2003年
9 李颖慧;聚类分析技术在中国移动客户消费模式中的应用研究[D];长春工业大学;2010年
10 王文平;聚类分析及其在图像分割中的应用[D];山东师范大学;2007年
中国重要报纸全文数据库 前8条
1 湖南 头重脚轻;借个表情用用[N];电脑报;2003年
2 ;XML 与 Office XP[N];中国计算机报;2001年
3 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
4 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
5 黄绍华;让Office帮助字体听话[N];中国电脑教育报;2003年
6 黄绍华;让Office的帮助字体样式能“听话”[N];江苏经济报;2003年
7 重庆 谢军华;从Office文档中提取图片[N];电脑报;2003年
8 徐宝平;文件保存大有学问[N];中国电脑教育报;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978