收藏本站
《电脑开发与应用》 2010年08期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于网络舆情的K-Means算法的改进研究

罗晖霞  曲晓玲  
【摘要】:传统的K-Means聚类算法只能保证收敛到局部最优,从而导致聚类结果对初始代表点的选择非常敏感;凝聚层次聚类虽无需选择初始的聚类中心,但计算复杂度较高,而且凝聚过程不可逆。结合网络舆情的特点,深入剖析了K-Means聚类算法和凝聚层次聚类算法的优缺点,对K-Means聚类算法进行改进。改进后算法的核心思想是,结合两种算法分别在初始点选择和聚类过程两个方面的优势,进行整合优化。通过实验分析及实际应用表明,改进后的文本聚类算法在很大程度上可以提高网络舆情信息聚类结果的准确性、有效性以及算法的效率。
【作者单位】中北大学;山西省政府办公厅;
【基金】:山西人事厅资助项目(SX20090108-07)
【分类号】:TP301.6

【参考文献】
中国硕士学位论文全文数据库 前1条
1 郑军;网络舆情监控的热点发现算法研究[D];哈尔滨工程大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
2 林鸿飞,马雅彬;基于聚类的文本过滤模型[J];大连理工大学学报;2002年02期
3 刘志成,文全刚;“K-中心点”聚类算法分析及其实现[J];电脑知识与技术;2005年06期
4 苏云升;周如俊;;网络舆情与思想政治教育[J];广东青年干部学院学报;2005年04期
5 董继锋;韩作胜;李华峰;石蔚云;张润祥;王立群;;突发公共卫生事件疾控机构监测预警系统探讨[J];医药论坛杂志;2006年02期
6 吴斌,傅伟鹏,郑毅,刘少辉,史忠植;一种基于群体智能的Web文档聚类算法[J];计算机研究与发展;2002年11期
7 张猛,王大玲,于戈;一种基于自动阈值发现的文本聚类方法[J];计算机研究与发展;2004年10期
8 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
9 姜宁,宫秀军,史忠植;高维特征空间中文本聚类研究[J];计算机工程与应用;2002年10期
10 王升明,李淼;一种基于改进的自组织特征映射网络的文档聚类方法[J];计算机工程与应用;2005年03期
中国博士学位论文全文数据库 前2条
1 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
2 张颖;数据采掘的研究与应用[D];中国科学院研究生院(计算技术研究所);1999年
中国硕士学位论文全文数据库 前2条
1 郑军;网络舆情监控的热点发现算法研究[D];哈尔滨工程大学;2007年
2 张建辉;K-means聚类算法研究及应用[D];武汉理工大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 张焕明;;网络舆情分析系统的研究与设计[J];微计算机信息;2010年18期
2 汤寒青;王汉军;;改进的K-means算法在网络舆情分析中的应用[J];计算机系统应用;2011年03期
3 王珍珍;;关于文本挖掘中文本分类与文本聚类的研究[J];科技信息;2007年06期
4 张亮;;Web数据挖掘在群体性事件预警系统中的应用[J];光盘技术;2009年06期
5 姜宁,史忠植;文本聚类中的贝叶斯后验模型选择方法[J];计算机研究与发展;2002年05期
6 韩腊萍,余雪丽;一个分布式入侵检测系统框架设计[J];计算机工程;2004年13期
7 郭庆琳,樊孝忠;基于文本聚类和NLU的自动文摘系统的研究与实现[J];现代电力;2004年04期
8 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
9 郭庆琳;樊孝忠;柳长安;;基于文本聚类的自动文摘系统的研究与实现[J];计算机工程;2006年04期
10 谢海光;陈中润;;互联网内容及舆情深度分析模式[J];中国青年政治学院学报;2006年03期
中国重要会议论文全文数据库 前10条
1 张猛;王大玲;于戈;;一种基于自动阈值发现的文本聚类方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 王乐;田李;贾焰;韩伟红;;一个并行的文本聚类混合算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
3 张宝艳;王庆辉;;中文文本聚类的研究与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
4 张刚;周昭涛;王斌;;基于主题的分布式信息检索研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
5 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 黎琳;;Web内容挖掘在数字图书馆中的应用[A];中国工程物理研究院第七届电子技术青年学术交流会论文集[C];2005年
7 彭怡;;从数据挖掘文章聚类分析看其发展趋势[A];现代工业工程与管理研讨会会议论文集[C];2006年
8 朱强生;田英;周延泉;何华灿;;基于非负因子分析的模糊文本挖掘[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
9 罗娜;左万利;袁福宇;张靖波;张慧杰;;使用本体语义提高文本聚类(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
10 颜端武;李晓鹏;王磊;成晓;;文本聚类中基于本体的相似性测度(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
中国重要报纸全文数据库 前2条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
2 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
2 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
3 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
4 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
5 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
6 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
7 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
8 宣照国;文本挖掘算法及其在知识管理中的应用研究[D];大连理工大学;2008年
9 王乐;短语消息聚类相关技术研究[D];国防科学技术大学;2008年
10 马荔;突发事件网络舆情政府治理研究[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 庞俊;基于确定话题和情感极性的博客文本聚类研究[D];武汉理工大学;2010年
2 何晏成;基于近邻传播和凝聚层次的文本聚类方法[D];哈尔滨工业大学;2010年
3 张金;个性化信息检索系统中文本聚类的研究[D];东北师范大学;2010年
4 于丽丽;基于DK-Means算法的文本聚类的研究与实现[D];东北大学;2008年
5 李梅;改进的K均值算法在中文文本聚类中的研究[D];安徽大学;2010年
6 王飞;基于蚁群优化的模糊文本聚类算法研究[D];河南工业大学;2010年
7 刘延亮;一种文本聚类原型系统的设计与实现[D];大连理工大学;2006年
8 谷波;基于粗集模型的聚类方法及其在文献过滤系统中的应用[D];山西大学;2004年
9 胡海龙;基于改进的后缀树算法的中英文聚类引擎的实现[D];吉林大学;2008年
10 陈小丽;基于SOM算法的中文文本聚类[D];南京理工大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026