收藏本站
《软件》 2011年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于Ant-Tree算法的短文本聚类研究

吴勇  李仁发  刘钰峰  
【摘要】:短文本由于词频过低,使用常规的聚类算法如K-means效果不理想,难得到可接受的准确度。而最近结合使用生物启发及聚类内部有效性测量改进的方法,能够有效改善短文本的聚类效果。针对短文本聚类,提出了改进Ant-Tree的算法。该算法引入了轮廓系数作为内部效度测量,对K-means算法获得的初始聚类划分计算轮廓系数值,根据各聚簇样本值大小排序,将排序结果应用于Ant-Tree算法的初始化步骤中,使Ant-Tree算法性能得到提高。实验结果表明,该算法准确度超过了其它的算法。
【作者单位】湖南大学计算机与通信学院;
【基金】:湖南省教育厅资助科研项目(项目编号:09C1163)~~
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 张建华;江贺;张宪超;;蚁群聚类算法综述[J];计算机工程与应用;2006年16期
【共引文献】
中国博士学位论文全文数据库 前1条
1 杨燕;基于计算智能的聚类组合算法研究[D];西南交通大学;2006年
中国硕士学位论文全文数据库 前5条
1 胡志苹;基于蚁群算法的海上消防系统航线优选研究[D];大连海事大学;2007年
2 郭里;并行层次聚类技术研究[D];湖南大学;2007年
3 吴勇;网络环境下用户行为研究与实现[D];南京理工大学;2007年
4 肖艳炜;Web访问行为分析及其在搜索引擎精准营销中的应用[D];浙江大学;2008年
5 程向荣;CSCL的伙伴模型研究[D];西南大学;2008年
【二级参考文献】
中国期刊全文数据库 前6条
1 刘涛,吴功宜,陈正;一种高效的用于文本聚类的无监督特征选择算法[J];计算机研究与发展;2005年03期
2 杨欣斌,孙京诰,黄道;基于蚁群聚类算法的离群挖掘方法[J];计算机工程与应用;2003年09期
3 杨欣斌,孙京诰,黄道;一种进化聚类学习新方法[J];计算机工程与应用;2003年15期
4 张惟皎,刘春煌,尹晓峰;蚁群算法在数据挖掘中的应用研究[J];计算机工程与应用;2004年28期
5 彭京;杨冬青;唐世渭;付艳;蒋汉奎;;一种基于语义内积空间模型的文本聚类算法[J];计算机学报;2007年08期
6 叶志伟,郑肇葆;蚁群算法中参数α、β、ρ设置的研究——以TSP问题为例[J];武汉大学学报(信息科学版);2004年07期
【相似文献】
中国重要会议论文全文数据库 前1条
1 孙承杰;朱文焕;林磊;刘远超;;BBS短文本聚类技术研究[A];第五届全国信息检索学术会议论文集[C];2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026