收藏本站
《模式识别与人工智能》 2009年06期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于协同聚类的两阶段文本聚类方法

王明文  付剑波  罗远胜  陆旭  
【摘要】:为了将语义信息用于文本聚类和有效地进行特征选择,文中提出一种基于协同聚类的两阶段文本聚类方法.该方法分别对文档和特征进行聚类从而得到特征与主题之间的语义关联关系.然后利用此关系来相互调整彼此的聚类结果.实验结果表明,利用特征与主题之间的语义关联关系能有效提高聚类效果.

【参考文献】
中国期刊全文数据库 前4条
1 周水庚,周傲英,曹晶,胡运发;一种基于密度的快速聚类算法[J];计算机研究与发展;2000年11期
2 王爱华,张铭,杨冬青,唐世渭;PCCS部分聚类分类:一种快速的Web文档聚类方法[J];计算机研究与发展;2001年04期
3 刘涛,吴功宜,陈正;一种高效的用于文本聚类的无监督特征选择算法[J];计算机研究与发展;2005年03期
4 严莉莉;张燕平;;基于类信息的文本聚类中特征选择算法[J];计算机工程与应用;2007年12期
【共引文献】
中国期刊全文数据库 前10条
1 张敏;;贝叶斯分类方法在个性化信息检索中的应用研究[J];电脑学习;2006年02期
2 蔡江辉,张华煜;离群数据挖掘方法研究[J];电脑开发与应用;2005年12期
3 庞士梅;;覆盖聚类在Web信息检索中的应用研究[J];大学图书情报学刊;2006年04期
4 马张华;陈文广;金海燕;朱剑俊;崔会娟;刘贞君;;基于控制词集的中文信息动态自动聚类研究[J];大学图书馆学报;2006年06期
5 周永权,焦李成;高属性维稀疏数据聚类回归逻辑神经网络模型及学习算法[J];电子学报;2004年08期
6 刘远超;王晓龙;刘秉权;钟彬彬;;信息检索中的聚类分析技术[J];电子与信息学报;2006年04期
7 何中市;徐浙君;;一种新型的文本无监督特征选择方法[J];重庆大学学报(自然科学版);2007年06期
8 贾磊;丁冠华;;数据挖掘中的K-means算法及改进[J];福建电脑;2006年11期
9 杨桂芝;;PCCS聚类信息过滤模型[J];福建电脑;2007年03期
10 樊明辉;林甲祥;;一种新的考虑空间实体约束的空间聚类算法[J];福建电脑;2008年09期
中国重要会议论文全文数据库 前7条
1 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
2 王静帆;夏云庆;郑方;邬晓钧;;二阶段招聘信息检索方法[A];第九届全国人机语音通讯学术会议论文集[C];2007年
3 宫蕊;舒红平;郭远远;;基于DBSCAN的密度聚类算法的研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
4 刘彤;孙永香;张振洪;;一种有效的基于密度和层次的聚类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
5 康卫鲜;叶德谦;;基于CURE的聚类算法研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
6 张艳;周国祥;;Web挖掘在个性化信息检索中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 王明文;付剑波;罗远胜;陆旭;;基于协同聚类的两阶段文本聚类方法研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前10条
1 罗三定;基于机器视觉的分钢关键技术研究及其应用[D];中南大学;2006年
2 傅涛;基于数据挖掘的分布式网络入侵协同检测系统研究及实现[D];南京理工大学;2008年
3 孙志伟;空间数据聚类的研究[D];天津大学;2007年
4 张晓利;基于非参数回归的短时交通流量预测方法研究[D];天津大学;2007年
5 晏华;交易数据的聚类分析[D];电子科技大学;2008年
6 王阗;信息度优先算法及在森林资源统计分析中的应用[D];南京林业大学;2007年
7 胡瑞飞;面向机械工程计算机测试系统的数据挖掘技术研究[D];四川大学;2006年
8 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
9 何清;机器学习与文本挖掘若干算法研究[D];中国科学院研究生院(计算技术研究所);2002年
10 单世民;基于网格和密度的数据流聚类方法研究[D];大连理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 马玉静;基于群体智能的文本聚类技术研究[D];燕山大学;2009年
2 王立锟;基于滑动窗口的流数据聚类挖掘研究[D];西南交通大学;2009年
3 穆珺;基于密度模式的参数自适应聚类算法研究[D];中南大学;2009年
4 徐家宁;基于免疫网络的文本挖掘方法研究[D];长沙理工大学;2008年
5 郭建永;聚类分析在文本挖掘中的应用与研究[D];江南大学;2008年
6 严勇;数据挖掘中聚类分析算法研究与应用[D];电子科技大学;2007年
7 杨杨;基于约束的空间聚类的研究[D];天津大学;2007年
8 聂跃光;基于密度聚类的空间数据挖掘算法研究[D];太原科技大学;2008年
9 李静;基于Delaunay三角网的有障碍物聚类算法研究[D];太原科技大学;2008年
10 王玉伟;面向用户兴趣的web文档聚类研究[D];中国石油大学;2008年
【二级参考文献】
中国期刊全文数据库 前8条
1 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
2 刘涛,吴功宜,陈正;一种高效的用于文本聚类的无监督特征选择算法[J];计算机研究与发展;2005年03期
3 陈涛,谢阳群;文本分类中的特征降维方法综述[J];情报学报;2005年06期
4 李凡,鲁明羽,陆玉昌;关于文本特征抽取新方法的研究[J];清华大学学报(自然科学版);2001年07期
5 马帅,王腾蛟,唐世渭,杨冬青,高军;一种基于参考点和密度的快速聚类算法[J];软件学报;2003年06期
6 周水庚,关佶红,胡运发;隐含语义索引及其在中文文本处理中的应用研究[J];小型微型计算机系统;2001年02期
7 钟宁,尹旭日,陈世福;基于信息增益的最佳属性集发现方法[J];小型微型计算机系统;2002年04期
8 刘明吉,王秀峰,饶一梅,黄亚楼;Web文本信息的特征获取算法[J];小型微型计算机系统;2002年06期
【相似文献】
中国期刊全文数据库 前10条
1 张锋,樊孝忠,许云;基于遗传算法的文本聚类特征选择[J];华南理工大学学报(自然科学版);2004年S1期
2 刘涛,吴功宜,陈正;一种高效的用于文本聚类的无监督特征选择算法[J];计算机研究与发展;2005年03期
3 严莉莉;张燕平;;基于类信息的文本聚类中特征选择算法[J];计算机工程与应用;2007年12期
4 任江涛;孙婧昊;施潇潇;黄焕宇;印鉴;;一种用于文本聚类的改进的K均值算法[J];计算机应用;2006年S1期
5 黄迎春;李晓晔;邓文新;;文本挖掘技术的研究[J];齐齐哈尔大学学报;2006年03期
6 章新华;一种特征选择的动态规划方法[J];自动化学报;1998年05期
7 韩览山,邵贝恩;KDD中的特征选择[J];计算机工程与应用;2002年22期
8 李彦平,张佳骥;文本聚类中的降维技术研究[J];无线电工程;2005年06期
9 彭佳红,沈岳,张林峰;数据挖掘中的特征选择及其算法研究[J];计算机工程与设计;2005年05期
10 杨打生,艾华;第一特征选择的信息论方法[J];内蒙古师范大学学报(自然科学汉文版);2005年01期
中国重要会议论文全文数据库 前10条
1 马艳;李志舜;;一种水下目标特征选择的方法[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
2 姚凯丰;陆文凯;张善文;肖焕钦;李衍达;;基于特征扩展和特征选择的油气预测方法[A];CPS/SEG2004国际地球物理会议论文集[C];2004年
3 张宝艳;王庆辉;;中文文本聚类的研究与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
4 丁堃;许侃;;基于文本聚类方法的我国科技管理研究领域的计量研究[A];第三届科技政策与管理学术研讨会暨第二届科教发展战略论坛论文汇编[C];2007年
5 高海华;王行愚;杨辉华;;基于群智能和SVM的网络入侵特征选择和检测[A];2005年中国智能自动化会议论文集[C];2005年
6 朱强生;田英;周延泉;何华灿;;基于非负因子分析的模糊文本挖掘[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
7 袁骏;孙进才;汪洋;;基于数据挖掘技术的水下目标识别[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
8 张刚;周昭涛;王斌;;基于主题的分布式信息检索研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
9 张莉;孙钢;郭军;;基于无监督学习的特征选择方法[A];2004中国控制与决策学术年会论文集[C];2004年
10 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 周晓娟;TD已过分水岭[N];通信产业报;2008年
2 潘希;文本数据流聚类:在海量信息中挖掘真金[N];科学时报;2008年
3 天相投顾 闻群王聃聃;选基金需考虑风险承受力[N];中国证券报;2007年
4 孙志伟;刘刚检查城防林建设[N];齐齐哈尔日报;2008年
5 郑卫东;高产鹅选种方法和标准[N];中国畜牧兽医报;2007年
6 本刊特稿 陈岩;鲁西南村名的文化解读[N];济宁日报;2007年
7 海通证券 娄静吴先兴;把握风险收益特征选择最适合自己的基金[N];上海证券报;2007年
8 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
9 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
10 张小东;促销之十大常见误区(一)[N];黑龙江经济报;2006年
中国博士学位论文全文数据库 前10条
1 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
2 高宏力;切削加工过程中刀具磨损的智能监测技术研究[D];西南交通大学;2005年
3 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
4 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
5 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
6 韦娜;基于内容图像检索关键技术研究[D];西北大学;2006年
7 吕铁军;通信信号调制识别研究[D];电子科技大学;2000年
8 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
9 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 胡吉祥;基于频繁模式的消息文本聚类研究[D];中国科学院研究生院(计算技术研究所);2006年
2 许征;电力系统中基于学习理论的特征选择方法研究[D];清华大学;2004年
3 谷波;基于粗集模型的聚类方法及其在文献过滤系统中的应用[D];山西大学;2004年
4 王晓甦;基于代表点的数据和文本聚类新方法的研究[D];天津大学;2006年
5 王大昕;0-1规划及其在特征提取中的应用[D];福州大学;2005年
6 郑晓亮;基于改进FCM算法的无字典中文文本聚类方法研究[D];浙江大学;2007年
7 刘延亮;一种文本聚类原型系统的设计与实现[D];大连理工大学;2006年
8 苏芳仲;中文Web文本挖掘的若干关键技术研究及其实现[D];福州大学;2006年
9 朱红灿;基于SOM的两阶段中文文本聚类算法的研究[D];湘潭大学;2005年
10 王曙光;基于蚁群的文本聚类算法的改进研究[D];大连理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026