收藏本站
《西华师范大学学报(自然科学版)》 2009年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

文本聚类中的特征降维方法研究

毛嘉莉  
【摘要】:文本聚类的关键是对高维的特征集进行降维.本文对常用的一些特征选择、特征抽取等主流特征降维方法进行了介绍,分析了它们各自的特点及其适用范围.
【作者单位】西华师范大学计算机学院;
【基金】:四川省教育厅重点科研项目(07ZA121)
【分类号】:TP391.41

【参考文献】
中国期刊全文数据库 前3条
1 高茂庭;王正欧;;几种文本特征降维方法的比较分析[J];计算机工程与应用;2006年30期
2 陈涛,谢阳群;文本分类中的特征降维方法综述[J];情报学报;2005年06期
3 苏金树;张博锋;徐昕;;基于机器学习的文本分类技术研究进展[J];软件学报;2006年09期
【共引文献】
中国期刊全文数据库 前10条
1 贾花萍;;基于神经网络的特征选择与提取方法研究[J];办公自动化;2008年14期
2 陈爽;陈福;杜天苍;;一种启发式网络信息采集系统设计与实现[J];北京石油化工学院学报;2007年04期
3 黄文良;李石坚;刘菊新;徐从富;;一个大规模垃圾短信实时过滤系统[J];北京邮电大学学报;2008年03期
4 李家兵;;基于交叉覆盖算法的文本分类研究[J];滁州学院学报;2008年05期
5 陈思;钱铭宇;刘昌明;;文本分类技术研究进展[J];电脑编程技巧与维护;2009年S1期
6 刘颖;;基于随机关键词技术的文本特征降维[J];电脑与信息技术;2008年04期
7 李鹏;王晓龙;刘远超;王宝勋;;一种基于混合策略的失衡数据集分类方法[J];电子学报;2007年11期
8 张博锋;白冰;苏金树;;基于自训练EM算法的半监督文本分类[J];国防科技大学学报;2007年06期
9 刘健;钱猛;张维明;;基于Fisher线性判别模型的文本特征选择算法[J];国防科技大学学报;2008年05期
10 孙士保;李保元;李天瑞;吴正江;郑瑞娟;;基于类内关键词的中文文本分类模型的改进[J];广西师范大学学报(自然科学版);2009年03期
中国重要会议论文全文数据库 前9条
1 黄文良;李石坚;刘菊新;徐从富;;大规模垃圾短信实时过滤系统的设计与实现[A];中国通信学会第五届学术年会论文集[C];2008年
2 李文波;孙乐;黄瑞红;冯元勇;张大鲲;;基于Labeled-LDA模型的文本分类新算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 王辉;左万利;;利用质心向量构建增量式分类器(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 刘健;张维明;;基于文本概念序列的非线性分析方法初探[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 黄云平;孙乐;李文波;;基于上下文图模型文本表示的文本分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 ;Text Feature Automatic Selection Algorithm Based on Cloud Model[A];第五届全国信息检索学术会议论文集[C];2009年
7 张爱华;靖红芳;王斌;徐燕;;文本分类中特征权重因子的作用研究[A];第五届全国信息检索学术会议论文集[C];2009年
8 ;A method and its application for Business-Process oriented knowledge classification[A];Proceedings of 2009 IEEE the 16th International Conference on Industrial Engineering and Engineering Management(Vol.2)[C];2009年
9 代劲;何中市;胡峰;;一种高性能的文本特征自动提取算法[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
中国博士学位论文全文数据库 前10条
1 杨创新;基于机器学习的高性能中文文本分类研究[D];华南理工大学;2009年
2 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
3 刘健;面向信息检索的文本信息组织关键技术研究[D];国防科学技术大学;2009年
4 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
5 徐婕;基于对等网络的资源搜索策略的研究[D];华中科技大学;2007年
6 秦玉平;基于支持向量机的文本分类算法研究[D];大连理工大学;2008年
7 宣照国;文本挖掘算法及其在知识管理中的应用研究[D];大连理工大学;2008年
8 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年
9 黄文良;垃圾短信过滤关键技术研究[D];浙江大学;2008年
10 郝秀兰;文本分类技术与应用研究[D];复旦大学;2008年
中国硕士学位论文全文数据库 前10条
1 谢文兰;基于BP神经网络的语义风景图像检索技术的研究[D];湘潭大学;2009年
2 赵光甫;WEB主题信息搜集技术研究[D];江西理工大学;2008年
3 张国萍;基于类核心词的文本分类技术研究[D];江西理工大学;2008年
4 刘强;文本的特征提取及KNN分类优化问题研究[D];华南理工大学;2009年
5 刘桂平;基于词义及语义分析的问答技术研究[D];哈尔滨工业大学;2008年
6 贾梦青;基于用户访问行为分析的网站分类研究[D];郑州大学;2009年
7 勇凤伟;面向互联网的中文问题分类技术研究[D];哈尔滨工业大学;2008年
8 冯娟娟;面向三维场景生成的中文语义角色标注方法研究[D];哈尔滨工业大学;2009年
9 苏先宇;基于潜在语义索引的文本分类研究与实现[D];哈尔滨工业大学;2008年
10 邢欣来;人物简历问答系统的研究与实现[D];重庆大学;2009年
【二级参考文献】
中国期刊全文数据库 前8条
1 黄钢石,张亚非,陆建江,肖江;基于NMF的潜在语义模型在文本检索中的应用[J];解放军理工大学学报(自然科学版);2004年02期
2 王建会,王洪伟,申展,胡运发;一种实用高效的文本分类算法[J];计算机研究与发展;2005年01期
3 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
4 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
5 刘少辉,董明楷,张海俊,李蓉,史忠植;一种基于向量空间模型的多层次文本分类方法[J];中文信息学报;2002年03期
6 周茜,赵明生,扈旻;中文文本分类中的特征选择研究[J];中文信息学报;2004年03期
7 陈毅松,汪国平,董士海;基于支持向量机的渐进直推式分类学习算法[J];软件学报;2003年03期
8 陈莉,焦李成;文档挖掘与降维技术[J];西北大学学报(自然科学版);2003年03期
【相似文献】
中国期刊全文数据库 前10条
1 陈涛,谢阳群;文本分类中的特征降维方法综述[J];情报学报;2005年06期
2 张锋,樊孝忠,许云;基于遗传算法的文本聚类特征选择[J];华南理工大学学报(自然科学版);2004年S1期
3 刘涛,吴功宜,陈正;一种高效的用于文本聚类的无监督特征选择算法[J];计算机研究与发展;2005年03期
4 严莉莉;张燕平;;基于类信息的文本聚类中特征选择算法[J];计算机工程与应用;2007年12期
5 任江涛;孙婧昊;施潇潇;黄焕宇;印鉴;;一种用于文本聚类的改进的K均值算法[J];计算机应用;2006年S1期
6 黄迎春;李晓晔;邓文新;;文本挖掘技术的研究[J];齐齐哈尔大学学报;2006年03期
7 吴岳芬;刘洪辉;;WEB文本挖掘的研究[J];电脑知识与技术(学术交流);2006年11期
8 韩览山,邵贝恩;KDD中的特征选择[J];计算机工程与应用;2002年22期
9 胡吉祥;许洪波;刘悦;程学旗;;重复串特征提取算法及其在文本聚类中的应用[J];计算机工程;2007年02期
10 寇苏玲;蔡庆生;;中文文本分类中的特征选择研究[J];计算机仿真;2007年03期
中国重要会议论文全文数据库 前10条
1 伍建军;康耀红;;关于文本分类中特征降维方式的研究[A];第三届学生计算语言学研讨会论文集[C];2006年
2 赵燕平;李超;;网络安全信息挖掘中的特征选择与专利分析研究[A];2004年中国管理科学学术会议论文集[C];2004年
3 沈渊婷;倪国强;徐大琦;;一种基于小波PCA的高光谱图像特征提取新方法[A];光电技术与系统文选——中国光学学会光电技术专业委员会成立二十周年暨第十一届全国光电技术与系统学术会议论文集[C];2005年
4 马艳;李志舜;;一种水下目标特征选择的方法[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
5 杜培军;方涛;林卉;;高光谱遥感影像降维方法研究[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
6 林明星;王晓华;管志光;丁凤华;赵永瑞;;基于差分码的图像特征提取方法研究[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
7 姚凯丰;陆文凯;张善文;肖焕钦;李衍达;;基于特征扩展和特征选择的油气预测方法[A];CPS/SEG2004国际地球物理会议论文集[C];2004年
8 陈桂明;王汉功;陈小虎;;铁谱磨粒图像处理与特征提取[A];第一届国际机械工程学术会议论文集[C];2000年
9 张宝艳;王庆辉;;中文文本聚类的研究与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
10 毛罕平;徐贵力;李萍萍;;番茄缺素叶片的图像特征提取和优化选择研究[A];2002农业工程青年科技论坛论文集[C];2002年
中国重要报纸全文数据库 前10条
1 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
2 周晓娟;TD已过分水岭[N];通信产业报;2008年
3 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
4 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
5 天相投顾 闻群王聃聃;选基金需考虑风险承受力[N];中国证券报;2007年
6 孙志伟;刘刚检查城防林建设[N];齐齐哈尔日报;2008年
7 郑卫东;高产鹅选种方法和标准[N];中国畜牧兽医报;2007年
8 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
9 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
10 海通证券 娄静吴先兴;把握风险收益特征选择最适合自己的基金[N];上海证券报;2007年
中国博士学位论文全文数据库 前10条
1 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
2 吕铁军;通信信号调制识别研究[D];电子科技大学;2000年
3 黄睿;高光谱遥感数据特征约简技术研究[D];西北工业大学;2006年
4 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
5 刘正军;高维遥感数据土地覆盖特征提取与分类研究[D];中国科学院研究生院(遥感应用研究所);2003年
6 张葛祥;雷达辐射源信号智能识别方法研究[D];西南交通大学;2005年
7 王新峰;机电系统BIT特征层降虚警技术研究[D];国防科学技术大学;2005年
8 张玮;金属腐蚀形貌特征提取用于腐蚀诊断的研究[D];大连理工大学;2004年
9 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
10 高宏力;切削加工过程中刀具磨损的智能监测技术研究[D];西南交通大学;2005年
中国硕士学位论文全文数据库 前10条
1 胡吉祥;基于频繁模式的消息文本聚类研究[D];中国科学院研究生院(计算技术研究所);2006年
2 王大昕;0-1规划及其在特征提取中的应用[D];福州大学;2005年
3 朱鹏飞;基于粗集理论的人脸识别方法研究[D];山东大学;2005年
4 许征;电力系统中基于学习理论的特征选择方法研究[D];清华大学;2004年
5 姚松源;文本自动分类系统的研究与实现[D];北京工业大学;2003年
6 张丽熙;基于纹理特征空间的淋巴组织病理图像协同分类研究[D];福州大学;2006年
7 盖武;自动指纹识别技术的研究[D];四川大学;2003年
8 黄文杰;统计模式识别系统中关键算法的研究与应用[D];中国科学院研究生院(成都计算机应用研究所);2006年
9 刘青格;近红外光谱的信息特征提取[D];江苏大学;2003年
10 韩志刚;基于特征提取的汽车零件CAPP技术研究[D];南京理工大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026