收藏本站
《微电子学与计算机》 2008年08期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于散度差组合型文本特征降维方法

刘海峰  姚泽清  王元元  张述祖  
【摘要】:讨论了文本分类中特征降维的主要方法及其特点,分析了基于散度差准则的特征降维的原理和方法,在避开求逆矩阵问题的同时,通过对文本特征进行选择对文本特征集进行了第一次压缩,借助于加权散度差原理对特征集进行了二次抽取,在最低限度减少信息损失的前提下实现了特征维数的大幅度降低.试验结果表明,这种方法在文本分类上的效率较好.

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 贺贤明,戴坚峰;一种新型文本自动分类系统的研究与实现[J];微电子学与计算机;2004年10期
2 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[J];微电子学与计算机;2006年09期
3 陈伏兵,张生亮,高秀梅,杨静宇;小样本情况下Fisher线性鉴别分析的理论及其验证[J];中国图象图形学报;2005年08期
【共引文献】
中国期刊全文数据库 前1条
1 蔡代纯;谭新良;;文本自动分类技术及其对图书馆学的影响[J];现代情报;2006年09期
中国硕士学位论文全文数据库 前4条
1 史操;基于线性投影分析与非线性核方法在人脸识别中的研究[D];湖南师范大学;2006年
2 曹勇;中文Web文本分类技术研究[D];厦门大学;2007年
3 徐学可;网页文本分类及其在搜索引擎中的应用[D];北京工业大学;2008年
4 俞洋;基于主动服务的用户导航系统[D];武汉理工大学;2008年
【同被引文献】
中国期刊全文数据库 前10条
1 杨晓懿,刘嘉勇,陈淑敏;SVM在文本自动分类中的应用[J];成都信息工程学院学报;2005年02期
2 胡学钢;郭亚光;;一种基于粗糙集的朴素贝叶斯分类算法[J];合肥工业大学学报(自然科学版);2006年02期
3 颜宏文,马瑞,龙际珍,颜宏斌;数据挖掘中判定树算法SLIQ的设计与应用[J];计算机工程;2005年06期
4 方兰,王明文;文本自动分类技术及其应用[J];计算机与现代化;2004年07期
5 任小康;吴尚智;马如云;;基于可辨识矩阵的属性频率约简算法[J];兰州大学学报(自然科学版);2007年01期
6 郝占刚;王正欧;;基于潜在语义索引和遗传算法的文本特征提取方法[J];情报科学;2006年01期
7 卢增祥,李衍达;交互支持向量机学习算法及其应用[J];清华大学学报(自然科学版);1999年07期
8 卜东波,白硕,李国杰;文本聚类中权重计算的对偶性策略[J];软件学报;2002年11期
9 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[J];微电子学与计算机;2006年09期
10 李莹,张晓辉,王华勇,常桂然;一种应用向量聚合技术的KNN中文文本分类方法[J];小型微型计算机系统;2004年06期
中国博士学位论文全文数据库 前2条
1 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
2 谭松波;高性能文本分类算法研究[D];中国科学院研究生院(计算技术研究所);2006年
【二级参考文献】
中国期刊全文数据库 前4条
1 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
2 马笑潇,黄席樾,柴毅;基于SVM的二叉树多类分类算法及其在故障诊断中的应用[J];控制与决策;2003年03期
3 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
4 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
【相似文献】
中国期刊全文数据库 前10条
1 王月;柴瑞敏;;减聚类的模糊C-均值算法在文本分类中的应用[J];计算机系统应用;2010年03期
2 陈才扣;彭倩倩;孙强强;黄建平;;一种改进的典型相关分析方法及其应用[J];系统仿真学报;2010年02期
3 杜一平;刘燕君;;基于优势率的改进二元特征提取方法[J];计算机系统应用;2010年02期
4 盛宇;刘俊熙;龙怡;郭金兰;;用VB.NET实现基于案例的知识管理系统[J];现代情报;2010年01期
5 洪智勇;秦克云;邓维斌;;基于VPRS理论的一种混合分类算法[J];计算机工程与应用;2010年09期
6 吕曹芳;朱岳超;;数据挖掘技术在军事情报挖掘中的应用[J];黑龙江科技信息;2010年02期
7 焦庆争;蔚承建;;一种可靠信任推荐文本分类特征权重算法[J];计算机应用研究;2010年02期
8 何俊杰;陆军;;改进WEB数据挖掘方法及其在个性化推荐中的应用[J];科技管理研究;2010年06期
9 朱颢东;钟勇;;基于NDF和优化的ID3的特征选择方法[J];暨南大学学报(自然科学与医学版);2010年01期
10 刘金岭;;基于主题的中文短信文本分类研究[J];计算机工程;2010年04期
中国重要会议论文全文数据库 前10条
1 林令娟;刘希玉;;基于微粒群优化的快速K-近邻分类算法[A];第三届中国智能计算大会论文集[C];2009年
2 赵纪元;罗霄;;面向中图法的学术文献自动分类研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 苏小康;何婷婷;涂新辉;何金卓;;一种基于维基百科知识库的中文文本分类方法研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 姚天昉;张霄凯;;一种网络非规范汉语词汇的识别方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
5 赵修湘;石勇;刘莹;张玲玲;;文本分类在软件缺陷管理中的应用[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年
6 侯松;周斌;贾焰;;分词结果的再搭配对文本分类效果的增强[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
7 江涛;于洪志;徐涛;;互联网藏文内容安全检测过滤系统研究[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
8 刘欣;章勇;王娟;;增量学习的TFIDF_NB协同训练分类算法[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
9 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
10 陈沧;沈洁;高莺;刘春阳;叶君峰;;基于类别层次体系的商品分类研究[A];第五届全国信息检索学术会议论文集[C];2009年
中国重要报纸全文数据库 前9条
1 朱冰;网络言论分析技术让机器读懂好恶[N];中国高新技术产业导报;2008年
2 贺慧宇;声发射监测把脉桥梁安全[N];中国建设报;2008年
3 徐昕;正在成熟的生物识别技术[N];中国计算机报;2006年
4 周新红 田朝晖 段勇;信息融合:现代战争的重要支撑[N];解放军报;2005年
5 高利华;传承陆游风骨 推进国际交流[N];人民日报海外版;2005年
6 希安;微软试水信息检索[N];经济日报;2004年
7 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
8 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
9 本报记者 洪奇;手写笔:21世纪的主流输入技术[N];计算机世界;2001年
中国博士学位论文全文数据库 前10条
1 刘赫;文本分类中若干问题研究[D];吉林大学;2009年
2 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
3 曾雪强;偏最小二乘降维方法的研究与应用[D];上海大学;2009年
4 杨万扣;人脸识别中的部分特征抽取技术研究[D];南京理工大学;2009年
5 胡明涵;面向领域的文本分类与挖掘关键技术研究[D];东北大学 ;2009年
6 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
7 裴志利;数据挖掘技术在文本分类和生物信息学中的应用[D];吉林大学;2008年
8 郝立柱;汉语文本自动分类[D];吉林大学;2008年
9 林宇生;鉴别特征抽取方法及其在人脸识别中的应用研究[D];南京理工大学;2008年
10 王建国;特征抽取方法研究及其在人脸识别中的应用[D];南京理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 盛大玮;牛眼虹膜识别技术研究[D];华东师范大学;2010年
2 高娟;基于K-means算法的文本聚类的研究与实现[D];江西理工大学;2010年
3 梅君;中文文本分类的研究与应用[D];南昌大学;2010年
4 刘依璐;基于机器学习的中文文本分类方法研究[D];西安电子科技大学;2009年
5 刘彧;基于贝叶斯理论的文本分类技术的研究与实现[D];吉林大学;2009年
6 张琳;基于本体的文本分类的研究与实现[D];沈阳工业大学;2009年
7 李福帮;基于大规模人工神经网络的可扩展文本分类算法研究[D];北京工业大学;2009年
8 吴韦;文本分类语料库自动创建系统的研究与实现[D];武汉理工大学;2009年
9 谭龙远;基于领域的网络爬虫技术的研究与实现[D];武汉理工大学;2009年
10 周倩;基于RS-SVM的中文文本分类研究[D];天津财经大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026