收藏本站
《计算机工程与应用》 2010年35期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

面向文本分类的矩阵投影算法

钟将  孙启干  李静  
【摘要】:对文本分类中降维技术、提高分类精度和效率的方法进行了研究,提出了一种基于矩阵投影运算的新型文本分类算法——Matrix Projection(MP)分类算法。矩阵运算将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化向量,有效地达到了降维与精确计算特征项权重的目的。与其他多种文本分类算法对比实验表明,MP算法的分类精度和时间性能都有明显提高,在两套数据集上的宏平均F1值分别达到92.29%和96.03%。

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 朱劼昊;周建江;吴杰;;基于线性卷积系数扩展特征的雷达目标识别[J];系统工程与电子技术;2010年01期
2 赵英杰;倪青山;王正志;;RNA二级结构计算特征分析[J];中国生物医学工程学报;2010年01期
3 童健华;谭洪舟;郭雷勇;;一种改进的人工免疫文本聚类算法[J];系统仿真学报;2010年01期
4 许世明;武波;马翠;邸思;徐洪奎;杜如虚;;一种基于预分类的高效SVM中文网页分类器[J];计算机工程与应用;2010年01期
5 姚全珠;蔡婕;;基于PSO的LS-SVM特征选择与参数优化算法[J];计算机工程与应用;2010年01期
6 牛长锋;刘玉树;;融合多特征的粒子滤波目标跟踪算法[J];华中科技大学学报(自然科学版);2010年01期
7 张建明;房芳;陈立;杨锋清;刘霄;;基于优选LBP与加权SVM的年龄估计[J];计算机应用研究;2010年01期
8 朱颢东;钟勇;;基于新型文档频和优化的Tabu搜索的特征选择[J];华中科技大学学报(自然科学版);2010年02期
9 朱颢东;钟勇;;使用优化模拟退火算法的文本特征选择[J];计算机工程与应用;2010年04期
10 罗美淑;刘世勇;石磊;于化龙;;一种基于微阵列数据的集成分类方法[J];计算机应用研究;2010年01期
中国重要会议论文全文数据库 前10条
1 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
2 易超群;李建平;朱成文;;一种改进的浮动搜索特征子集算法[A];'2010系统仿真技术及其应用学术会议论文集[C];2010年
3 李长升;卢汉清;;排序学习模型中的特征选择[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
4 刘怡;高玥;;基于情感的音频音乐自动分类方法研究[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
5 朱永生;杨永生;蔡蕾;张优云;;基于高维信息的机械设备运行状态识别方法[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
6 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;维吾尔文Web信息检索中基于改进VSM的文档表示及相似度研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 何靖;陈翀;闫宏飞;;开放域问答系统研究综述[A];第六届全国信息检索学术会议论文集[C];2010年
8 缪有栋;邱锡鹏;黄萱菁;;基于主动学习的中文问题类别标注研究[A];第六届全国信息检索学术会议论文集[C];2010年
9 黄名选;;基于正负关联规则挖掘的局部反馈查询扩展[A];第六届全国信息检索学术会议论文集[C];2010年
10 徐志明;宋毅;冯子威;李生;;一种基于分类的用户兴趣模型[A];第六届全国信息检索学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 群芳;萝卜白菜各有所爱择偶标准催生新种[N];科学时报;2008年
2 孙志伟;刘刚检查城防林建设[N];齐齐哈尔日报;2008年
3 郑卫生;架子牛引进与饲养要点[N];吉林农村报;2008年
4 华泰证券 吴璟;权证投资:只买对的,不买便宜的[N];上海证券报;2008年
5 广西钦州灵山县灵城二小 纪雪林;小场地训练途中跑的方法[N];中国体育报;2008年
6 周晓娟;TD已过分水岭[N];通信产业报;2008年
7 天相投顾 闻群王聃聃;选基金需考虑风险承受力[N];中国证券报;2007年
8 郑卫东;高产鹅选种方法和标准[N];中国畜牧兽医报;2007年
9 海通证券 娄静吴先兴;把握风险收益特征选择最适合自己的基金[N];上海证券报;2007年
10 本报记者 海虹;儿童玩具 鱼龙混杂[N];甘肃法制报;2006年
中国博士学位论文全文数据库 前10条
1 温万惠;基于生理信号的情感识别方法研究[D];西南大学;2010年
2 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
3 刘华文;基于信息熵的特征选择算法研究[D];吉林大学;2010年
4 徐苏;基于步态触觉特征的生物特征识别[D];中国科学技术大学;2010年
5 朱虎明;基于集群计算的免疫优化算法及其应用研究[D];西安电子科技大学;2010年
6 刘京礼;鲁棒最小二乘支持向量机研究与应用[D];中国科学技术大学;2010年
7 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
8 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
9 任晓卫;上海地区人群甲型流感HA抗原进化与基因进化关系研究及H1N1流感潜在免疫显性位点的筛选[D];复旦大学;2010年
10 王志春;基于进化计算的复杂分类算法研究及应用[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 金凤;多视角的构建及其在单任务学习和多任务学习中的应用[D];华东师范大学;2010年
2 邱萌;基于内容的多源新闻聚合关键技术研究与实现[D];华东师范大学;2010年
3 李艳霞;基于概念格的K-Means算法研究及应用[D];大连海事大学;2010年
4 高娟;基于K-means算法的文本聚类的研究与实现[D];江西理工大学;2010年
5 李玥;基于Web文档理解的倒排全文索引研究与实现[D];江西理工大学;2010年
6 党春辉;网页消重和聚类算法在高校搜索引擎中的研究与应用[D];东华大学;2010年
7 武娜;视频搜索结果分析及其可视化方法研究与应用[D];东华大学;2010年
8 高岩;基于本体的信息过滤研究与实现[D];沈阳工业大学;2010年
9 梅君;中文文本分类的研究与应用[D];南昌大学;2010年
10 卢延科;面向中文专利文献的相似例句检索算法的研究[D];沈阳航空工业学院;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026