收藏本站
收藏 | 投稿 | 论文排版

基于特征信息增益权重的文本分类算法

李文斌  刘椿年  陈嶷瑛  
【摘要】:为了在分类精度不受损失的情况下提高训练速度,设计了3种基于信息增益(information gain,简称IG) 特征权重的分类算法,分别被命名为:IG-C1、IG-C2、IG-C.它们根据特征对IG贡献的大小及在新文本中出现的次数进行分类.这3种算法都具有较低的时间复杂度和实现简单的特点.实验结果表明,其中IG-C的分类效果最为理想.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 石铁峰;;支持向量机在电子邮件分类中的应用研究[J];计算机仿真;2011年08期
2 干娟;;基于决策树算法的学生综合测评系统的设计[J];安徽电子信息职业技术学院学报;2011年04期
3 彭炜;;基于遗传算法的图像分类[J];山西师范大学学报(自然科学版);2011年02期
4 旷岭;;电信客户流失数据分析方案设计与应用研究[J];中南林业科技大学学报;2011年06期
5 贾娴;刘培玉;公伟;;应用于入侵取证的改进信息增益算法[J];计算机应用;2011年08期
6 李玲俐;;数据挖掘中分类算法综述[J];重庆师范大学学报(自然科学版);2011年04期
7 刘健;刘忠;;基于小波变换和支持向量机的水下目标分类方法[J];火力与指挥控制;2011年09期
8 周靖;;改进偏二叉树多类SVM的文本分类[J];广东石油化工学院学报;2011年04期
9 张琳;陈燕;李桃迎;牟向伟;;决策树分类算法研究[J];计算机工程;2011年13期
10 韦妍;;人脸表情识别概述[J];网络安全技术与应用;2011年08期
11 于攀;叶俊勇;;基于谱回归和核空间最近邻的基因表达数据分类[J];电子学报;2011年08期
12 吴春辉;陈洪生;;基于内容的音频检索技术研究[J];咸宁学院学报;2011年06期
13 施梅芳;贲黎明;;改进的决策树算法在手写体汉字识别中的应用[J];兰州理工大学学报;2011年04期
14 刘劲;陈瑛琦;扶晓;;虹膜特性提取阶段的小波多尺度特征量化算法[J];电脑编程技巧与维护;2011年14期
15 吕林涛;赵呈轩;尚进;杨宇祥;;基于高层语义视觉词袋的色情图像过滤模型[J];计算机应用;2011年07期
16 王会青;陈俊杰;侯晓晶;郭凯;;决策树分类的属性选择方法的研究[J];太原理工大学学报;2011年04期
17 王瑞瑞;马建文;陈雪;;多源遥感影像自动配准技术的研究进展[J];遥感信息;2011年03期
18 刘劲;赵蕾;扶晓;;基于小波模极值的虹膜特征提取算法[J];电脑编程技巧与维护;2011年16期
19 方志龙;;文本特征选择算法MI的改进[J];计算机与现代化;2011年07期
20 贾志先;;基于支持向量机的空白试卷识别方法[J];山西大学学报(自然科学版);2011年03期
中国重要会议论文全文数据库 前10条
1 邹哲峰;刘明敬;郝明;;基于中心矩和熵组合特征的雷达目标一维距离像识别技术[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
2 朱晓霞;孙同景;陈桂友;;基于支持向量机理论的两级指纹分类实现方法[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
3 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
4 钱小聪;郑宝玉;穆明鑫;;神经网络联机手写签名验证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
5 张羽;汪源源;王威琪;余建国;林继耕;;狭窄血管多普勒信号特征提取的实验研究[A];21世纪医学工程学术研讨会论文摘要汇编[C];2001年
6 柳林霞;陈杰;窦丽华;;不变矩理论及其在目标识别中的应用[A];2002中国控制与决策学术年会论文集[C];2002年
7 杨日杰;施建礼;林洪文;;一种雷达视频回波特征提取方法研究[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
8 代克杰;张红梅;盛赛斌;;基于BP网络的故障特征提取方法研究[A];2004中国控制与决策学术年会论文集[C];2004年
9 何新;史迎春;周献中;;一种基于独立分量分析的音频分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
10 范海宁;郭英;吴剑锋;陈志武;;基于小波包分解的声信号特征提取方法[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
2 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
3 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
4 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
5 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
6 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
7 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
8 王立鹏;特征提取及分类算法在膜蛋白分类预测问题中的应用[D];兰州理工大学;2010年
9 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
10 武子玉;矿物近红外光谱信息提取及应用研究[D];吉林大学;2005年
中国硕士学位论文全文数据库 前10条
1 周燕峰;基于时频谱熵的往复式压缩机故障诊断及应用[D];大连理工大学;2006年
2 李坤;运动意识脑电分类及基于VC++的脑机接口实验系统[D];安徽大学;2007年
3 许红涛;一种基于eEPs的中文文本自动分类算法[D];郑州大学;2006年
4 孙晓平;基于DSA图像的脑血管瘤辅助诊断研究[D];苏州大学;2009年
5 刘光明;ID3算法的研究及在以政府决策为主题的挖掘系统中的应用[D];南昌大学;2006年
6 乔素娟;基于SVM的中文垃圾邮件的识别研究[D];山西财经大学;2006年
7 田慧;支持向量机集成及在音乐分类中的应用[D];山东师范大学;2009年
8 郭瑞勇;基于独立分量分析和支持向量机的纹理图像分类研究[D];哈尔滨理工大学;2009年
9 张丽;基于投影寻踪的高光谱影像特征提取与自动识别技术研究[D];长安大学;2006年
10 张晓飞;基于支持向量机的图像信息分类与检索[D];沈阳大学;2007年
中国重要报纸全文数据库 前10条
1 ;SecuiWALL独创分类算法[N];计算机世界;2002年
2 本报记者  周松林;上证所XBRL基金信息分类获国际认证[N];中国证券报;2006年
3 彭兴庭;“熵”与环境承载力[N];中国绿色时报;2004年
4 证券时报记者  黄婷;上证所基金信息分类获国际认证[N];证券时报;2006年
5 黄鑫 李晶;信息分类网让信息互动起来[N];经济日报;2006年
6 俞路石;中科大研究生解决网络数据包有效分类算法[N];中国教育报;2007年
7 实习生 林莉君;“网格信息分类目录”解决电子政务建设瓶颈[N];科技日报;2004年
8 小非;汉王“文本仪”瞄准行业[N];计算机世界;2007年
9 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
10 记者  胡春玲 程媛;用工信息分类“上架”郑州人力资源“超市”开张了[N];中国劳动保障报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978