收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

改进型加权KNN算法的不平衡数据集分类

王超学  潘正茂  马春森  董丽丽  张涛  
【摘要】:K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚类,按照权重分配模型计算各训练样本的权重,通过改进的KNN算法对测试样本进行分类。基于UCI数据集的大量实验结果表明,GAK-KNN算法的识别率和整体性能都优于传统KNN算法及其他改进算法。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王增民;王开珏;;基于熵权的K最临近算法改进[J];计算机工程与应用;2009年30期
2 王成强;;基于不平衡数据集的文本分类技术[J];电脑知识与技术;2009年36期
3 尹军梅;杨明;;一种面向单个正例的Fisher线性判别分类方法[J];南京师范大学学报(工程技术版);2008年03期
4 尹军梅;杨明;万建武;;一种面向不平衡数据集的核Fisher线性判别分析方法[J];模式识别与人工智能;2010年03期
5 吴广潮;陈奇刚;;不平衡数据集中的组合分类算法[J];计算机工程与设计;2007年23期
6 白凤凤;;基于不平衡数据集的文本分类技术研究[J];电脑编程技巧与维护;2010年06期
7 姚程宽;;不平衡样本集中SVM的应用综述[J];计算机应用与软件;2008年09期
8 王成强;;基于数据层面的不平衡数据集的分类方法[J];光盘技术;2009年11期
9 李明方;张化祥;张雯;计华;;不平衡数据集的神经网络阈值优化方法[J];计算机工程与应用;2010年20期
10 王晓芹;张化祥;柴青;;基于级联结构的不平衡数据集分类研究[J];计算机工程与应用;2010年13期
11 赵秀宽;阳建宏;黎敏;徐金梧;;一种改进的不平衡数据集分类方法[J];计算机工程;2011年15期
12 姚程宽;;SVM在不平衡样本集中的应用研究[J];计算机与数字工程;2007年10期
13 时雷;虎晓红;席磊;;朴素贝叶斯分类算法及其应用研究[J];光盘技术;2008年11期
14 王庆荣;郑丽英;;基于混合比例方法抽样用于入侵检测[J];兰州交通大学学报;2011年01期
15 曹苏群;王士同;陈晓峰;;基于后验概率的不平衡数据集特征选择算法[J];计算机工程;2008年19期
16 奉国和;;SVM分类核函数及参数选择比较[J];计算机工程与应用;2011年03期
17 王剑锋;杨胜;谢凯;李仁发;;一种新的概率支持向量机方法[J];计算机工程与应用;2008年12期
18 李广明;刘群锋;;光滑支持向量机两种求解算法的比较[J];计算机应用;2009年06期
19 刘叶青;刘三阳;谷明涛;;一种多项式光滑的半监督支持向量机分类算法[J];计算机科学;2009年07期
20 崔自峰;吉小华;;基于线性判别分析的特征选择[J];计算机应用;2009年10期
中国重要会议论文全文数据库 前10条
1 王灿辉;茹立云;张敏;马少平;;基于伪反馈与分类的文本检索[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 杨智明;彭喜元;;μSVM—一种适用于解决不平衡数据分类问题的新方法[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅰ)[C];2008年
3 张爱华;靖红芳;王斌;徐燕;;文本分类中特征权重因子的作用研究[A];第五届全国信息检索学术会议论文集[C];2009年
4 丘昌镇;任皓;邹焕新;周石琳;;基于PCA和2D-PCA特征的SAR图像目标分类性能比较[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
5 徐近霈;孟宪军;;音素分类用函数链网的训练[A];第三届全国人机语音通讯学术会议论文集[C];1994年
6 裴晓梅;郑崇勋;徐进;;信息积累技术用于改善运动意识任务分类性能[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
7 刘晓勇;;基于GA与SVM融合的网页分类算法[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
8 管鲁阳;鲍明;李晓东;田静;;基于双耳模型倒谱系数的车辆识别技术研究[A];中国声学学会2006年全国声学学术会议论文集[C];2006年
9 谷波;刘开瑛;;决策树模型和最大熵模型在文本分类中的比较研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 孙昌儿;刘秉瀚;;一种新的SVM决策树[A];第十一届中国体视学与图像分析学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 李云峰;基于Gabor小波变换的人脸识别[D];大连理工大学;2006年
2 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
3 张翔;支持向量机及其在医学图像分割中的应用[D];华中科技大学;2004年
4 李小平;智能信号分类方法研究[D];西安电子科技大学;2004年
5 唐盛;超声子宫图像全自动识别研究[D];浙江大学;2009年
6 谷琼;面向非均衡数据集的机器学习及在地学数据处理中的应用[D];中国地质大学;2009年
7 杨艳屏;主动学习算法及其在心血管疾病诊断中的应用研究[D];华中科技大学;2010年
8 魏庆国;基于运动想象的脑—机接口分类算法的研究[D];清华大学;2006年
9 张东波;粗集神经网络集成方法及其在模式识别中的应用[D];湖南大学;2007年
10 蒋良孝;朴素贝叶斯分类器及其改进算法研究[D];中国地质大学;2009年
中国硕士学位论文全文数据库 前10条
1 董燕杰;不平衡数据集分类的Random-SMOTE方法研究[D];大连理工大学;2009年
2 张智勇;基于GMDH的缺失数据插补方法研究[D];四川大学;2007年
3 张华斌;基于不平衡数据挖掘的远程故障诊断研究[D];华中科技大学;2007年
4 蒋宏杰;基于eEP的数据流分类算法研究[D];郑州大学;2006年
5 邱小宁;基于人工免疫系统的分类方法及其应用研究[D];湖南大学;2008年
6 王小燕;基于加权增量的支持向量机分类算法研究[D];浙江大学;2008年
7 唐武;惰性学习中实例选择研究与应用[D];哈尔滨工业大学;2007年
8 王峰;基于双核复合的核分类算法研究[D];北京工业大学;2009年
9 熊淑华;数据挖掘技术在证券业CRM中的应用研究[D];南昌大学;2008年
10 崔克彬;分类分析的研究与实现[D];华北电力大学(河北);2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978