收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

面向非平衡混合数据的改进计数最近邻分类算法

廖志芳  陈宇宙  樊晓平  瞿志华  
【摘要】:非平衡混合数据是指数据集中类别不同的样本在数量上存在着较大的差别;同时样本数据集中的数据是非单一的数据类型,即它包含多种类型,如数值型和文本型数据。在对混合型数据的分类算法中,计数最近邻分类算法(CwkNN)可以有效地对混合型数据进行分类,但该算法对数据的非平衡性处理效果不是太理想。在CwkNN的基础之上结合数据的非平衡性特点提出了基于全局密度和K-密度的分类算法来提高少数类样本的权重,从而提高数据的分类精确度。实验结果表明,全局密度分类算法和CwkNN算法的分类精度相当,K-局部密度分类算法在一定程度上提高了分类的精度。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 徐乾;王文剑;张文浩;;处理非平衡数据的粒度SVM学习方法[J];计算机工程与应用;2011年24期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国博士学位论文全文数据库 前2条
1 白亮;聚类学习的理论分析与高效算法研究[D];山西大学;2012年
2 李玉萍;基于先进计算的智能入侵检测系统研究[D];中国地震局地球物理研究所;2012年
中国硕士学位论文全文数据库 前10条
1 蒋莎;一种用于学习非平衡数据支持向量机的改进[D];武汉科技大学;2008年
2 田元;支持向量机训练算法的研究与优化[D];西安理工大学;2008年
3 许震;基于KL距离的半监督分类算法[D];复旦大学;2010年
4 张健;剪枝和网格采样相结合的非平衡数据集分类方法[D];安徽大学;2012年
5 张文浩;基于多维关联规则的粒度支持向量机学习方法研究[D];山西大学;2010年
6 田大东;支持向量机学习算法研究[D];苏州大学;2009年
7 李小欢;基于密度以及自适应支持向量机的研究[D];新疆大学;2012年
8 林于渊;基于RS-SVM的雷电预报模型[D];南昌大学;2012年
9 滕旭阳;基于进化多目标优化的特征选择方法研究[D];哈尔滨工程大学;2012年
10 闫国虹;支持向量机不平衡问题和增量问题算法研究[D];西安电子科技大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978