收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于典型数据集的数据预处理方法对比分析

李颜平  吴刚  
【摘要】:针对多种数据预处理方式及其组合如何提升模型拟合效果这一问题,基于UCI Machine Learning Repository典型数据集,分别利用20种变量处理方式和4种变量选择方法对数据预处理,并对模型拟合效果对比分析,分别考查了多种数据预处理方式及其组合对常见分类模型和回归模型的影响.通过对实验结果的分析讨论,提出一种启发式算法,根据数据特征、模型特点以及研究问题种类等信息推荐数据预处理方法.在更广泛的数据集上的实验结果表明,该算法所推荐的数据预处理方法可以一定程度上提升模型拟合效果,节省手工选取数据预处理方法的开销.

知网文化
【相似文献】
中国期刊全文数据库 前17条
1 喻立;;面向服务供应链的客户数据预处理方法研究[J];清远职业技术学院学报;2016年06期
2 周党生;;大数据背景下数据预处理方法研究[J];山东化工;2020年01期
3 张祖干;;地理国情监测年度更新数据预处理方法研究[J];工程建设与设计;2021年16期
4 唐成龙;谌颃;唐海春;吴泽锋;;大数据背景下数据预处理方法研究运用[J];信息记录材料;2021年09期
5 刘萍;刘瑞文;胡秀丽;;基于图书借阅行为的数据预处理方法研究[J];内蒙古科技与经济;2020年19期
6 邓晶;陈慧;;支撑体系作战能力分析的信息保障大数据预处理方法[J];军事交通学院学报;2020年05期
7 钟波,肖智;一种改进聚类分析方法在数据预处理中的应用(英文)[J];西南师范大学学报(自然科学版);2002年05期
8 池云仙;赵书良;罗燕;高琳;赵骏鹏;李超;;基于词频统计规律的文本数据预处理方法[J];计算机科学;2017年10期
9 严刚;;中医数据挖掘中数据预处理方法研究[J];硅谷;2010年09期
10 刘丽轻;丁巧林;张铁峰;陈健;;数据预处理方法对模糊C均值聚类的影响[J];电力科学与工程;2011年08期
11 陈燕;陈亚林;郑军;;一种改进的基于PCA的数据预处理方法[J];电子技术应用;2020年01期
12 赵兵;倪世宏;;一种基于小波分析的飞行数据预处理方法[J];弹箭与制导学报;2005年S7期
13 陈建锋;;WEB挖掘数据预处理方法分析与实现[J];安徽职业技术学院学报;2018年04期
14 杨明花;古志民;;基于兴趣特征的WUM数据预处理方法[J];计算机应用;2006年10期
15 王盛;朱金奇;花季伟;乔增顺;;基于关系型数据库的网络流数据预处理方法[J];计算机应用与软件;2021年05期
16 于国卿;汪自力;顾列亚;;水闸安全监测数据挖掘中的数据预处理方法[J];南水北调与水利科技;2010年04期
17 张戈;;课程推荐预测模型中的数据预处理方法研究[J];中国新通信;2019年19期
中国重要会议论文全文数据库 前13条
1 谭立云;凯丽比努尔;塔西甫拉提;高学东;热合木江;;数据挖掘中的数据预处理方法研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
2 程军;李沙园;;油气化探的数据预处理方法实现研究[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
3 王军;宋宝燕;于戈;;一种Web日志挖掘数据预处理方法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 张国卿;马亚龙;同兰娟;孙明;;一种数字信号处理方法在数据预处理中的应用研究[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
5 邓聪;傅少荣;高嘉锜;潘嘉辉;;基于不完备数据集近邻聚类的缺失用电信息填补算法[A];福建省电机工程学会2020年学术年会获奖论文集(下册)[C];2021年
6 卢功林;葛俏;王玉娟;谈世磊;曹红伟;卢志鹏;;基于深度学习的不停车自动超载检测方法[A];2020中国自动化大会(CAC2020)论文集[C];2020年
7 王羽;姜晓夏;陆辰;王振宇;王珩;吴振锋;;军事机器阅读理解数据集构建与评估[A];2019第七届中国指挥控制大会论文集[C];2019年
8 缪国宇;刘洪鹏;苏文学;刘荣生;赵相东;;基于数据仓库的企业指标分析系统[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
9 郭景峰;杜京;马倩;邹晓红;;一种基于数据集性质的快速等差模式聚类算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
10 田捷;;三维医学影像数据集处理的集成化平台[A];2003年全国医学影像技术学术会议论文汇编[C];2003年
11 范明;魏芳;;挖掘基本显露模式用于分类[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
12 刘通;张宇献;;基于加权平均数的模糊聚类有效性函数[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年
13 于爱荣;刘晓明;曹雷;王俊;;NET Web Services数据集在Delphi中的处理与研究[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
中国博士学位论文全文数据库 前8条
1 马飞;复杂场景下的行人重识别关键技术研究[D];武汉大学;2019年
2 刘皓;基于深度学习的行人再识别问题研究[D];合肥工业大学;2017年
3 王建培;聚类有效性分析及其在电学层析成像中的应用[D];天津大学;2017年
4 杨勋;跨视域行人再识别若干问题研究[D];合肥工业大学;2017年
5 谢莹;低维低秩数据表达与嵌入[D];安徽大学;2014年
6 申彦;大规模数据集高效数据挖掘算法研究[D];江苏大学;2013年
7 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
8 吴国清;科学计算时变数据集的数据挖掘算法研究[D];中国工程物理研究院;2009年
中国硕士学位论文全文数据库 前20条
1 颜达森;基于1/2相似度偏离的数据预处理方法[D];深圳大学;2020年
2 董艳;数据预处理方法在移动通信企业的应用研究[D];合肥工业大学;2010年
3 王培培;健康体检数据预处理方法研究与应用[D];郑州大学;2016年
4 金璐璐;物联网体系架构下的海产品质量安全溯源研究[D];渤海大学;2015年
5 丁瑶;基于融合机制的航拍目标检测与识别[D];厦门大学;2019年
6 肖娜;基于密度和方向的聚类算法研究[D];湖南大学;2019年
7 乐雨泉;基于句法和语义的句子表示方法[D];湖南大学;2019年
8 刘文斌;中式菜肴食材数据集的构建及其分类算法研究[D];武汉轻工大学;2019年
9 江思源;面向混合数据集的聚类方法研究[D];合肥工业大学;2019年
10 张泰然;面向实时的视频人体分割算法研究[D];北京交通大学;2019年
11 刘娜;基于LSTM细分类的人脸图像年龄估计研究[D];华北电力大学;2019年
12 闫东;大规模人脸数据集快速构建方法与人证比对算法研究[D];华北电力大学(北京);2019年
13 甘翔;基于深度学习和生成对抗网络的图标设计研究[D];华南理工大学;2019年
14 杨林;面向不完备数据的三支聚类方法研究[D];重庆邮电大学;2018年
15 杨腾佼;基于深度学习的文本情感分析研究及应用[D];电子科技大学;2019年
16 申磊;复杂环境下多目标快速检测的研究与应用[D];电子科技大学;2019年
17 顾岩;基于深度学习的人脸识别技术及在油田作业区的应用研究[D];电子科技大学;2019年
18 张腾;不平衡数据集均衡化方法研究及其应用[D];中国石油大学(北京);2018年
19 王智慧;无人机场景下单目标行人检测与跟踪算法研究[D];大连理工大学;2019年
20 李强;基于深度学习的行人重识别技术研究[D];西安电子科技大学;2019年
中国重要报纸全文数据库 前1条
1 本报记者 刘霞;AI助力抗“疫” 美发布新冠病毒数据集[N];科技日报;2020年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978