收藏本站
《安徽电子信息职业技术学院学报》 2009年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

数据挖掘中数据预处理方法与技术

于立红  杜芸  
【摘要】:数据挖掘是最近流行的数据库技术和人工智能技术相结合的一门新兴技术。论述了数据预处理在数据挖掘中的重要地位,介绍了数据预处理过程所包含的内容和采用的方法与技术。
【作者单位】郑州轻工业学院民族职业学院;武汉大学经济与管理学院;
【分类号】:TP311.13

【引证文献】
中国博士学位论文全文数据库 前1条
1 席景科;时空孤立点检测算法研究[D];中国矿业大学;2010年
中国硕士学位论文全文数据库 前7条
1 闫先明;基于变精度粗糙集的网络隐蔽通道检测的研究[D];南京理工大学;2011年
2 王菁菁;远程教育系统学生分类的数据挖掘研究[D];辽宁工程技术大学;2011年
3 黄伟;短期电力负荷组合预测模型的研究[D];大连理工大学;2009年
4 朱凯;实时数据流的数据预处理与特征分析[D];武汉科技大学;2010年
5 杜杰;基于校园网海量访问日志的用户行为分析[D];大连海事大学;2012年
6 宋清栋;模糊c均值聚类技术研究[D];广西师范大学;2012年
7 韩宝昌;计算机犯罪取证证据分析的研究[D];大连交通大学;2012年
【参考文献】
中国期刊全文数据库 前1条
1 章建国,施敏;利用高分子结构对数据集成的研究[J];石家庄职业技术学院学报;2005年02期
【共引文献】
中国期刊全文数据库 前10条
1 周特,刘振鹏,刘迅芳,张寿华;基于用户行为的Non-self集的构造方法[J];河北大学学报(自然科学版);2004年04期
2 王煜,张明,马力;基于词条聚合和决策树的文本分类方法[J];河北大学学报(自然科学版);2005年03期
3 黄海云;;图书馆数据挖掘服务系统中粗糙集算法的原理及应用[J];河北工业科技;2010年05期
4 王静红,董爱堂,董瑞卿;基于决策树的可复用软件的研究及应用[J];河北省科学院学报;2004年03期
5 李艳生;汪自云;;基于遗传算法的Web主题库成长技术研究[J];湖北师范学院学报(自然科学版);2010年04期
6 彭高辉;王志良;;数据挖掘中的数据预处理方法[J];华北水利水电学院学报;2008年06期
7 侯梦雅;;组合BP神经网络在数据挖掘中的应用[J];洪都科技;2009年02期
8 张祖昶,王诚,奚建春;电信反欺诈系统(AFS)的设计与实现[J];信息技术;2004年02期
9 刘富春,高中文;一种基于OLAP的相关分析算法[J];信息技术;2004年02期
10 高伟,关宏伟,汪艳;异常数据挖掘及其在工程实际中的应用研究[J];信息技术;2004年04期
中国重要会议论文全文数据库 前10条
1 罗艳;;论数据挖掘的发展前景及潜在价值[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
2 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
3 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
4 杨静;申艳光;邢丽莉;;数据仓库与数据挖掘的研究与应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
5 杨雯怡;郑康锋;杨义先;;一种自适应的网络安全防护方案[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
6 李久丹;陈剑;覃涛;;数据挖掘技术理论研究[A];广西计算机学会2010年学术年会论文集[C];2010年
7 张宇;;基于XML的Web数据自动挖掘[A];科技创新与节能减排——吉林省第五届科学技术学术年会论文集(上册)[C];2008年
8 张秋彤;;数据挖掘与高校图书馆个性化信息服务[A];第九届中国不确定系统年会、第五届中国智能计算大会、第十三届中国青年信息与管理学者大会论文集[C];2011年
9 丁信宙;仇环;苏晓庆;;基于云理论的缺损数据推理和预测[A];山东省测绘学术年会论文集[C];2006年
10 杨利军;勾学荣;;数据挖掘在移动客户流失预测中的研究和应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
中国博士学位论文全文数据库 前10条
1 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
2 祁瑞华;不完整数据分类知识发现算法研究[D];大连理工大学;2011年
3 郜峦;基于文献分析的“肺与大肠相表里”证治规律及其关系研究[D];北京中医药大学;2011年
4 卢又燃;放射科随访数据库建立与粗糙集方法辅助诊断胶质瘤分级的应用分析[D];复旦大学;2009年
5 金海浩;五行相生间接补法古代应用规律研究[D];南京中医药大学;2011年
6 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
7 韩建光;企业财务困境预测动态建模研究[D];哈尔滨工业大学;2011年
8 李聚林;冯五金教授六位一体理念治胃病学术思想和临床经验总结及六位一体理念治疗FD经验的临床研究[D];北京中医药大学;2012年
9 刘丹红;各类疾病住院患者危重度分级研究[D];中国人民解放军第四军医大学;2003年
10 周海燕;空间数据挖掘的研究[D];中国人民解放军信息工程大学;2003年
中国硕士学位论文全文数据库 前10条
1 吴珺;数据挖掘技术在彩票销售数据分析中的应用研究[D];郑州大学;2010年
2 张进;我国施工劳动生产率管理研究[D];大连理工大学;2010年
3 李仁良;决策树算法在临床诊断中的应用研究[D];辽宁工程技术大学;2009年
4 刘芳;改进的蚁群聚类算法在森林火灾预测中的应用研究[D];辽宁工程技术大学;2009年
5 肖晴;基于数据仓库的高速公路信息管理系统的研究[D];长沙理工大学;2010年
6 高龙;天津港数据集成平台关键技术应用研究[D];大连海事大学;2010年
7 刘晓英;知识关联及其应用研究[D];湘潭大学;2010年
8 刘巍;基于聚类的孤立点发现技术研究及其在审计中的应用[D];中国海洋大学;2010年
9 韩成勇;高校学评教决策支持系统设计与实现[D];苏州大学;2010年
10 方少卿;Web就业信息抽取系统的实现研究[D];合肥工业大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 牛东晓;张彤彤;陈立荣;张博;;基于关联分析的多因素电力负荷预测灰色模型群研究[J];华北电力大学学报;2006年03期
2 彭高辉;王志良;;数据挖掘中的数据预处理方法[J];华北水利水电学院学报;2008年06期
3 张宏海,陈祝亚,李成忠;模糊系统与神经网络[J];安徽工业大学学报(自然科学版);2003年02期
4 蒋庆丰;李梓;程晓旭;;K-Means聚类算法研究及图形演示的实现[J];信息技术;2010年03期
5 程华;夏宁;房一泉;;重尾分布的网络流量SVM分类[J];华东理工大学学报(自然科学版);2010年06期
6 王娟;浅析模糊系统与神经网络的结合[J];哈尔滨理工大学学报;2003年03期
7 邱保志,尚俊平,贾晨科;基于局部最大距离的孤立点检测算法的研究[J];河南教育学院学报(自然科学版);2005年01期
8 曾鸣;刘宝华;徐志勇;袁德;;基于混沌模糊神经网络方法的短期负荷预测[J];湖南大学学报(自然科学版);2008年01期
9 魏俊;周步祥;林楠;邢义;;基于蚁群支持向量机的短期负荷预测[J];电力系统保护与控制;2009年04期
10 张文修;仇国芳;;粗糙集属性约简的一般理论[J];中国科学E辑:信息科学;2005年12期
中国重要会议论文全文数据库 前1条
1 魏宁;么彩莲;;综合评价的两种多元统计方法的研究及应用[A];中国现场统计研究会第12届学术年会论文集[C];2005年
中国重要报纸全文数据库 前1条
1 河南省郑州市二七区人民检察院 张宏伟 郭欣;[N];检察日报;2010年
中国博士学位论文全文数据库 前10条
1 延皓;基于流量监测的网络用户行为分析[D];北京邮电大学;2011年
2 李新运;城市空间数据挖掘方法与应用研究[D];山东科技大学;2004年
3 王占全;基于地理信息系统空间数据挖掘若干关键技术的研究[D];浙江大学;2005年
4 余建桥;基于云理论与数据场的空间孤立点挖掘研究[D];西南农业大学;2005年
5 卢芸;短期电力负荷预测关键问题与方法的研究[D];沈阳工业大学;2007年
6 金义富;高维稀疏离群数据集延伸知识发现研究[D];重庆大学;2007年
7 刘云霞;数据归约的统计方法研究及应用[D];厦门大学;2007年
8 郎风华;基于人工智能理论的网络安全管理关键技术的研究[D];北京邮电大学;2008年
9 马利;装备制造企业前向物流智能平衡模式研究[D];天津大学;2009年
10 刘鹏;网络用户行为分析的若干问题研究[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 周志刚;数据挖掘技术在计算机取证的研究[D];大连交通大学;2010年
2 孙燕花;基于聚类的网络用户行为分析[D];中南大学;2011年
3 张国云;数据挖掘中的聚类分析及其在控制中的应用研究[D];湖南大学;2002年
4 吴小明;考虑气象条件下的电力系统短期负荷预测研究[D];浙江大学;2003年
5 罗朝晖;计算机犯罪侦查取证技术——计算机证据研究[D];北京工业大学;2003年
6 李海芬;Pareto分布的统计分析[D];华东师范大学;2004年
7 杨雁;基于信息融合技术的战略预警系统的研究与实现[D];电子科技大学;2004年
8 刘寅;基于Web的智能教学系统的研究与实现[D];中国农业大学;2005年
9 邵莹;基于神经网络的电力系统短期负荷预测研究[D];哈尔滨理工大学;2005年
10 贺媛媛;基于支持向量机的电力系统短期负荷预测模型研究[D];大连理工大学;2006年
【二级引证文献】
中国期刊全文数据库 前1条
1 唐波;;改进的K-means聚类算法及应用[J];软件;2012年03期
中国博士学位论文全文数据库 前1条
1 王珂;矿井无线传感器网络节点部署关键技术的研究[D];中国矿业大学;2011年
中国硕士学位论文全文数据库 前2条
1 闫凤超;基于WebGIS技术的土地承包管理信息系统[D];吉林大学;2011年
2 郑杨杨;基于GPU的数据流通用处理模型[D];大连理工大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 钱宏;;数据挖掘预处理技术的研究[J];电脑知识与技术;2010年17期
2 彭璐;;基于数据仓库的ETL过程优化[J];计算机与数字工程;2010年05期
3 邵明豪;;数据预处理技术的具体实现形式研究[J];网络安全技术与应用;2009年06期
4 庄军;郭平;周杨;白桂花;王月毅;;电子病历数据预处理技术[J];计算机科学;2007年03期
5 刘莉,徐玉生,马志新;数据挖掘中数据预处理技术综述[J];甘肃科学学报;2003年01期
6 孙进;;浅析人力资源数据挖掘中的数据清理[J];福建电脑;2010年12期
7 杜永明;数据仓库中数据质量若干问题的研究[J];福建电脑;2003年01期
8 秦学勇;;数据仓库中数据集成的研究[J];农业网络信息;2006年08期
9 冯永,吴开贵,熊忠阳,吴中福;面向商业OLAP的并行数据抽取接口设计[J];重庆大学学报(自然科学版);2004年12期
10 罗森林,成华,张铁梅,曾平,陈峰;多维2型糖尿病实测数据的预处理技术[J];计算机工程;2004年17期
中国重要会议论文全文数据库 前10条
1 王桂芹;黄道;;数据预处理技术研究[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
2 曹禹;申德荣;于戈;余恩运;周文生;寇月;;数据网格内一种基于本体的数据集成处理机制[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 祝晓红;刘炜;李俊丽;;用WPF进行复杂数据集成的方法研究[A];第二十七届中国控制会议论文集[C];2008年
4 张国卿;马亚龙;同兰娟;孙明;;一种数字信号处理方法在数据预处理中的应用研究[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
5 闫永慧;;空间数据挖掘中数据预处理技术探讨[A];数字测绘与GIS技术应用研讨交流会论文集[C];2008年
6 王帅;缪嘉嘉;李爱平;韩伟红;贾焰;;一种基于构件技术和消息代理模式的数据集成方法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
7 姜芸;吴学伟;;面向服务的地理数据集成中间件的设计与实现[A];第二届“测绘科学前沿技术论坛”论文精选[C];2010年
8 胥永康;吴志杰;席传裕;岳筱玲;;基于数据拆分的数据集成技术研究[A];2005全国计算机程序设计类课程教学研讨会论文集[C];2005年
9 张荣祖;朱扬勇;;一个可视化数据挖掘系统中的数据预处理技术[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
10 刘奕群;张敏;马少平;;面向信息检索需要的网络数据清理研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 ;SaaS需要数据集成[N];网络世界;2007年
2 于翔;谁碾碎了数据?[N];网络世界;2007年
3 陈友梅;数据集成 永中Office之本[N];中国计算机报;2002年
4 邹大斌;发挥数据的最大价值[N];计算机世界;2007年
5 姜学军(山东省医药卫生科技信息研究所) 程永(浪潮商用系统公司;山东省地税系统的数据集成[N];电脑商报;2005年
6 李稚;“集成”的困惑[N];计算机世界;2002年
7 于翔 王翔;收复数据孤岛[N];网络世界;2007年
8 刘学纲;互联互通平台的数据集成[N];中国计算机报;2003年
9 朱文;CIO希望攻克数据质量关[N];计算机世界;2008年
10 本报记者 邹大斌;Informatica:从数据中淘金[N];计算机世界;2008年
中国博士学位论文全文数据库 前10条
1 刘杰;面向数据集成的数据清理关键技术研究[D];中国科学技术大学;2010年
2 王欣;数据集成技术若干问题的研究[D];上海交通大学;2010年
3 蒋永国;面向传感网的海洋观测数据集成关键技术研究[D];中国海洋大学;2010年
4 卜志国;海洋生态环境监测系统数据集成与应用研究[D];中国海洋大学;2010年
5 周春英;超数据集成挖掘方法与技术研究[D];浙江大学;2012年
6 陈义;面向数据集成的数据复制和查询优化[D];中国科学院研究生院(软件研究所);2004年
7 余建桥;基于云理论与数据场的空间孤立点挖掘研究[D];西南农业大学;2005年
8 张永新;面向Web数据集成的数据融合问题研究[D];山东大学;2012年
9 殷晓冬;声学测深数据处理与海陆数据集成方法研究[D];大连理工大学;2010年
10 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
中国硕士学位论文全文数据库 前10条
1 张红宇;数据集成中本体映射的研究[D];中南大学;2005年
2 缪建明;集散控制系统的数据集成的研究与应用[D];福州大学;2003年
3 刘军;分布式智能异构数据集成支持系统的原型实现[D];大连海事大学;2003年
4 李凯;面向SCM数据集成的DW解决方案研究[D];大连理工大学;2006年
5 文静;数据集成中数据冲突检测和解决方法研究[D];山东大学;2010年
6 张雪洁;基于XML的数据集成平台框架及关键技术研究[D];河海大学;2004年
7 周艳芳;基于XML的ERP和电子商务数据集成[D];四川大学;2004年
8 袁红;保险公司数据集成关键技术的研究及应用[D];重庆大学;2004年
9 常萍英;基于OPC的机器人焊接生产线监控系统的数据集成及软件开发[D];东南大学;2004年
10 王宇鸽;电子政务中异构数据资源集成技术的应用研究[D];北方工业大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026