收藏本站
《山东科技大学学报(自然科学版)》 2004年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

数据清洗技术研究

邓中国  周奕辛  
【摘要】:概括介绍了各种文献中对数据清洗技术的描述和定义,并简要介绍了几种能自动识别数据集中潜在错误的异常检测的方法,给出了在现实数据集中进行实验的结果,讨论了数据清洗问题未来的研究方向。
【作者单位】莱芜职业技术学院 青岛大学信息工程学院
【分类号】:TP274.2

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前2条
1 廉博;数据仓库中ETL技术的研究与实现[D];沈阳工业大学;2006年
2 杨宏娜;基于数据仓库的数据清洗技术研究[D];河北工业大学;2006年
【共引文献】
中国期刊全文数据库 前6条
1 胡逢彬;沈炜;;数据ETL过程中的数据质量控制[J];信息技术;2006年04期
2 刘芳,何飞;一种基于聚类树的增量式数据清洗算法[J];华中科技大学学报(自然科学版);2005年03期
3 夏骄雄;徐俊;吴耿锋;;“数据库主成份提取”方法及其应用[J];计算机工程与应用;2006年20期
4 刘芳,何飞;基于聚类分析技术的数据清洗研究[J];计算机工程与科学;2005年06期
5 杨辅祥,刘云超,段智华;数据清理综述[J];计算机应用研究;2002年03期
6 张允;张宁生;刘茜;宁刚;;钻井机械故障诊断数据挖掘系统结构的研究[J];石油学报;2006年01期
中国重要会议论文全文数据库 前1条
1 陈堃;李心科;;基于可扩展数据清理框架的元数据的研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
中国博士学位论文全文数据库 前6条
1 张小刚;关联规则挖掘及其在复杂工业过程控制中的应用研究[D];湖南大学;2002年
2 陈珉;分布式空间数据库主动数据更新研究[D];武汉大学;2004年
3 陈伟;数据清理关键技术及其软件平台的研究与应用[D];南京航空航天大学;2005年
4 刘亚波;关联规则挖掘方法的研究及应用[D];吉林大学;2005年
5 张瑞军;基于信息链的智能信息处理关键技术研究[D];武汉理工大学;2007年
6 夏骄雄;数据资源聚类预处理及其应用研究[D];上海大学;2007年
中国硕士学位论文全文数据库 前10条
1 兰琼;基于DW/DM的地税发票综合业务分析决策系统的研究与实现[D];江西师范大学;2003年
2 唐懿芳;基于聚类模式的数据清洗技术[D];广西师范大学;2003年
3 周宏广;异构数据源集成中清洗策略的研究及应用[D];中南大学;2004年
4 缪嘉嘉;数据仓库的数据获取关键技术研究[D];国防科学技术大学;2003年
5 陈永肖;综合运行信息管理系统的研究与实现[D];华北电力大学(北京);2005年
6 付维权;数据清洗及其在宝钢计划值系统中的应用[D];东华大学;2005年
7 罗文斐;面向空间数据仓库的集成系统研究[D];华南师范大学;2005年
8 周奕辛;数据清洗算法的研究与应用[D];青岛大学;2005年
9 梁文斌;数据清洗技术的研究及其应用[D];苏州大学;2005年
10 赵燕;数据仓库设计和维护的研究与实践[D];华中科技大学;2005年
【同被引文献】
中国期刊全文数据库 前10条
1 范兆军;郑海起;戚洪海;;基于信息融合技术的机械系统故障诊断框架研究[J];科学技术与工程;2006年23期
2 董晓荔,阎保平;EPC网络中的ONS服务[J];微电子学与计算机;2005年02期
3 陈伟;丁秋林;;可扩展数据清理软件平台的研究[J];电子科技大学学报;2006年01期
4 史国友,范中洲,贾润东;基于字符串解析的智能查询方法及其应用[J];大连海事大学学报;2005年01期
5 孔庆芸;Java语言与数据库的接口——JDBC的技术原理与实现[J];电脑与信息技术;2000年02期
6 黄孝彬,刘吉臻,牛玉广;主元分析方法在火电厂锅炉过程故障检测中的应用[J];动力工程;2004年04期
7 国志宏,王堃,王强,王宏安;火电厂SIS系统中实时数据库的研究和应用[J];电力信息化;2004年05期
8 徐宏波,徐保国,徐迈;Windows中基于API的接口技术[J];上海电力学院学报;2001年04期
9 熊忠阳,张玉芳,吴中福;数据仓库数据加载技术[J];重庆大学学报(自然科学版);2002年02期
10 王新英;数据ETL问题研究[J];湖南工程学院学报(自然科学版);2004年03期
中国博士学位论文全文数据库 前4条
1 黄孝彬;火电厂控制系统故障检测与诊断的研究[D];华北电力大学(河北);2004年
2 刘亚波;关联规则挖掘方法的研究及应用[D];吉林大学;2005年
3 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
4 王宏;基于粗糙集数据挖掘技术的客户价值分析[D];哈尔滨工程大学;2006年
中国硕士学位论文全文数据库 前10条
1 张聚广;Web服务连接器关键技术研究[D];大连海事大学;2007年
2 唐懿芳;基于聚类模式的数据清洗技术[D];广西师范大学;2003年
3 周芝芬;基于数据仓库的数据清洗方法研究[D];东华大学;2004年
4 和春慧;数据仓库中数据预处理的研究与算法实现[D];吉林大学;2004年
5 周宏广;异构数据源集成中清洗策略的研究及应用[D];中南大学;2004年
6 连仁包;通用ETL技术的研究与实现[D];福州大学;2005年
7 周奕辛;数据清洗算法的研究与应用[D];青岛大学;2005年
8 孙娜;电力系统设备数据仓库的设计开发[D];华北电力大学(河北);2005年
9 孟增辉;聚类算法研究[D];河北大学;2005年
10 梁文斌;数据清洗技术的研究及其应用[D];苏州大学;2005年
【二级引证文献】
中国硕士学位论文全文数据库 前3条
1 杨仔玲;ODS存储技术在保险企业系统集成中的应用[D];大连海事大学;2007年
2 王杰勋;医疗保险信息系统异构数据集成的研究与实现[D];南京航空航天大学;2007年
3 彭璐;基于数据仓库的ETL及OLAP的理论研究[D];武汉理工大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 孙晓凌,郑群;微机型故障录波器联网系统的设计与实现[J];电力系统通信;1999年04期
2 田勇,朱云鹏,冯权;遗传算法在神经网络中的研究与应用[J];电气传动自动化;2000年06期
3 方南晖,黄文强,张为;基于专家系统体系结构的数据清洗器设计[J];计算机应用;2002年08期
4 袁明军;韩国的配网自动化系统[J];山东电力技术;2003年02期
5 沈曙明;无人值班变电所监控和操作模式的探讨与实践[J];华东电力;2004年07期
6 周子香;现代科技的一种有效工具—布尔矩阵[J];新疆石油学院学报;1990年00期
7 王智,于海斌,王天然,宋国宁;现场总线功能块的建模与分析(英文)[J];仪器仪表学报;2001年02期
8 崔巍,王本德;大连市10kV开关站自动化模式[J];电工技术杂志;2002年05期
9 刘福才,潘江华,路平立,裴润;一种改进的变焦遗传算法[J];信息与控制;2004年01期
10 吴敏;童家乐;;零距离医学模式——远程医疗[J];中国中医药现代远程教育;2004年02期
中国重要会议论文全文数据库 前10条
1 唐勇;徐斌;;35kV变电所综合自动化设计的多种模式[A];第三届安徽自然科学学术年会安徽省电机工程学会2005年学术年会论文集[C];2005年
2 介婧;曾建潮;;单群体思维进化算法[A];2000中国控制与决策学术年会论文集[C];2000年
3 张健;;不锈钢上料系统的PLC控制[A];冶金企业自动化、信息化与创新——全国冶金自动化信息网建网30周年论文集[C];2007年
4 张晶;葛成荣;肖广钰;王永军;;安顺电能量采集系统通信模式的探讨[A];2003中国电机工程学会电力系统自动化专委会供用电管理自动化分专业委员会成立暨第一届学术交流会议论文集[C];2003年
5 丁坚勇;刘涤尘;华小梅;饶凌平;;不断创新实践教学模式,提高本科教学质量[A];第6届全国高等学校电气工程及其自动化专业教学改革研讨会论文集(下册)[C];2009年
6 刘俊平;夏彬;;我校电气工程与自动化专业学生工业实习现状及改革尝试[A];第二届全国高校电气工程及其自动化专业教学改革研讨会论文集(下册)[C];2004年
7 余艳芳;钱锋;;并行遗传算法研究[A];上海市化学化工学会2006年度学术年会论文摘要集[C];2006年
8 池锐敏;张治平;;浅谈超高压变电站的自动化发展[A];第十届中国科协年会科技创新与工业强市战略论坛论文汇编[C];2008年
9 李玉冰;孙玉洁;;上卷小车控制系统[A];全国炼钢连铸过程自动化技术交流会论文集[C];2006年
10 颜立新;;矿山数据仓库建设中的数据采集设计[A];采矿工程学新论——北京开采所研究生论文集[C];2005年
中国重要报纸全文数据库 前2条
1 Silvio Lauckner;只需少量元件的USB温度传感器[N];电子资讯时报;2008年
2 广州 耿德根;仿真机器人语音控制语句[N];电子报;2008年
中国博士学位论文全文数据库 前10条
1 莫鸿强;遗传算法搜索能力和编码方式研究[D];华南理工大学;2001年
2 桂勋;多核并行和设计模式在海量电力暂态数据处理与分析中的应用研究[D];西南交通大学;2009年
3 王剑;一类新型联想记忆神经网络研究[D];华南理工大学;2003年
4 熊峰;基于DNC技术的二层车间控制模式的研究和应用[D];重庆大学;2001年
5 武传宇;基于PC+DSP模式的开放式机器人控制系统及其应用研究[D];浙江大学;2002年
6 葛红;免疫算法及核聚类人工免疫网络应用研究[D];华南理工大学;2003年
7 李智勇;模式交流多群体遗传算法及其在神经网络进化建模中的应用[D];湖南大学;2003年
8 王峻峰;分布环境下的协同装配序列规划[D];华中科技大学;2004年
9 郝宇;基于Kolmogorov复杂性的知识获取方法研究[D];清华大学;2005年
10 李晓磊;一种新型的智能优化方法-人工鱼群算法[D];浙江大学;2003年
中国硕士学位论文全文数据库 前10条
1 靳薇;基于MVC模式的Struts框架在电力客户服务支持系统中的应用[D];西安电子科技大学;2005年
2 张明宇;传感器网络上的近似查询处理[D];黑龙江大学;2005年
3 李志鸿;基于复杂适应性系统理论的教学设计模式探索[D];东北师范大学;2007年
4 谢明吉;数据清洗中相似记录检测的研究[D];华南理工大学;2010年
5 程德蓉;基于软总线的微总线研究及在远程教学平台的应用[D];重庆大学;2007年
6 周洪伟;遗传算法“早熟”现象和改进策略研究[D];解放军信息工程大学;2004年
7 黎先君;井下人员定位系统及其数据采集处理技术研究[D];中南大学;2012年
8 王春林;模糊Hopfield神经网络的稳定性分析[D];国防科学技术大学;2005年
9 朱建军;基于元件故障模式的控制系统故障树的生成[D];大连理工大学;2004年
10 王玺;高速数据采集系统的设计与实现[D];清华大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026