收藏本站
《软件学报》 2002年11期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

数据质量和数据清洗研究综述

郭志懋  周傲英  
【摘要】:对数据质量,尤其是数据清洗的研究进行了综述.首先说明数据质量的重要性和衡量指标,定义了数据清洗问题.然后对数据清洗问题进行分类,并分析了解决这些问题的途径.最后说明数据清洗研究与其他技术的结合情况,分析了几种数据清洗框架.最后对将来数据清洗领域的研究问题作了展望.

【相似文献】
中国期刊全文数据库 前10条
1 刘哲;;数据清洗技术在网络教学评价体系中的应用[J];网络与信息;2011年08期
2 邹亚会;;一种有效检测汉语相似重复记录的方法[J];科技情报开发与经济;2011年21期
3 邹亚会;;检测大型数据库中汉语相似重复记录的方法[J];内蒙古科技与经济;2011年14期
4 王妍;宋宝燕;付菡;李晓光;;引入卡尔曼滤波的RFID数据清洗方法[J];小型微型计算机系统;2011年09期
5 潘巍;李战怀;聂艳明;陈群;;一种有效的多数据源RFID冗余数据清洗技术[J];西北工业大学学报;2011年03期
6 贾瑛;;Web使用挖掘的数据预处理过程分析[J];科技信息;2011年21期
7 袁健;金鑫;;一种重构网站结构的Web日志挖掘数据预处理方法[J];小型微型计算机系统;2011年07期
8 陈慧蕾;曹耀斐;;使用分布式数据整合平台解决信息孤岛问题的探讨[J];珠江水运;2010年06期
9 王晓虹;刘莹;张艳凤;;高校数据集成系统的ETL设计与实现[J];计算机技术与发展;2011年07期
10 韩宇;;从Web日志中挖掘浏览潜规则算法设计[J];计算机与信息技术;2011年Z2期
中国重要会议论文全文数据库 前10条
1 蒋勇青;杨奕虹;杨贺;;论数据清洗对信息检索质量的影响及清洗方法[A];2011年中国索引学会年会暨成立二十周年庆典论文集[C];2011年
2 俞荣华;郭志懋;田增平;周傲英;;一个可扩展的数据清洗系统[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
3 周芝芬;乐嘉锦;;消除数据仓库中相似重复记录的方法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 邱越峰;田增平;季文赟;周傲英;;一种基于N-Gram的检测相似重复记录的高效方法[A];第十六届全国数据库学术会议论文集[C];1999年
5 肖英治;陈红;;带数据清洗功能的数据预处理系统PW-ETL的设计与实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 李晓静;谷峪;吕雁飞;王艳秋;于戈;;基于动态事件概率模型的高效RFID数据清洗算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
7 王妍;石鑫;宋宝燕;;基于伪事件的RFID数据清洗方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
8 缪嘉嘉;李爱平;贾焰;吴泉源;;信息集成中数据获取关键技术的研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
9 相文玺;宋杰;房强;丁辉;鲍玉斌;于戈;;一种面向科学数据的通用排重模型[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
10 崔运钏;刘连忠;;一种可扩展的数据清洗系统的设计与实现[A];2006中国控制与决策学术年会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 中国人民财产保险股份有限公司信息技术部副总经理 鹿慧 编译;在SOA中创建独立的数据清洗服务[N];计算机世界;2009年
2 姜蓉;外包:坦途还是末路?[N];中国经营报;2008年
3 于翔 王翔;收复数据孤岛[N];网络世界;2007年
4 徐芳芳;如何管好集团的主数据[N];中国计算机报;2008年
5 本报记者 李国华;动手前,先“洗洗”数据[N];中国经营报;2009年
6 夏凯;三步实现数据迁移[N];中国计算机报;2005年
7 广东省电信公司科学技术研究院 汪虹;数据抽取: 复杂电信数据的统一路[N];计算机世界;2002年
8 ;Informix:从粗放型经营到分析型经营[N];中国计算机报;2000年
9 张立明;数据挖掘之道[N];网络世界;2003年
10 编译 乐天;SaaS BI市场悄然启动[N];计算机世界;2010年
中国博士学位论文全文数据库 前8条
1 常建龙;数据流聚类及电信数据流管理[D];复旦大学;2008年
2 郑向群;农产品产地污染综合知识挖掘系统的研究[D];天津大学;2009年
3 刘波;XML数据智能管理若干关键技术研究[D];中南大学;2008年
4 陈伟;数据清理关键技术及其软件平台的研究与应用[D];南京航空航天大学;2005年
5 吴爱华;不一致数据的查询处理[D];复旦大学;2010年
6 朱恒民;领域知识制导的数据挖掘技术及其在中药提取中的应用[D];南京航空航天大学;2006年
7 刘亚波;关联规则挖掘方法的研究及应用[D];吉林大学;2005年
8 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
中国硕士学位论文全文数据库 前10条
1 崔亮;基于DBSCAN算法的相似重复记录检测方法研究[D];哈尔滨工程大学;2007年
2 刘华;Web信息集成中数据清洗的研究[D];武汉理工大学;2007年
3 周宏广;异构数据源集成中清洗策略的研究及应用[D];中南大学;2004年
4 李明;数据清洗技术在文本挖掘中的应用[D];南京理工大学;2008年
5 谭亚竹;基于XML数据清洗的应用研究[D];重庆大学;2006年
6 张宇;基于多Agent的数据清洗系统的研究与实现[D];东北大学;2008年
7 张好军;Web数据集成中数据清洗的关键问题研究[D];山东大学;2009年
8 史习一;在数据清洗过程中基于MMDB的数据匹配技术研究[D];电子科技大学;2007年
9 杨宏娜;基于数据仓库的数据清洗技术研究[D];河北工业大学;2006年
10 张燕;基于聚类算法的数据清洗的研究与实现[D];华北电力大学(河北);2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026