收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种开放式数据清理框架

陆凤霞  王静秋  王宁生  
【摘要】:从提高制造业信息化中数据质量的角度出发,分析了建立基于规则库和算法库的可扩展数据清理框架的必要性,设计了一种基于多种规则结合不同算法以流程方式完成清理任务的可重构的数据清理框架。在框架的设计中,以实例方式总结了数据质量问题的分类,详细阐述了该框架的结构、组成部分以及工作流程。最后,通过数据清理实例说明了该框架中流程的实现及其工作过程。本文提出的数据清理框架功能将随着不同领域清理任务的完成而不断完善。

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 祝望;;公路测量中应用的交互图解系统[J];公路;1985年07期
2 文武;数据仓库如何消除数据污染?[J];中国计算机用户;1996年Z1期
3 朱廷劭;高文;Charlex X.Ling;;数据库中知识发现的处理过程模型的研究[J];计算机科学;1999年02期
4 郝善勇,刘玉树,丁亚军,张健;实时数据采集中的数据清理技术[J];微电子学与计算机;2000年01期
5 曹立伟,于磊;AS/400系统的数据清理方法[J];软件世界;2000年08期
6 吴峰,施鹏飞;概念聚类挖掘方法的客户交易行为分析[J];微型电脑应用;2000年05期
7 孙雯;锁紧商业银行[J];中国计算机用户;2000年28期
8 ;Sun银行管理[J];信息系统工程;2001年09期
9 肖智,李勇,李昌隆;一种基于相关分析的数据预处理方法[J];重庆大学学报(自然科学版);2002年06期
10 李庆华,周建红;缺损属性的补充方法——迭代MVC[J];华中科技大学学报(自然科学版);2002年02期
中国重要会议论文全文数据库 前9条
1 谭立云;凯丽比努尔;塔西甫拉提;高学东;热合木江;;数据挖掘中的数据预处理方法研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
2 郭友钊;;论全国区域岩石物性调查[A];中国地球物理学会第二十届年会论文集[C];2004年
3 黄章树;黄丽钦;;数据挖掘技术在电信增值服务行业中的应用[A];2004年中国管理科学学术会议论文集[C];2004年
4 王秀芳;齐玮;慕晓冬;;数据挖掘在故障诊断专家系统知识获取中的应用[A];第十九届中国(天津)'2005IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2005年
5 刘奕群;张敏;马少平;;面向信息检索需要的网络数据清理研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 张铁岩;刘莉;张媛;张化光;;配电系统的区间负荷模式建立及负荷数据处理[A];2005中国控制与决策学术年会论文集(下)[C];2005年
7 王春雨;顾军华;;基于知识发现的公交客流分析平台[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
8 王智为;;客票系统5.0版工作流系统的设计与实现[A];中国铁路客票发售和预订系统5.0版应用研讨会论文集[C];2006年
9 陈堃;李心科;;基于可扩展数据清理框架的元数据的研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
中国博士学位论文全文数据库 前5条
1 陈伟;数据清理关键技术及其软件平台的研究与应用[D];南京航空航天大学;2005年
2 余建桥;基于云理论与数据场的空间孤立点挖掘研究[D];西南农业大学;2005年
3 白爱民;基于客户集群和拓扑理论的CRM模型与算法研究[D];天津大学;2006年
4 满江虹;基于粗糙集的分类知识发现方法及其应用研究[D];东南大学;2005年
5 张旭峰;ETL若干关键技术研究[D];复旦大学;2006年
中国硕士学位论文全文数据库 前10条
1 高燕;基于数据挖掘技术的海关执法评估系统的研究与开发[D];武汉理工大学;2002年
2 陶艺军;高等教育出版社ERP系统实施案例分析[D];对外经济贸易大学;2003年
3 宇然;数据挖掘技术研究以及在档案计算机管理系统中的应用[D];沈阳工业大学;2002年
4 郑秀芬;WEB数据库和数据仓库技术的研究与应用[D];浙江大学;2004年
5 钟莉云;利用数据沿袭改进数据清理质量的机制的研究[D];西南师范大学;2004年
6 肖干军;基于XML的异构数据源查询处理研究[D];华中科技大学;2004年
7 张骏;工控机的存储器系统设计[D];西北工业大学;2005年
8 胡欣;多邦药业数据仓库的建立与OLAP[D];东北师范大学;2005年
9 郭训报;Web日志数据预处理及多维建模研究[D];对外经济贸易大学;2006年
10 魏平;一些预测算法的研究与应用[D];浙江大学;2004年
中国重要报纸全文数据库 前10条
1 叶云 李小进;网络资源管理项目的建设实施[N];人民邮电;2002年
2 秦建平,瞿滨,徐云翔;完善“一窗式”报税“全市通”[N];中国税务报;2004年
3 叶景亮;会宁国税数据整合工作启动[N];白银日报;2005年
4 本报记者 向红;跨行交易被“卡”在哪儿?[N];中国城乡金融报;2005年
5 本报记者 胡迎莹;证券风险管理数字化[N];计算机世界;2005年
6 ;市级有关部门重点整改事项公示(一)[N];乐山日报;2005年
7 薛恩才 李鹏飞 尹拴海;吕梁市人口基本信息数据 提前进入全国人口信息管理系统[N];山西经济日报;2005年
8 记者 刘寒凝 实习生 霍丽莎;我市展开无线电台站数据清理登记工作[N];保定日报;2006年
9 吴德胜 李宏一;数据上收 湖北分行力争安全高效 广西分行启动差异分析[N];中国城乡金融报;2006年
10 王轲;纠错到底[N];中国城乡金融报;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978