收藏本站
《当代经济管理》 2007年03期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

低质量数据下的知识获取方案研究

李兴森  石勇  鹿盟  申爱华  
【摘要】:数据挖掘已经成为重要的知识来源。随着信息化的深入,企业对数据挖掘有了较大的需求,但数据质量差往往会造成数据挖掘的结论可信度低,从而影响了数据挖掘的应用。本文以可拓学方法,通过系统分析产生脏数据的原因,提出了基于学科链方法的数据清洗方案。通过数据挖掘手段发现数据质量差距,追溯到软件设计、实施、维护等上游环节,提出从来源环节解决问题的系统方法,并提出通过数据挖掘应用咨询促使数据质量改进的措施,从而降低数据清洗的工作量,使数据质量不高的企业也可以实施数据挖掘项目,获取决策支持所需的知识。

知网文化
【参考文献】
中国期刊全文数据库 前10条
1 张晓星,程其云,周湶,孙才新;基于数据挖掘的电力负荷脏数据动态智能清洗[J];电力系统自动化;2005年08期
2 杨春燕,蔡文;可拓工程研究[J];中国工程科学;2000年12期
3 蔡文,杨春燕,何斌;可拓学基础理论研究的新进展[J];中国工程科学;2003年02期
4 李兴森;石勇;李爱华;;基于可拓集的企业数据挖掘应用方案初探[J];哈尔滨工业大学学报;2006年07期
5 刘芳,何飞;一种基于聚类树的增量式数据清洗算法[J];华中科技大学学报(自然科学版);2005年03期
6 覃华,苏一丹,李陶深;基于遗传神经网络的数据清洗方法[J];计算机工程与应用;2004年03期
7 刘芳,何飞;基于聚类分析技术的数据清洗研究[J];计算机工程与科学;2005年06期
8 朱如,李庆峰;数据质量管理与企业信息化建设[J];计算机时代;2005年06期
9 方南晖,黄文强,张为;基于专家系统体系结构的数据清洗器设计[J];计算机应用;2002年08期
10 王咏梅,陈家琪,耿玉良;一种可交互的数据清洗系统[J];计算机工程与设计;2005年04期
中国硕士学位论文全文数据库 前1条
1 申爱华;粗糙集在不完备信息系统数据挖掘中的应用研究[D];大连海事大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 安永林;彭立敏;张运良;施成华;;可拓法评估煤矿瓦斯爆炸易发性[J];灾害学;2007年04期
2 郑洪源;周良;;基于CWM的标准ETL的设计与实现[J];吉林大学学报(信息科学版);2006年01期
3 龙立波;姚建刚;李连结;钱卫华;;短期电力负荷预测中的数据处理技术[J];电力需求侧管理;2007年01期
4 余虎;姚建刚;罗滇生;谷林峰;李连结;;数字电力系统基础架构平台的设计与实现[J];电力系统自动化;2006年18期
5 杨飞;基于DTS对象模型的数据转移的实现[J];电脑与信息技术;2004年05期
6 蔡文,杨春燕,何斌;可拓学基础理论研究的新进展[J];中国工程科学;2003年02期
7 何斌;基于可拓-集对的经济策略生成方法[J];系统工程;2004年04期
8 杨春燕,张拥军;基于可拓方法的策划研究[J];工业工程;2001年02期
9 杨春燕,张拥军;可拓市场的类型与实现方式研究[J];工业工程;2002年03期
10 蔡文;石勇;;可拓学的科学意义与未来发展[J];哈尔滨工业大学学报;2006年07期
中国重要会议论文全文数据库 前3条
1 张勇斌;孙彦广;;提高钢铁企业数据仓库中数据质量的方法与探讨[A];冶金轧制过程自动化技术交流会论文集[C];2005年
2 齐丹;田华;徐晶;韦方强;江玉红;黄思源;;云贵川渝地质灾害预报系统在西南地区的应用[A];中国气象学会2007年年会天气预报预警和影响评估技术分会场论文集[C];2007年
3 苏怀智;温志萍;;试论大坝安全感知技术[A];首届信息获取与处理学术会议论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 王曰芬;文献计量法与内容分析法的综合研究[D];南京理工大学;2007年
2 李桥兴;灰色投入产出分析及直接消耗系数可拓调整研究[D];南京航空航天大学;2007年
3 张瑞军;基于信息链的智能信息处理关键技术研究[D];武汉理工大学;2007年
4 邓群钊;中部丘陵地区粮食安全和农民增收矛盾问题的系统分析[D];南昌大学;2006年
5 苏怀智;大坝安全监控感智融合理论和方法及应用研究[D];河海大学;2002年
6 赵燕伟;智能化概念设计的可拓方法研究[D];上海大学;2005年
7 周宇辉;泊位淤积知识及其在清淤工程管理中的应用研究[D];天津大学;2004年
8 谢久兵;基于MAPGIS的广州市主要陆地地质灾害风险评估模型研究[D];中国科学院研究生院(广州地球化学研究所);2006年
9 何斌;基于可拓逻辑的机器学习理论与方法[D];华南理工大学;2005年
10 黄大荣;复杂系统的故障预测理论及其在励磁系统中的应用研究[D];重庆大学;2006年
中国硕士学位论文全文数据库 前10条
1 殷俊;基于ETL技术的电信业数据仓库质量控制模型的研究及应用[D];上海交通大学;2007年
2 侯延湘;数据质量管理及在数据仓库实现探讨[D];吉林大学;2007年
3 尹毅;基于可拓逻辑的蚕种催青控制系统设计[D];南昌大学;2007年
4 黎岗;汽车行业质量管理信息系统的研究与开发[D];南昌大学;2007年
5 徐国强;分布式决策知识表示和推理机制研究[D];中国海洋大学;2007年
6 柯光领;基于代码生成的组件化通用ETL工具[D];暨南大学;2007年
7 王林;基于可拓学的电力系统故障性质区分[D];南京理工大学;2007年
8 李俊娴;基于预处理技术的数据清理系统研究与实现[D];南京航空航天大学;2007年
9 田明;电力负荷管理系统及数据多维存储研究[D];南京理工大学;2007年
10 杨宏娜;基于数据仓库的数据清洗技术研究[D];河北工业大学;2006年
【二级参考文献】
中国期刊全文数据库 前10条
1 钟波,肖智,李勇,张志恒;一种基于遗传算法的数据预处理组合方法[J];西南师范大学学报(自然科学版);2002年04期
2 孙雅明,杜红卫,廖志伟;基于神经逻辑网络冗余纠错和FNN组合的配网高容错性故障定位[J];电工技术学报;2001年04期
3 于金龙,李晓红,孙立新;连续属性值的整体离散化[J];哈尔滨工业大学学报;2000年03期
4 王清印,崔援民,任彪;不确定信息的产生根源与泛灰集合基础[J];华中理工大学学报;2000年04期
5 赛英,陈文伟;从数据库中发现知识的方法研究与应用[J];管理科学学报;1999年03期
6 胡扬宇,李然,杨宛辉,史述红,杨育霞;城市电网故障诊断系统[J];继电器;2002年12期
7 张琦,韩祯祥,文福拴;一种基于粗糙集理论的电力系统故障诊断和警报处理新方法[J];中国电力;1998年04期
8 周伟,陈允平;自组织映射神经网络用于暂态稳定性分析的研究[J];电力系统自动化;2002年15期
9 莫维仁,张伯明,孙宏斌,胡子珩,刘顺桂;扩展短期负荷预测方法的应用[J];电网技术;2003年05期
10 康重庆,夏清,相年德;灰色系统参数估计与不良数据辨识[J];清华大学学报(自然科学版);1997年04期
【相似文献】
中国期刊全文数据库 前10条
1 王有登;关于科技期刊文献库的数据质量问题[J];编辑学报;1991年03期
2 ;西南农业大学学报获CUJA数据质量二等奖[J];西南农业大学学报;1992年06期
3 杰连;陕西高校CUJA联络组获得CUJA集体贡献荣誉奖一等奖 本刊荣获CUJA综合数据质量二等奖[J];西安建筑科技大学学报(自然科学版);1993年S1期
4 王多;;本刊荣获CUJA综合数据质量二等奖[J];南京工业大学学报(自然科学版);1993年02期
5 晨光;;加强档案数据质量的管理[J];中国档案;1993年02期
6 黄箭,张建勇;机读书目数据质量控制研究──提高TOTALS系统中书目数据质量的策略[J];现代图书情报技术;1997年S1期
7 张春森;管网信息系统数据质量控制方法[J];测绘通报;1998年10期
8 陈传波,唐九飞;信息系统中的数据质量[J];湖北工学院学报;1998年03期
9 徐磊;光盘版《中文社科报刊篇名数据库》(1993—1996)数据质量小议[J];江苏图书馆学报;1998年06期
10 张春森;管网信息系统空间数据质量的控制[J];遥感信息;1998年03期
中国重要会议论文全文数据库 前10条
1 王晓华;;最优化列阵滤波高分辨率去噪特性研究[A];1994年中国地球物理学会第十届学术年会论文集[C];1994年
2 S. M. H. Abedi;M. el Toukhy;Maurice Nessem;曹景璋;;3D地震:作为埃及西部沙漠区Abu Gharadig盆地勘探和开发的工具[A];美国勘探地球物理学家学会第61届年会论文集[C];1991年
3 Gerald J. Henderson;Peter C. Johnson;Lawrence B. Sullivan;王友仁;;3D勘探的物理模拟与质量控制[A];美国勘探地球物理学家学会第61届年会论文集[C];1991年
4 John B. DuBose Jr.;李小秋;;发挥蒙特卡罗自动静校正潜力的实际步骤[A];美国勘探地球物理学家学会第61届年会论文集[C];1991年
5 Christopher L.Liner;V.Dale Cox;刘清林;;发射方向井间地震数据接收[A];美国勘探地球物理学家学会第64届年会论文集[C];1994年
6 Susan L.M.Miller;Mark P.Harrison;Ken J.Szata;Robert R.Stewart;Don C.Lawton;严建文;;应用P-P和P-SV地震资料解释碳酸盐岩储层[A];美国勘探地球物理学家学会第64届年会论文集[C];1994年
7 Andreas Hordt;Keeva Vozoff;Ole G.Engels;伊增坦;;瞬变电磁法用于气储监测[A];美国勘探地球物理学家学会第65届年会论文集[C];1995年
8 Patrick G.Burger;Pierre Baligues;Jean-Jacqes Postel;黄中玉;;丛林山区单道和多道遥测系统的试验比较[A];美国勘探地球物理学家学会第65届年会论文集[C];1995年
9 Michel Manin;Simon Spitz;程前进;;稀疏采样排列波场的去假频处理[A];美国勘探地球物理学家学会第65届年会论文集[C];1995年
10 Dick Ireson;Philip Armstrong;Ian Scott;杨勤勇;;利用井中数据定量分析地震数据质量[A];美国勘探地球物理学家学会第66届年会论文集[C];1996年
中国重要报纸全文数据库 前10条
1 记者 沙莉;人口普查 准确第一[N];中国人口报;2000年
2 广西壮族自治区统计局局长 廖新华;GDP数据质量评估来不得半点虚假[N];中国信息报;2000年
3 记者 朱剑红;坚决反对弄虚作假 努力提高数据质量[N];人民日报;2001年
4 杨少浪;潮州市工业统计制度改革初见成效[N];中国信息报;2001年
5 通讯员林激记者文霞平;切实做好投入产出调查工作[N];安徽日报;2002年
6 综合司;GDDS的主要内容(二)[N];中国信息报;2002年
7 余芳东;国外统计数据质量的涵义及评价和管理[N];中国信息报;2002年
8 本报记者 王权;确保数据质量 坚持精品统计[N];中国信息报;2002年
9 李莉 商瑶玲;构建大型空间基础地理信息数据库[N];中国测绘报;2003年
10 ;为征信体系建设打下良好基础[N];金融时报;2003年
中国博士学位论文全文数据库 前10条
1 李智广;区域土壤侵蚀遥感定量监测技术研究[D];西北农林科技大学;2001年
2 关绮鸿;财政透明度研究[D];厦门大学;2002年
3 许涛;电力系统安全稳定的智能挖掘[D];华北电力大学(北京);2004年
4 杨生;大地电磁测深法环境噪声抑制研究及其应用[D];中南大学;2004年
5 杨光;机电产品BIT系统传感层降虚警的理论与技术研究[D];国防科学技术大学;2003年
6 陈伟;数据清理关键技术及其软件平台的研究与应用[D];南京航空航天大学;2005年
7 曾衍伟;空间数据质量控制与评价技术体系研究[D];武汉大学;2004年
8 童莉;生态工业园区产业链设计及其系统稳定性研究[D];北京化工大学;2006年
9 王霞;卫生统计调查元数据概念模型的研究[D];第四军医大学;2006年
10 杨武;基于多源数据的土地利用变化研究[D];同济大学;2006年
中国硕士学位论文全文数据库 前10条
1 吴芳华;失量地图数据质量控制的理论与实践[D];中国人民解放军信息工程大学;2002年
2 徐静;质量驱动的数据仓库三层体系结构[D];中国海洋大学;2003年
3 周芝芬;基于数据仓库的数据清洗方法研究[D];东华大学;2004年
4 孟巍;数据仓库数据质量评价研究及其应用[D];河北工业大学;2004年
5 钟莉云;利用数据沿袭改进数据清理质量的机制的研究[D];西南师范大学;2004年
6 王静;GIS数据质量控制理论与实践[D];辽宁工程技术大学;2004年
7 张芳;政府统计数据质量及其管理研究[D];湖南大学;2004年
8 周宏广;异构数据源集成中清洗策略的研究及应用[D];中南大学;2004年
9 熊霞;数据仓库中数据质量控制问题研究[D];武汉大学;2004年
10 王华;1:25万协同图数据成果质量影响因素及检查方法研究[D];解放军信息工程大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026