收藏本站
《福建工程学院学报》 2011年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

数据挖掘取样方法的衡量与选用研究

胡文瑜  蔡文培  
【摘要】:取样是一种通用有效的近似技术。在数据挖掘研究中,取样方法可显著减小所处理数据集的规模,使得众多数据挖掘算法得以应用到大规模数据集以及数据流数据上。文章在研究了统计学上随机均匀取样方法误差统计和衡量方法的基础上,着重探讨和研究了适用于数据挖掘领域的取样方法衡量标准以及影响取样方法选择的因素等问题,提出了能更好地评估取样质量,尤其是偏倚取样方法取样质量的"取样方法代表性"和"取样偏差"等概念并进行了量化,最后对数据挖掘取样方法的衡量标准和选用研究的后续工作与研究方向进行了阐述。
【作者单位】福建工程学院计算机与信息科学系;
【基金】:福建省教育厅科技项目(JA08161)
【分类号】:TP311.13
【正文快照】:
引言数据挖掘是在海量数据中提取隐含的、未知的、潜在有用的知识或信息模式的决策支持方法,其在功能上的健壮性和应用领域的广泛性已被研究者一致认同。而取样是最通用有效的近似技术,在保证一定精确度的前提下,取样方法显著减小了所处理数据集的规模,使得众多数据挖掘算法

【二级参考文献】
中国期刊全文数据库 前2条
1 杨雪梅;董逸生;徐宏炳;刘学军;钱江波;王永利;;高维数据流的在线相关性分析[J];计算机研究与发展;2006年10期
2 贾彩燕;陆汝钤;;关联规则挖掘的取样误差量化模型和快速估计算法[J];计算机学报;2006年04期
【相似文献】
中国期刊全文数据库 前10条
1 枫;;2011年数据挖掘欧洲会议[J];国外社会科学;2011年04期
2 庄仁团;;数据挖掘技术在电子政务系统中的应用[J];海峡科学;2011年05期
3 李红梅;曹建河;;数据挖掘技术在烟草销售行业中应用探析[J];现代商贸工业;2011年14期
4 陆渊章;;基于数据挖掘高职院校学生技能考证系统的研究[J];信息安全与技术;2011年07期
5 徐德军;国实;;数据挖掘算法中兴趣度阈值的应用研究[J];软件导刊(教育技术);2011年07期
6 殷脂;殷卫红;;DNA序列数据分析技术综述[J];上海电力学院学报;2011年04期
7 尹亮;;基于孤立点的数据挖掘方法在审计中的应用与研究[J];硅谷;2011年17期
8 蒋亚虎;;基于SQL Server的OLAM模块研究[J];制造业自动化;2011年16期
9 郁琦;钱雪忠;;数据挖掘在高职院校学生技能考证管理中的应用[J];中小企业管理与科技(上旬刊);2011年08期
10 高臻耀;张敬谊;林志杰;熊赟;朱扬勇;;一个医保基金风险防控平台中的数据挖掘技术[J];计算机应用与软件;2011年08期
中国重要会议论文全文数据库 前3条
1 潘国林;杨帆;;数据挖掘算法在保险客户分析中的应用[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
2 陈令坤;;数据挖掘技术在高炉专家系统参数自学习中的应用[A];中国计量协会冶金分会2011年会论文集[C];2011年
3 魏晨辉;张展;向琳;王书婷;左德承;;一种基于高端容错计算机故障日志分析系统的设计与实现[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年
中国重要报纸全文数据库 前5条
1 贵州省移动通信公司 苏思妮;让信息去主动寻找用户[N];通信产业报;2004年
2 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
3 湖北警官学院信息技术系 刘志军 王宁 麦永浩;取证技术的三大方向[N];计算机世界;2004年
4 游小霞;Oracle9i集群的力量[N];中国计算机报;2001年
5 曹健 艾福梅;农田吃“营养配餐” 减污又增产[N];粮油市场报;2010年
中国博士学位论文全文数据库 前1条
1 张惠;产品专利知识获取及其辅助产品创新的方法研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 赵虎;云计算环境下的关联数据挖掘算法实现[D];电子科技大学;2011年
2 白云龙;基于Hadoop的数据挖掘算法研究与实现[D];北京邮电大学;2011年
3 赵方霞;基于气象数据的数据挖掘算法研究[D];北方工业大学;2011年
4 郭乙江;基于树的不确定性数据挖掘算法研究[D];广西师范学院;2011年
5 张守明;基于人工蜂群的模糊聚类数据挖掘算法研究[D];兰州理工大学;2011年
6 刘雷;蜜网中的入侵告警分析研究[D];北京邮电大学;2011年
7 李晓丽;不确定性数据挖掘算法设计[D];电子科技大学;2011年
8 杨永刚;云计算下关联分类技术的研究与实现[D];电子科技大学;2011年
9 孙波;脑认知状态fMRI数据的分析及分类方法研究[D];大连理工大学;2011年
10 王磊;基于属性相关分析的局部离群数据挖掘算法研究及其应用[D];太原科技大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026