收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种乱序数据流上的偏倚抽样算法

秦林新  刘奇志  
【摘要】:抽样是生成和维护数据流概要结构的常用方法.乱序数据流中,延时到达的数据通常被丢弃,从而会降低聚集运算的精度.提出一种新的利用双时间戳进行偏倚抽样的方法,通过所设计的衰减函数确定数据流元组的权重,根据该权重进行抽样,不仅可以保证将最新产生的数据抽中,保留在滑动窗口内,还可以保证部分重要的延时数据不被丢弃.利用平衡二叉树存储滑动窗口内数据流元组的权重,以提高数据流操作的响应时间.实验结果表明根据双时间戳计算出的数据权重更能反映数据的实时性和代表性;与顺序结构相比,利用平衡二叉树可提高最小权重的查找速度,流数据量越大,速度提高越明显.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 时念云;张金明;褚希;;基于CURE算法的相似重复记录检测[J];计算机工程;2009年05期
2 毕冉;李建中;程思瑶;;无线传感器网络(ε,δ)-近似Top-k查询处理算法[J];通信学报;2011年08期
3 陈华辉;施伯乐;;基于随机投影的并行数据流聚类方法[J];模式识别与人工智能;2009年01期
4 刘彩苹;李仁发;付彬;毛建频;;无线传感器网络中位数查询抽样算法研究[J];计算机应用;2010年05期
5 杨长生 ,何志钧;汉语词汇声音信号的抽样算法[J];浙江大学学报(工学版);1987年03期
6 魏博;彭新光;;SOAP消息基于双时间戳的安全性扩展[J];网络安全技术与应用;2007年10期
7 杨颖;杨磊;;分布式流数据频繁项发现算法的研究[J];计算机应用;2008年01期
8 杨颖;陈秋莲;杨磊;;分布式数据流查询处理的P2P中间件研究[J];计算机工程;2008年02期
9 陈华辉;施伯乐;;时间序列流的分层段模型[J];小型微型计算机系统;2009年04期
10 渠瑜;王亚弟;韩继红;赵宇;;对BM模式匹配算法的一个改进[J];计算机工程;2006年23期
11 王玉荣;钱雪忠;;大数据集挖掘的层次二分抽样算法[J];计算机工程与应用;2010年35期
12 由育阳;张健沛;杨志宏;由勇;;基于前缀树的数据流容错概要结构构造[J];北京航空航天大学学报;2011年05期
13 王星;关联规则的序贯抽样算法比较研究[J];计算机工程与应用;2005年01期
14 赵辉;王黎明;;一个基于网格服务的分布式关联规则挖掘算法[J];小型微型计算机系统;2006年08期
15 陈华辉;施伯乐;;数据流上具有数据遗忘特性的小波概要[J];计算机研究与发展;2009年02期
16 刘海龙;李战怀;陈群;;乱序RFID数据流上的复杂事件检测方法[J];西北工业大学学报;2009年04期
17 吴从中;李本斋;胡有刚;;H.264帧内4×4块预测模式选择及其IP核设计[J];微型机与应用;2010年06期
18 韩慧;王路;温明;王文渊;;不均衡数据集学习中基于初分类的过抽样算法[J];计算机应用;2006年08期
19 刘海龙;李战怀;;基于ENFA的乱序RFID复杂事件检测算法[J];华中科技大学学报(自然科学版);2010年01期
20 杨长生;何志钧;;汉语词汇声音信号的抽样算法[J];计算机研究与发展;1987年01期
中国重要会议论文全文数据库 前5条
1 张兆功;李建中;;挖掘关联规则的新抽样算法[A];第十六届全国数据库学术会议论文集[C];1999年
2 张龙波;李战怀;余敏;王勇;蒋芸;;面向数据流滑动窗口的随机抽样算法研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 谭会晓;李建中;;挖掘关联规则中的并行算法[A];第十六届全国数据库学术会议论文集[C];1999年
4 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 邓松;万常选;;基于用户反馈的Web多媒体数据源的选取[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
中国博士学位论文全文数据库 前7条
1 耿中元;用于整体光照的滤波和抽样算法[D];天津大学;2010年
2 陈华辉;基于遗忘特性的数据流概要结构及其应用研究[D];复旦大学;2008年
3 聂国梁;流数据统计算法研究[D];华中科技大学;2006年
4 叶祺;大规模网络的社团发现与多层次可视化分析[D];北京邮电大学;2011年
5 丁轶群;基于概率生成模型的文本主题建模及其应用[D];浙江大学;2010年
6 张进;基于布鲁姆过滤器的IP骨干网流量分析前端处理算法研究[D];解放军信息工程大学;2008年
7 赵建邦;基于代谢网络的功能模式发现及系统发生分析研究[D];西安电子科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 韩秋玲;过抽样算法在不平衡数据学习中的应用[D];华南理工大学;2011年
2 董永吉;基于公平机制的网络测量抽样算法研究[D];解放军信息工程大学;2009年
3 李萌;ARMA-GARCH-M模型的马氏链抽样算法与实证分析[D];清华大学;2002年
4 魏博;SOAP基于双时间戳的安全性扩展[D];太原理工大学;2007年
5 胡广昌;基于Bloom Filters流抽样算法的研究[D];曲阜师范大学;2010年
6 关晓鹏;烟草行业市场信息管理系统的设计与实现[D];山东大学;2010年
7 刘东;网络安全事件流聚集统计分析研究与实现[D];国防科学技术大学;2010年
8 龙斌;车载放射性废物体在线监测技术研究[D];兰州大学;2011年
9 马双;基于项目反应模型的试卷质量分析及学生能力评估[D];东北师范大学;2011年
10 车飞;基于数据立方体模型的三维散点图快速可视化技术[D];哈尔滨工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978