收藏本站
《长春理工大学学报(自然科学版)》 2019年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于倒排索引的频繁项集挖掘方法

贾丽波  姜晓明  叶青  陈占芳  
【摘要】:针对频繁项集挖掘算法中多次扫描数据库、生成大量无效频繁项集的问题,提出一种基于倒排索引和二维数组的挖掘算法。通过一次扫描数据库建立包含事务的倒排索引,解决多次扫描数据库的问题。在二维数组存储候选频繁项集时,引入标志位约束,避免产生大量无效的频繁项集。与其他算法在不同规模的数据集上进行性能比较,发现算法在数据集超过25万时执行效率优于其他算法。通过实验验证了所提出算法的高效性和可行性。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 傅向华;陈冬剑;王志强;;基于倒排索引位运算的深度优先频繁项集挖掘[J];小型微型计算机系统;2012年08期
中国硕士学位论文全文数据库 前2条
1 李若晨;基于并行的Apriori数据挖掘算法的研究[D];吉林大学;2017年
2 朱翼;基于数组的Apriori算法的改进研究[D];哈尔滨师范大学;2014年
【共引文献】
中国期刊全文数据库 前4条
1 张亚梅;张皓;海本斋;廖晓飞;;扩展WIT-树融合Diffset策略的频繁加权项集快速挖掘算法[J];计算机应用研究;2015年12期
2 易宗剑;彭月英;覃晓;唐涛;;一种基于分治策略与位运算的频繁项集挖掘算法[J];广西师范学院学报(自然科学版);2015年01期
3 张步忠;程玉胜;王则林;;基于片上多核的频繁项集并行挖掘算法[J];计算机科学;2014年03期
4 张岳;王洪国;邵增珍;赵建秀;;基于先验位运算的频繁项集挖掘[J];计算机应用研究;2013年09期
中国硕士学位论文全文数据库 前6条
1 赵慧茹;改进的文本主题表示及学习方法[D];内蒙古师范大学;2018年
2 王淑芳;基于物联网的远洋渔船补给信息管理系统研究[D];上海海洋大学;2017年
3 陈苗;一种改进Apriori算法在移动平台教学评价中的应用研究[D];重庆师范大学;2017年
4 李武举;可拓关联规则在告警相关性分析中的研究与应用[D];沈阳理工大学;2017年
5 程斐斐;基于用户上网日志的数据挖掘技术研究[D];贵州大学;2016年
6 张宁;数据挖掘中关联规则的研究与应用[D];长春工业大学;2015年
【二级参考文献】
中国期刊全文数据库 前4条
1 张玉芳;熊忠阳;耿晓斐;陈剑敏;;Eclat算法的分析及改进[J];计算机工程;2010年23期
2 熊忠阳;陈培恩;张玉芳;;基于散列布尔矩阵的关联规则Eclat改进算法[J];计算机应用研究;2010年04期
3 周海岩;;采用频繁项目链表变换的频繁项目集挖掘算法[J];小型微型计算机系统;2008年07期
4 陈耿,朱玉全,杨鹤标,陆介平,宋余庆,孙志挥;关联规则挖掘中若干关键技术的研究[J];计算机研究与发展;2005年10期
中国硕士学位论文全文数据库 前1条
1 马莉;极大布尔关联规则生成算法的研究[D];河南大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 贾丽波;姜晓明;叶青;陈占芳;;一种基于倒排索引的频繁项集挖掘方法[J];长春理工大学学报(自然科学版);2019年02期
2 李广璞;黄妙华;;频繁项集挖掘的研究进展及主流方法[J];计算机科学;2018年S2期
3 陈凤娟;;不确定数据中的代表频繁项集近似挖掘[J];计算机与数字工程;2017年02期
4 阚宝朋;崔利;;基于渐近取样的频繁项集挖掘近似算法[J];控制工程;2017年09期
5 李挥剑;;大数据环境下频繁项集挖掘的研究[J];青岛科技大学学报(自然科学版);2015年02期
6 陈小玉;杨艳燕;刘克成;朱颢东;;基于改进倒排表和集合的最频繁项集挖掘算法[J];计算机应用研究;2012年06期
7 刘群;贾泂;;一种分布式全局频繁项集挖掘方法[J];计算机工程与应用;2011年29期
8 陈瑶;桂峰;卢超;王华;;基于频繁项集挖掘算法的伴随车应用与实现[J];计算机应用与软件;2017年04期
9 翟悦;郭杨;王玉姣;;一种利用差集的加权频繁项集挖掘算法[J];辽宁工程技术大学学报(自然科学版);2016年03期
10 黄红星;;挖掘完全频繁项集的蚁群算法[J];微电子学与计算机;2014年12期
中国重要会议论文全文数据库 前10条
1 程祥;肖恪;唐朋;苏森;;一种两阶段的满足差分隐私的频繁项集挖掘算法[A];2016年全国通信软件学术会议程序册与交流文集[C];2016年
2 杨晓明;王晨;汪卫;张守志;施伯乐;;频繁项集的精简表达与还原问题研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 李坤;王永炎;王宏安;;一种基于乐观裁剪策略的挖掘数据流滑动窗口上闭合频繁项集的算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
4 王洪利;冯玉强;;频繁项集挖掘算法Apriori的改进研究[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
5 陈晓云;李龙杰;马志新;白伸伸;王磊;;AFP-Miner:一种新高效的频繁项集挖掘算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
6 李彤岩;李兴明;;基于分布式关联规则挖掘的告警相关性研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(下册)[C];2007年
7 李栋;史晓东;;对搜索引擎中倒排索引更新策略的研究和改进[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
8 黄崇争;李海峰;陈红;;数据流上近似非可导项集的挖掘算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
9 谢志军;陈红;;EFIM——数据流上频繁项集挖掘的高性能算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 于海波;姜锴;;数据挖掘在银行交叉销售中的应用研究[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 屈俊峰;频繁项集与高可用项集挖掘算法及其性能研究[D];武汉大学;2013年
2 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年
3 贾彩燕;关联规则挖掘的取样复杂性分析[D];中国科学院研究生院(计算技术研究所);2004年
4 郑晓艳;频繁模式挖掘技术研究及其在供应链管理中的应用[D];天津大学;2010年
5 孙崇敬;面向属性与关系的隐私保护数据挖掘理论研究[D];电子科技大学;2014年
6 夏炎;大规模图像数据中相似图像的快速搜索[D];中国科学技术大学;2015年
7 谭军;面向产品持续质量控制的数据挖掘技术与应用研究[D];中南大学;2013年
8 陈湘;基于基集和概念格的数据挖掘方法研究[D];电子科技大学;2011年
9 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
10 董杰;基于位表的关联规则挖掘及关联分类研究[D];大连理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 赵娟;一种基于矩阵的并行频繁项集挖掘算法研究与实现[D];兰州大学;2011年
2 王洪波;基于矩阵的频繁项集挖掘算法研究[D];兰州大学;2007年
3 马强;基于Hadoop云平台的频繁项集算法的研究与实现[D];湖南大学;2014年
4 王杰;数据智能分析及其应用研究[D];江南大学;2019年
5 何镇宏;并行频繁项集挖掘算法研究[D];四川师范大学;2018年
6 牛晨晨;数据流频繁项集挖掘算法研究[D];兰州财经大学;2018年
7 杜斐阳;基于Spark的并行频繁项集挖掘算法研究及应用[D];华中师范大学;2018年
8 夏儒斐;基于频繁项集关联的海量中文文本聚类系统及其在Spark平台的实现[D];华南理工大学;2018年
9 梅建强;析取空间中频繁项集精简表示模型研究[D];合肥工业大学;2018年
10 陈龙;支持差分隐私的频繁项集挖掘算法研究[D];华中科技大学;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026