收藏本站
《长春理工大学学报(自然科学版)》 2019年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于倒排索引的频繁项集挖掘方法

贾丽波  姜晓明  叶青  陈占芳  
【摘要】:针对频繁项集挖掘算法中多次扫描数据库、生成大量无效频繁项集的问题,提出一种基于倒排索引和二维数组的挖掘算法。通过一次扫描数据库建立包含事务的倒排索引,解决多次扫描数据库的问题。在二维数组存储候选频繁项集时,引入标志位约束,避免产生大量无效的频繁项集。与其他算法在不同规模的数据集上进行性能比较,发现算法在数据集超过25万时执行效率优于其他算法。通过实验验证了所提出算法的高效性和可行性。

知网文化
【相似文献】
中国期刊全文数据库 前19条
1 贾丽波;姜晓明;叶青;陈占芳;;一种基于倒排索引的频繁项集挖掘方法[J];长春理工大学学报(自然科学版);2019年02期
2 李广璞;黄妙华;;频繁项集挖掘的研究进展及主流方法[J];计算机科学;2018年S2期
3 陈凤娟;;不确定数据中的代表频繁项集近似挖掘[J];计算机与数字工程;2017年02期
4 阚宝朋;崔利;;基于渐近取样的频繁项集挖掘近似算法[J];控制工程;2017年09期
5 李挥剑;;大数据环境下频繁项集挖掘的研究[J];青岛科技大学学报(自然科学版);2015年02期
6 陈小玉;杨艳燕;刘克成;朱颢东;;基于改进倒排表和集合的最频繁项集挖掘算法[J];计算机应用研究;2012年06期
7 刘群;贾泂;;一种分布式全局频繁项集挖掘方法[J];计算机工程与应用;2011年29期
8 陈瑶;桂峰;卢超;王华;;基于频繁项集挖掘算法的伴随车应用与实现[J];计算机应用与软件;2017年04期
9 翟悦;郭杨;王玉姣;;一种利用差集的加权频繁项集挖掘算法[J];辽宁工程技术大学学报(自然科学版);2016年03期
10 黄红星;;挖掘完全频繁项集的蚁群算法[J];微电子学与计算机;2014年12期
11 黄朝辉;;不确定数据频繁项集挖掘方法探析[J];莆田学院学报;2014年02期
12 吴建章;韩立新;曾晓勤;;一种基于多核微机的闭频繁项集挖掘算法[J];计算机应用与软件;2013年03期
13 董祥军;马亮;;一种有效的负频繁项集挖掘方法[J];山东轻工业学院学报(自然科学版);2011年04期
14 王艳;薛海燕;李玲玲;孙新德;;一种改进的加权频繁项集挖掘算法[J];计算机工程与应用;2010年23期
15 柳景超;耿伯英;宋胜锋;;入侵检测中加权频繁项集挖掘[J];计算机工程与设计;2008年08期
16 李广原;雷鸿;龙珑;;一种新的动态频繁项集挖掘方法[J];计算机工程与应用;2008年21期
17 蔡进;薛永生;张东站;;基于分区分类法快速更新频繁项集[J];计算机工程与应用;2007年09期
18 眭俊明;姜远;周志华;;基于频繁项集挖掘的贝叶斯分类算法[J];计算机研究与发展;2007年08期
19 李刚;董祥军;;多支持度在非频繁项集挖掘中的研究[J];山东轻工业学院学报(自然科学版);2007年03期
中国重要会议论文全文数据库 前10条
1 程祥;肖恪;唐朋;苏森;;一种两阶段的满足差分隐私的频繁项集挖掘算法[A];2016年全国通信软件学术会议程序册与交流文集[C];2016年
2 杨晓明;王晨;汪卫;张守志;施伯乐;;频繁项集的精简表达与还原问题研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 李坤;王永炎;王宏安;;一种基于乐观裁剪策略的挖掘数据流滑动窗口上闭合频繁项集的算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
4 王洪利;冯玉强;;频繁项集挖掘算法Apriori的改进研究[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
5 陈晓云;李龙杰;马志新;白伸伸;王磊;;AFP-Miner:一种新高效的频繁项集挖掘算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
6 李彤岩;李兴明;;基于分布式关联规则挖掘的告警相关性研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(下册)[C];2007年
7 李栋;史晓东;;对搜索引擎中倒排索引更新策略的研究和改进[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
8 黄崇争;李海峰;陈红;;数据流上近似非可导项集的挖掘算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
9 谢志军;陈红;;EFIM——数据流上频繁项集挖掘的高性能算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 于海波;姜锴;;数据挖掘在银行交叉销售中的应用研究[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 屈俊峰;频繁项集与高可用项集挖掘算法及其性能研究[D];武汉大学;2013年
2 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年
3 贾彩燕;关联规则挖掘的取样复杂性分析[D];中国科学院研究生院(计算技术研究所);2004年
4 郑晓艳;频繁模式挖掘技术研究及其在供应链管理中的应用[D];天津大学;2010年
5 孙崇敬;面向属性与关系的隐私保护数据挖掘理论研究[D];电子科技大学;2014年
6 夏炎;大规模图像数据中相似图像的快速搜索[D];中国科学技术大学;2015年
7 谭军;面向产品持续质量控制的数据挖掘技术与应用研究[D];中南大学;2013年
8 陈湘;基于基集和概念格的数据挖掘方法研究[D];电子科技大学;2011年
9 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
10 董杰;基于位表的关联规则挖掘及关联分类研究[D];大连理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 赵娟;一种基于矩阵的并行频繁项集挖掘算法研究与实现[D];兰州大学;2011年
2 王洪波;基于矩阵的频繁项集挖掘算法研究[D];兰州大学;2007年
3 马强;基于Hadoop云平台的频繁项集算法的研究与实现[D];湖南大学;2014年
4 王杰;数据智能分析及其应用研究[D];江南大学;2019年
5 何镇宏;并行频繁项集挖掘算法研究[D];四川师范大学;2018年
6 牛晨晨;数据流频繁项集挖掘算法研究[D];兰州财经大学;2018年
7 杜斐阳;基于Spark的并行频繁项集挖掘算法研究及应用[D];华中师范大学;2018年
8 夏儒斐;基于频繁项集关联的海量中文文本聚类系统及其在Spark平台的实现[D];华南理工大学;2018年
9 梅建强;析取空间中频繁项集精简表示模型研究[D];合肥工业大学;2018年
10 陈龙;支持差分隐私的频繁项集挖掘算法研究[D];华中科技大学;2017年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978