收藏本站
《软件学报》 2015年11期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

带间隔约束的Top-k对比序列模式挖掘

杨皓  段磊  胡斌  邓松  王文韬  秦攀  
【摘要】:对比序列模式能够表达序列数据集合间的差异,在商品推荐、用户行为分析和电力供应预测等领域有广泛的应用.已有的对比序列模式挖掘算法需要用户设定正例支持度阈值和负例支持度阈值.在不具备足够先验知识的情况下,用户难以设定恰当的支持度阈值,从而可能错失一些对比显著的模式.为此,提出了带间隔约束的top-k对比序列模式挖掘算法k DSP-Miner(top-k distinguishing sequential patterns with gap constraint miner).k DSP-Miner中用户只需设置期望发现的对比最显著的模式个数,从而避免了直接设置对比支持度阈值.相应地,挖掘算法更容易使用,并且结果更易于解释.同时,为了提高算法执行效率,设计了若干剪枝策略和启发策略.进一步设计了k DSP-Miner的多线程版本,以提高其对高维序列元素情况的处理能力.通过在真实世界数据集上的详实实验,验证了算法的有效性和执行效率.

【共引文献】
中国期刊全文数据库 前10条
1 马帅,唐世渭,杨冬青,王腾蛟,高军;移动环境中的最大移动序列模式挖掘(英文)[J];北京大学学报(自然科学版);2004年03期
2 黄金;;基于频繁模式的蛋白质序列分类[J];东北农业大学学报;2008年05期
3 任家东;宗俊省;;一种基于规则表达式约束的序列模式增量式挖掘算法[J];燕山大学学报;2007年05期
4 任家东;周晓磊;;一种挖掘序列模式的增量式更新算法[J];燕山大学学报;2007年06期
5 龚振志;胡孔法;达庆利;张长海;;DMGSP:一种快速分布式全局序列模式挖掘算法[J];东南大学学报(自然科学版);2007年04期
6 胡孔法;张长海;陈崚;达庆利;;一种面向物流数据分析的路径序列挖掘算法ImGSP[J];东南大学学报(自然科学版);2008年06期
7 陈景强;翁正秋;;一种基于投影数据库的SPAM算法[J];电脑知识与技术;2010年07期
8 柴思跃;苏奋振;周成虎;;基于周期表的时空关联规则挖掘方法与实验[J];地球信息科学学报;2011年04期
9 殷脂;殷卫红;;DNA序列数据分析技术综述[J];上海电力学院学报;2011年04期
10 张长海;胡孔法;陈崚;宋爱波;;一种高效的基于位图序列模式挖掘算法[J];高技术通讯;2010年02期
中国重要会议论文全文数据库 前10条
1 姚伟力;王锡禄;宋俊德;;基于序列模式挖掘的告警相关性分析算法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
2 潘瑾;严勇;王晨;方晨;汪卫;施伯乐;;Chopper:一个高效的有序标号树频繁结构的挖掘算法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
3 吴先荣;杨冬青;唐世渭;王腾蛟;;基于序列树的告警相关性分析[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 吕静;陈未如;刘俊;Osei Adjei;;并发分支模式挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 吴铁峰;彭宏;张东娜;;一种网络告警的增量挖掘算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 朱永泰;王晨;洪铭胜;汪卫;施伯乐;;ESPM——频繁子树挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 牛兴雯;杨冬青;唐世渭;王腾蛟;;OSAF-tree——可迭代的移动序列模式挖掘及增量更新方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
8 程银波;司菁菁;;带有间隔约束的序列模式挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
9 张锐;熊赟;陈越;朱扬勇;;MS-BioSM:一个基于多支持度生物序列模式挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
10 郭黎敏;丁治明;胡泽林;陈超;;基于路网的不确定性轨迹预测[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年
2 朱辉生;基于情节规则匹配的数据流预测研究[D];复旦大学;2011年
3 林冠洲;网络流量识别关键技术研究[D];北京邮电大学;2011年
4 刘维;生物序列模式挖掘与识别算法的研究[D];南京航空航天大学;2010年
5 杨钤雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大学;2010年
6 滕广青;基于概念格的数字图书馆知识组织研究[D];吉林大学;2012年
7 佘春东;数据挖掘算法分析及其并行模式研究[D];电子科技大学;2004年
8 马海兵;频繁模式挖掘相关技术研究[D];复旦大学;2005年
9 宋世杰;基于序列模式挖掘的误用入侵检测系统及其关键技术研究[D];国防科学技术大学;2005年
10 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年
2 陈晶;基于序列模式挖掘算法的入侵检测研究[D];华东师范大学;2011年
3 白霜;DNA序列的最大频繁模式挖掘[D];南昌大学;2010年
4 徐海兰;Web日志挖掘技术在个性化信息推荐中的应用[D];延边大学;2009年
5 严兆斌;序列模式挖掘在公路隧道交通中的应用研究[D];西安电子科技大学;2009年
6 李瑞华;数据挖掘在煤矿安全监测中的应用[D];西安电子科技大学;2010年
7 高磊;大规模铝电解日报数据中序列模式挖掘及其规则提取的研究[D];北方工业大学;2011年
8 董严冰;旅游信息数据挖掘和流量模型的研究[D];北方工业大学;2011年
9 翁玉霞;局域网环境下智能考试系统的设计与实现[D];河北科技大学;2010年
10 赵炎;频繁子树优化查询策略[D];吉林大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 龚惠群,黄超,彭江平;具有双时间维约束的股票序列模式挖掘[J];计算机工程;2003年20期
2 许兆新,郝燕玲;约束在序列模式挖掘中的应用研究[J];计算机工程与应用;2004年05期
3 马帅,唐世渭,杨冬青,王腾蛟,高军;移动环境中的最大移动序列模式挖掘(英文)[J];北京大学学报(自然科学版);2004年03期
4 孙晓冬;一种基于χ~2测试的序列模式挖掘算法[J];辽宁大学学报(自然科学版);2004年02期
5 祝效普,梁洪峻;序列模式挖掘在网络业务流分析中的应用[J];计算机应用;2004年08期
6 管恩政,周春光,王喆,徐秀娟;频繁序列模式挖掘算法[J];吉林大学学报(信息科学版);2005年03期
7 夏明波;王晓川;孙永强;金士尧;;序列模式挖掘算法研究[J];计算机技术与发展;2006年04期
8 姜晚云;胡学钢;;序列模式挖掘及其算法的研究[J];科技经济市场;2006年01期
9 孙蕾;朱玉全;;频繁序列模式挖掘中关键技术的研究[J];计算机工程;2006年11期
10 任家东;宗俊省;李志国;;一种实现偏序约束条件下的序列模式挖掘算法[J];计算机工程与科学;2007年05期
中国重要会议论文全文数据库 前10条
1 吕静;陈未如;刘俊;Osei Adjei;;并发分支模式挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 端义锋;胡谷雨;丁力;;序列模式挖掘在网络告警分析中的应用[A];2004年全国通信软件学术会议论文集[C];2004年
3 朱辉生;李存华;;序列模式挖掘的研究与实现[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 程银波;司菁菁;;带有间隔约束的序列模式挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
5 李润恒;贾焰;金鑫;;一种面向网络安全的序列模式挖掘方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 李晟;姜青山;郭顺;王备战;;一种优化的蛋白质序列模式挖掘方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
7 姚伟力;王锡禄;宋俊德;;基于序列模式挖掘的告警相关性分析算法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
8 任家东;解玉洁;何海涛;张爱国;;基于改进前缀树PStree的最大序列模式挖掘[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
9 牛兴雯;杨冬青;唐世渭;王腾蛟;;OSAF-tree——可迭代的移动序列模式挖掘及增量更新方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
10 张锐;熊赟;陈越;朱扬勇;;MS-BioSM:一个基于多支持度生物序列模式挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
中国博士学位论文全文数据库 前7条
1 金阳;基于概念格模型的序列模式挖掘算法研究[D];吉林大学;2007年
2 谢飞;带有通配符的序列模式挖掘研究[D];合肥工业大学;2011年
3 熊赟;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
4 杨钤雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大学;2010年
5 陆介平;描述性规则挖掘若干关键技术研究[D];东南大学;2006年
6 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年
7 徐前方;基于数据挖掘的网络故障告警相关性研究[D];北京邮电大学;2007年
中国硕士学位论文全文数据库 前10条
1 张长海;分布式序列模式挖掘算法研究[D];扬州大学;2008年
2 陈晓;基于模糊集的序列模式挖掘研究[D];天津大学;2007年
3 俞单庆;序列模式挖掘及其在入侵检测中的应用研究[D];南京师范大学;2008年
4 姜海辉;并行序列模式挖掘关键问题研究[D];合肥工业大学;2009年
5 刘磊;基于序列模式挖掘的入侵检测算法的研究[D];中国科学技术大学;2009年
6 吴永俊;序列模式挖掘研究[D];安徽大学;2010年
7 陈晶;基于序列模式挖掘算法的入侵检测研究[D];华东师范大学;2011年
8 赵鲁麟;负序列模式挖掘技术的研究[D];山东轻工业学院;2011年
9 董圆;基于前缀树的并行序列模式挖掘算法研究[D];燕山大学;2011年
10 宗俊省;基于约束的序列模式挖掘算法的研究[D];燕山大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026