收藏本站
《计算机研究与发展》 2007年07期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

ProFaM:一个蛋白质序列家族挖掘算法

熊赟  陈越  朱扬勇  
【摘要】:有效分析蛋白质家族是生物信息学的一项重要挑战,聚类成为解决这一问题的主要途径之一.基于传统序列比对方法定义蛋白质序列间相似关系时,假设了同源片断间的邻接保守性,与遗传重组相冲突.为更好地识别蛋白质家族,提出了一种蛋白质序列家族挖掘算法ProFaM.ProFaM首先采用前缀投影策略挖掘表征蛋白质序列的模式,然后基于模式及其权重信息构造相似度度量函数,并采用共享最近邻方法,实现了蛋白质序列家族聚类.解决了以往方法在蛋白质模式挖掘及相似度设计中的不足.在蛋白质家族数据库Pfam上的实验结果证实了ProFaM算法在蛋白质家族分析上有良好的结果.

【引证文献】
中国期刊全文数据库 前1条
1 梁欢;;网格中基于结构分类和位矩阵编码并行遗传算法的蛋白质二级结构预测[J];科学技术与工程;2008年05期
中国硕士学位论文全文数据库 前3条
1 周强;转录调控序列数据挖掘研究与实现[D];复旦大学;2008年
2 张冬梅;基于轮廓系数的层次聚类算法研究[D];燕山大学;2010年
3 姚瑞霞;基于网格的高维数据流与序列数据聚类算法研究[D];燕山大学;2010年
【参考文献】
中国期刊全文数据库 前2条
1 季星来,孙之荣;基于结构的丝氨酸蛋白酶超家族进化分析[J];电子学报;2001年S1期
2 符维娟,汪源源,卢大儒;无比对的生物分子序列比较方法[J];生物医学工程学杂志;2005年03期
【共引文献】
中国期刊全文数据库 前10条
1 马帅,唐世渭,杨冬青,王腾蛟,高军;移动环境中的最大移动序列模式挖掘(英文)[J];北京大学学报(自然科学版);2004年03期
2 黄金;;基于频繁模式的蛋白质序列分类[J];东北农业大学学报;2008年05期
3 任家东;宗俊省;;一种基于规则表达式约束的序列模式增量式挖掘算法[J];燕山大学学报;2007年05期
4 任家东;周晓磊;;一种挖掘序列模式的增量式更新算法[J];燕山大学学报;2007年06期
5 龚振志;胡孔法;达庆利;张长海;;DMGSP:一种快速分布式全局序列模式挖掘算法[J];东南大学学报(自然科学版);2007年04期
6 胡孔法;张长海;陈崚;达庆利;;一种面向物流数据分析的路径序列挖掘算法ImGSP[J];东南大学学报(自然科学版);2008年06期
7 陈景强;翁正秋;;一种基于投影数据库的SPAM算法[J];电脑知识与技术;2010年07期
8 汪世华;王文勇;黄益洲;林琳;沙莉;;丝氨酸蛋白酶研究进展[J];福建农业学报;2007年04期
9 张长海;胡孔法;陈崚;宋爱波;;一种高效的基于位图序列模式挖掘算法[J];高技术通讯;2010年02期
10 柴思跃;苏奋振;周成虎;;基于周期表的时空关联规则挖掘方法与实验[J];地球信息科学学报;2011年04期
中国重要会议论文全文数据库 前10条
1 姚伟力;王锡禄;宋俊德;;基于序列模式挖掘的告警相关性分析算法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
2 ;SWSPMiner:Efficient Mining of Weighted Sequential Patterns from Traversals on Weighted Directed Graph Using Statistical Theory[A];Proceedings of 2008 International Symposium on Distributed Computing and Applications for Business Engineering and Science Volume Ⅰ[C];2008年
3 Samuel W.K.Chan;;KNOWLEDGE DISCOVERY FROM FINANCIAL TEXT[A];Proceedings of the Ninth International Conference on Electronic Business[C];2009年
4 吕静;陈未如;刘俊;Osei Adjei;;并发分支模式挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 吴铁峰;彭宏;张东娜;;一种网络告警的增量挖掘算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 朱永泰;王晨;洪铭胜;汪卫;施伯乐;;ESPM——频繁子树挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 程银波;司菁菁;;带有间隔约束的序列模式挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
8 张锐;熊赟;陈越;朱扬勇;;MS-BioSM:一个基于多支持度生物序列模式挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
9 郭黎敏;丁治明;胡泽林;陈超;;基于路网的不确定性轨迹预测[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
10 童咏昕;张媛媛;袁玫;马世龙;于丹;赵莉;;一种挖掘压缩序列模式的有效算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 佘春东;数据挖掘算法分析及其并行模式研究[D];电子科技大学;2004年
2 马海兵;频繁模式挖掘相关技术研究[D];复旦大学;2005年
3 宋世杰;基于序列模式挖掘的误用入侵检测系统及其关键技术研究[D];国防科学技术大学;2005年
4 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
5 孙立新;蚊抗药性相关基因NYD-Tr和NYD-Ch蛋白表达及其对溴氰菊酯代谢的研究[D];南京医科大学;2006年
6 陆介平;描述性规则挖掘若干关键技术研究[D];东南大学;2006年
7 陈金波;面向电信CRM的数据挖掘应用研究[D];东南大学;2006年
8 何丽;基于Web挖掘的决策支持系统模型研究[D];天津大学;2005年
9 杜奕;时间序列挖掘相关算法研究及应用[D];中国科学技术大学;2007年
10 王金龙;全局和局部相结合的数据挖掘方法及应用研究[D];浙江大学;2007年
中国硕士学位论文全文数据库 前10条
1 马健;刺参再生相关基因的序列分析与表达[D];辽宁师范大学;2010年
2 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年
3 陈晶;基于序列模式挖掘算法的入侵检测研究[D];华东师范大学;2011年
4 杨天霞;基于序列模式的序列聚类挖掘算法研究[D];西北师范大学;2010年
5 李素珍;基于卷积算法的时间序列部分周期模式挖掘算法研究[D];天津大学;2010年
6 颜一鸣;频繁子树挖掘在XML挖掘中的应用[D];湖南大学;2009年
7 沈波;淡色库蚊抗性相关糜蛋白酶基因克隆及初步功能鉴定[D];南京医科大学;2002年
8 冯志新;基于FP-树的最大频繁模式挖掘算法研究[D];广西大学;2003年
9 聂成林;数据库中序列模式发现的研究[D];合肥工业大学;2003年
10 杨明夏;抗药性相关NYD-Ch和NYD-Tr基因表达与初步鉴定[D];南京医科大学;2003年
【同被引文献】
中国期刊全文数据库 前10条
1 周晓云;孙志挥;张柏礼;杨宜东;;高维数据流聚类及其演化分析研究[J];计算机研究与发展;2006年11期
2 金义富;朱庆生;邢永康;;一种基于关键域子空间的离群数据聚类算法[J];计算机研究与发展;2007年04期
3 孙玉芬;卢炎生;;流数据挖掘综述[J];计算机科学;2007年01期
4 孙玉芬;卢炎生;;一种基于网格方法的高维数据流子空间聚类算法[J];计算机科学;2007年04期
5 曹扬;罗予频;杨士元;;子空间搜索广义主成分分析[J];计算机学报;2007年12期
6 孙萍;蒋昌俊;;利用服务聚类优化面向过程模型的语义Web服务发现[J];计算机学报;2008年08期
7 张海霞,唐焕文,张立震,靳利霞,唐一源;蛋白质二级结构预测方法的评价[J];计算机与应用化学;2003年06期
8 何婷婷;戴文华;焦翠珍;;基于混合并行遗传算法的文本聚类研究[J];中文信息学报;2007年04期
9 金澈清,钱卫宁,周傲英;流数据分析与管理综述[J];软件学报;2004年08期
10 朱蔚恒;印鉴;谢益煌;;基于数据流的任意形状聚类算法[J];软件学报;2006年03期
【二级引证文献】
中国期刊全文数据库 前2条
1 孟翔燕;孟军;葛家麒;;基于遗传算法的蛋白质二级结构预测方法研究进展[J];农机化研究;2009年05期
2 李昕;马利;王金甲;赵春;;特征选择(FS)算法在生物信息学中的应用[J];生物医学工程学杂志;2011年02期
【相似文献】
中国期刊全文数据库 前10条
1 熊赟;陈越;朱扬勇;;ProFaM:一个蛋白质序列家族挖掘算法[J];计算机研究与发展;2007年07期
2 马帅,唐世渭,杨冬青,王腾蛟,高军;移动环境中的最大移动序列模式挖掘(英文)[J];北京大学学报(自然科学版);2004年03期
3 李永忠;孙彦;罗军生;;WINEPI挖掘算法在入侵检测中的应用[J];计算机工程;2006年23期
4 刘俊侠;;使用有向图挖掘时间间隔序列模式[J];计算机科学与探索;2008年06期
5 黄小红;陈丽华;王倩;戴昕;;多属性约束事件序列的关联规则挖掘方法[J];微计算机信息;2009年03期
6 师鸣若;;基于邻接序列模式挖掘的网络流量分析[J];电脑开发与应用;2010年10期
7 汪永旗;张军;;序列模式挖掘在旅游行程分析中的应用研究[J];微计算机信息;2011年03期
8 柳朝阳;用聚类回归模型预测粮食产量[J];计算机应用;1988年06期
9 阎辉,张学工,李衍达;基于核函数的最大间隔聚类算法[J];清华大学学报(自然科学版);2002年01期
10 颜雪松,蔡之华;一种快速聚类高维数据的算法研究[J];计算机工程;2003年01期
中国重要会议论文全文数据库 前10条
1 武森;金海燕;高学东;;数据挖掘中CABOSFV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
2 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
3 穆向禹;浦剑涛;张树武;徐波;;基于状态子空间聚类的多层MLLR自适应算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 饶鲜;李斌;杨绍全;;用核聚类法进行异常检测[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
5 杨广林;赵云峰;王书理;;Gabor滤波器及其在图像特征提取方面的优化算法[A];2005年中国智能自动化会议论文集[C];2005年
6 冯又层;蔡勖;;基于自组织特征映射的证券市场聚类[A];第二届全国复杂动态网络学术论坛论文集[C];2005年
7 张刚;刘悦;;基于查询空间的分布式文档集合划分算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 文健;李舟军;;基于聚类语言模型的生物文献检索技术研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 高阳;赵瑞娜;赵志强;阿杉;;基于自组织特征映射网络的全国地级市城市地价区域分类研究[A];地理学与生态文明建设——中国地理学会2008年学术年会论文摘要集[C];2008年
10 刘哲;唐雁;陈强;;三维模型有意义分割技术现状及应用[A];2008年计算机应用技术交流会论文集[C];2008年
中国重要报纸全文数据库 前10条
1 王云鹤 熊立;武汉电信直销中心剑指聚类市场[N];人民邮电;2009年
2 记者 肖卓;聚类市场:想挖金矿不容易[N];人民邮电;2009年
3 张秋;突破聚类市场的信息化盲区[N];中国计算机报;2007年
4 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
5 符信;30个指标评价社会发展水平[N];南方日报;2005年
6 记者 李远治 通讯员 邹超 敖翔;重庆号百传媒探索聚类市场新模式[N];人民邮电;2009年
7 本报记者 薛海滨;四大概念技术秀[N];计算机世界;2005年
8 文国艺;补补蛋白质,生命可以更健康……[N];医药经济报;2004年
9 长江期货 韩锦 邹云峰 高华;基于RFM模型的聚类分析算法在期货公司客户分类中的应用[N];期货日报;2008年
10 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 杨钤雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大学;2010年
2 刘维;生物序列模式挖掘与识别算法的研究[D];南京航空航天大学;2010年
3 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
4 兰秋军;金融时间序列隐含模式挖掘方法及其应用研究[D];湖南大学;2005年
5 马赓宇;基于HMM的时间序列聚类与识别[D];清华大学;2004年
6 褚瑞;基于虚拟计算环境的内存资源共享技术研究[D];国防科学技术大学;2007年
7 张伟;基于WWW的聚类引擎研究[D];重庆大学;2003年
8 蔡维玲;基于聚类的图像分割和分类器设计的研究[D];南京航空航天大学;2008年
9 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
10 雷景生;神经网络的分类、聚类功能及其规则抽取研究[D];新疆大学;2003年
中国硕士学位论文全文数据库 前10条
1 王永强;基于DF2Ls的序列模式挖掘研究[D];兰州大学;2011年
2 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年
3 魏龙;GML时空序列模式挖掘研究[D];江西理工大学;2011年
4 窦赫男;序列模式挖掘在网站可用性分析研究上的应用[D];大连海事大学;2006年
5 祝效普;WEB用户访问序列模式挖掘[D];天津大学;2005年
6 王斌;双层数据流聚类框架的设计与实现[D];吉林大学;2004年
7 梁伟;Web使用挖掘在电子商务推荐系统中的应用研究[D];天津大学;2004年
8 蔡博文;高维数据集中离群数据挖掘方法的研究[D];合肥工业大学;2006年
9 刘晓燕;基于聚类的入侵检测系统研究[D];青岛大学;2006年
10 于世东;多维数据可视化技术的研究及应用[D];沈阳工业大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026