收藏本站
《科学通报》 2010年14期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于二次打断IPed DNA片段ChIP-Seq的模拟分析

王薇  施小龙  陆祖宏  
【摘要】:ChIP-Seq是在全基因组水平上研究活体细胞中蛋白质和DNA相互作用谱的有效手段.近年来,随着高通量短序列DNA测序技术的快速发展,研究基于新一代DNA测序方法的ChIP-Seq分析算法已经成为热点之一.然而,目前报道的分析方法主要是基于对免疫共沉淀获得的DNA片段进行片段大小选择后的ChIP-Seq数据,也就是主要针对Solexa系统获得的数据进行分析的算法.SOLiD系统是目前测序通量最高的新一代DNA测序系统.在SOLiD系统的DNA测序文库制备过程中,采用对免疫共沉淀获得的DNA片段进行二次超声打断可以满足ePCR对序列长度的要求,因此SOLiD测序文库中的DNA测序片段较短.到目前为止,基于SOLiD系统测序特点的ChIP-Seq研究很少报道.本文旨在研究测序文库中DNA片段的长度对ChIP-Seq分析的影响.通过真实的ChIP-seq数据和模拟产生的ChIP-Seq数据,对目前3种主要的ChIP-Seq分析方法(CisGenome,SISSRs以及MACS)的特点进行研究.有报道表明来自Solexa系统的ChIP-Seq数据局部有明显的正负链双峰特征,而通过对真实的来自SOLiD系统的ChIP-Seq数据特征的挖掘,我们发现单个峰局部无明显的正负链双峰特征,并且峰的局部的序列分布大部分符合正态分布.基于这些特征,我们模拟了两个不同测序平台的ChIP-Seq实验.在控制了模拟实验的可比性后,我们发现当前基于Solexa文库制备方案的ChIP-Seq数据发展的算法,并不能有效地捕获来自SOLiD系统的ChIP-Seq数据特征.我们的研究还表明,误用ChIP-seq软件可能是导致部分SOLiD的ChIP-seq实验失败的原因.因此,需要开发一种新的基于二次打断IPedDNA片段的ChIP-Seq分析策略.

知网文化
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978