最新文章

推荐文章

热门文章

您的当前位置:寡趣症 > 临床体现 > 单分子长读长测序在基因表达研究中的应用

单分子长读长测序在基因表达研究中的应用



基因组是一个复杂的复合物,其中包含了多种重复序列,拷贝数变化,结构变异。这些与进化,适应以及疾病密切相关。然而,许多复合物元件由于过长,导致短读长测序并不能够完美的对其进行测序。长读长测序的reads可以达到几千个碱基,这使得可以对大的结构进行功能解析。此类的长读长测序产生的单一长序列可以跨越复合物或者重复序列。长读长测序在转录组测序过程中也大有益处,因为长读长的reads可以跨越完整的mRNA的转录本而不需要拼接。这可以使得研究人员可以鉴定到更多的基因亚型等。

最近,人们开发出了两种长读长测序的实验方案,分别是:单分子实时测序(single-moleculereal-timesequencing)以及依赖于已有短读长技术体外构建长读长的合成法。单分子法与短读长测序完全不同,因为单分子法不需要对模板进行扩增来产生足够测序仪读取的信号,也不需要轮番添加dNTP。而合成法并非产生原始的长读长的reads,而是通过利用barcodes来进行拼接获得长片段。

单分子长读长测序(PacBioRSII)介绍

最近这段时间,在科研领域最常用的长读长测序法平台就是使用PacBioBiosciences(PacBio)的单分子实时测序法(single-moleculereal-timesequencing,SMRT)。该设备使用了一个特制的流动单元,其中包含了成千上万的单独的底部透明的皮升孔(picolitrewells)——zero-modewaveguides(ZMW)。短读长SBS技术需要使得聚合酶结合DNA,沿着DNA进行扩增,而PacBio则固定聚合酶在空的底部,让DNA链通过ZMW。由于有聚合酶有固定的位置,因此该系统可以对单分子DNA进行测序。dNTP结合在每个孔的单分子模板上,通过激光或者成像设备记录ZMW底部标记在核糖核酸上的发射波长的颜色与持续时间来进行序列的读取。聚合酶在结合dNTPs的过程中,切割dNTP结合的荧光基团,使得荧光基团在第二个标记的碱基进入ZMW前将前一个荧光基团去除。SMRT平台也使用了独特的环状模板,这种方式的模板可以使得聚合酶反复读取模板的序列。尽管这种方法不太容易对长度大于3kb的片段反复读取,但是短的模板却可以反复读取多次。由于多次读取同一序列,因此系统会产生多次测序后的保守序列(consensussequence,CCS)。

该设备可以产生超过50kb长度的单个read,长链建库测序平均长度为10-15kb。这种特性使得在基因组拼接与大范围基因组结构的应用中大有好处。但是,长链的单个碱基错误率在15%左右,使得人们对该仪器的使用有所顾虑。不幸的是,这些错误随机分布每个reads,也因此必须有足够高的覆盖度来消除单个碱基错误率的负面影响。PacBio的环状模板有时候也会出现错误。单个碱基测序次数越多,结果就越可靠,其最高准确率达到99.%。其高准确率与Sanger测序相似,使得该方法与Sanger测序一道成为SNPs的研究方法。该设备的运行时间与通量受测序读长的影响,长的模板需要更长的时间。举例来说,1kb的库运行1小时测序每个分子可以产生个碱基,平均大约重复8次;而运行4小时每个分子可以产生大约个碱基(大约重复30次)。相反的是,10kb的库运行4小时产生个碱基只能重复3次左右。通量的限制以及高企的成本(美元/G),加上较高的覆盖度使得PacBioRSII成为那些较小的实验室难以应用的技术。考虑到这些问题,PacBio推出了Sequel系统,其通量与RSII相比高出了7倍,使得30×覆盖度的人类基因组测序成本大幅下降一半。

PacBioRSII在基因表达研究中的应用

PacBioRSII由于其相对于Illumina为代表的短读长测序而言,在序列拼接,对高GC含量片段扩增方面以及甲基化位点检测有着较大的优势,因此PacBioRSII在基因组测序过程中有着较多的应用。然而,相对而言,在基因表达研究领域,由于Illumina平台的高通量以及技术应用较为成熟,PacBioRSII在该领域的研究较为有限。

6月24日,国际著名学术期刊NatureCommunications(自然通讯)杂志同时在线发表了利用PacBioRSII对玉米和高粱中的转录本进行高通量测序的研究论文,分别名为:“Unveilingthe







































全国治白癜风最好医院
北京哪家医院能治好白癜风


转载请注明:http://www.qzhgr.com/lctx/11109.html