您的当前位置:寡趣症 > 寡趣知识 > 下一代测序NGS技术的发展及在肿瘤研
下一代测序NGS技术的发展及在肿瘤研
来源:分子诊断与治疗杂志
作者:邵向阳、徐伟文
[摘要]下一代测序(next?generationsequencing,NGS)由于高灵敏度、高通量、高度自动化等特性,近年来在疾病的研究和诊断治疗中越来越多地被应用。下一代测序技术的发展为肿瘤分子生物学的研究提供了新的手段。本文就下一代测序技术的种类、特点、发展趋势及其在肿瘤研究中的应用作简要的综述。
随着分子生物学技术的不断发展,人类对生命现象和疾病的研究已经不再局限在单个基因位点,而是将目光集中于全基因组方面。Sanger测序法是科学研究和临床实验室里首选的测序金标准技术,人类基因组计划就是依靠Sanger测序法才得以完成的。随着技术革新,DNA测序技术得到了不断的创新,在保证测序准确度的前提下,逐步优化操作程序,使得测序速度逐渐提高,测序成本也呈下降趋势,下一代测序技术(next?generationsequencing,NGS)就应运而生,并在随后得到突破性进展。《NatureMethods》在年评选的生物领域影响力最大的技术中,NGS技术以高票当选。与Sanger测序技术不同,NGS技术通过反复测序同一区域的DNA片段,达到更高的灵敏度和准确度,同时通量高、自动化程度高,可在短时间内完成对上百亿碱基的测序,使得在几天内完成人类全基因组测序成为可能。也正因为NGS技术的高准确度、高速度以及低成本,对推动分子生物学的发展起到了重要作用,为肿瘤分子生物学的研究提供了新的手段,尤其在肿瘤分子诊断领域更是占有更重要的地位。
1二代测序技术简介及特点
年世界上首台新一代测序仪问世,并且很快就被应用到了如火如荼的分子生物学领域当中。NGS技术,并不是某种单一的技术,而是一个技术群。不同的NGS平台,在其原理上有所不同。基本的原理都是在DNA进行PCR扩增时,借助一些化学标志物在碱基插入DNA链时发出的信号来读取序列信息,信号可以是光信号,也可以是H+流信号(Hionfluxes)。
1.1Roche/
公司开创了边合成边测序的先河,后期又推出了GSFLX系统,主要采用焦磷酸测序(pyrosequencing)原理(图1)
图1测序原理示意图
Figure1Principleofsequencing
GSFLX系统的流程概括起来,就是“一个片段=一个磁珠=一条读长(onefragment=onebead=oneread)”。“一个片段=一个磁珠”是指长度为~bp的DNA片段与接头(3’和5’端具有特异性)连接,带有接头的单链DNA片段构成样本文库,特别设计的DNA捕获磁珠固定单链DNA文库,每一个磁珠只能与一种独特的单链DNA片段结合。随后把结合DNA片段的磁珠和PCR扩增试剂的水溶液注入到矿物油中,形成油包水混合物,这样就形成只包含一个结合DNA片段的磁珠和PCR扩增试剂的微反应器。乳液PCR在各自的微反应器里独立扩增,排除其他污染性和竞争性的影响。每一个片段经扩增后产生几百万个相同的拷贝,乳液混合物被打破后,扩增片段仍结合在磁珠上。“一个磁珠=一条读长”是指将捕获DNA的磁珠放入PTP板中进行测序反应,PTP板只能容纳一个磁珠。将PTP板放在GSFLX中4种碱基依次按照T、A、C、G的顺序循环进入PTP板,每次只进入一个碱基。如果发生碱基配对就会释放一个焦磷酸,这个焦磷酸在ATP硫酸化酶(adenosinetriphosphate?sulfurylase)和荧光素酶的作用下,经反应,最终把荧光素氧化形成氧化荧光素,同时产生光信号,被电荷耦合元件(charge?cou?pleddevice,CCD)光学系统捕捉一个特异的检测峰值,依据峰值即可读出准确的DNA序列信息。每个磁珠都产生一条读长,通过GSFLX系统分析,最后得出样本的DNA序列信息。
焦磷酸测序法的准确率在99%以上。主要错误类型是插入?缺失,而不是替换,是因为相同碱基的连续插入,没有终止原件阻止单个循环的连续插入,相同碱基的长度需从信号强度中推断出来,在这过程就可能产生误差。
1.2Illumina/Solexa
Illumina公司的二代测序仪GenomeAnalyzer最早是由Solexa公司研发的,其核心专利技术是“DNA簇”和“可逆性末端终结(reversibletermina?tor)”。其原理(图2)是:将基因组DNA经超声波打断成几百bp甚至更小的片段;然后进行末端修复补平加碱基A;再加上接头(adapter)制备成文库。将样本文库加入到专利的芯片(flowcell)上,芯片表面种植了通过共价键链接2种与接头互补的寡核苷酸引物。文库经变性变成单链,其一端与芯片一种引物结合固定,另一端随机与附近的另一个寡核苷酸引物互补固定,形成单链桥状结构;并且以周围的寡核苷酸引物为扩增引物,在芯片上进行扩增,形成2条链。双链再次变性成单链,继续上述PCR过程扩增,这就是所谓的桥式PCR扩增。连续重复上述过程,待测DNA数量就会以指数方式增长,形成DNA簇。“可逆性末端终结”是指在测序过程中,使用“可逆终止子”进行边合成边测序。“可逆终止子”是带有荧光标记的脱氧核糖核苷三磷酸(deoxy?ribonucleosidetriphosphate,dNTP),但在3′?羟基端带有可被化学切割的基团,这些基团能够封闭dNTP的3′端黏性,阻止另一个dNTP与之相结合。使得每一步反应只能延伸一个碱基,采集完荧光信号,荧光基团去除,封闭基团被去掉,进行下一步反应,每步收集的荧光信号,对应所检测的序列。如此反复,得出片段的精确序列。
GenomeAnalyzer测序原理采用稳定的可逆终止法边合成边测序技术,该技术使用4种含有末端阻断基团和不同荧光信号的碱基进行模板互补链的合成,不仅确保了测序的高精确性和高顺序性,而且排除了由重复序列和同聚物导致的测序错误。
图2Solexa测序原理示意图
Figure2Principleofsolexasequencing
1.3Life/SOLiD
SOLiD应用连接法测序,同时利用了独特的双碱基编码原理。以连接反应代替了传统的聚合酶连接反应。SOLiD测序在文库构建和PCR扩增方面,与GSFLX系统很类似,都是通过磁珠接头捕获待测DNA片段,然后进行乳液PCR。SOLiD的磁珠只有1μm,比GSFLX系统的磁珠小的多。SOLiD连接反应的底物是长度8bp的特殊单链荧光探针,其3’端第1、2位构成的碱基对是表征探针染料类型的编码区,5’末端被标记4种荧光染料,因此不同的序列组合就被标记上不同的荧光基团。单向SOLiD测序包括5轮测序反应,每轮反应由多个连接反应构成,探针与测序引物相邻近的序列杂交,用颜色判断碱基序列,读取信号。然后通过化学方法在第5和第6位之间切割,把荧光信号淬灭,以进行下个位置的测序。第一次连接反应实际上连接上了5个碱基,通过这种方法,每次测序的位置都相差5位,即第一次测1和2位,第2次测6和7位……在测到末尾后,依次类推,进行第2轮连接反应;由于第2轮测序比第一轮测序往前移动了一个碱基,得到0~1位、5~6位……的荧光信息,5轮反应后,测出全部位置并且每个位置都被检测了2次。
SOLiD测序技术在测序过程利用了独特的双碱基编码原理,能对测序错误进行校正,减少原始数据错误。以连接反应代替了传统的聚合酶连接反应能明显减少因碱基错配而出现的错误,在测序过程中更换引物也能减少背景噪音和错误率。目前SOLiD系统声称其原始碱基数据的准确度大于99.94%,而且SOLiD4系统将再度升级。SOLiD4HQpackage将使每次运行产生GB可定位的序列数据,并带来99.99%的准确率。
1.4IonTorrent测序平台
IonTorrent的核心技术是使用半导体技术在化学和数字信息之间建立直接的联系。Iontorrent的基本原理是:把DNA链固定在半导体芯片的微孔中,随后依次掺入ACGT碱基。随着每个碱基的掺入,释放出氢离子,在它们穿过每个孔
底部时能被检测到,通过对H+的检测,实时判读碱基。具体过程是:将待测DNA片段2端加上IonTorrent测序接头制备成DNA文库。将文库克隆到离子微球颗粒上并进行乳液PCR扩增。将含有扩增模板的离子微球颗粒加入到半导体芯片上,测序时一个个碱基连续流过芯片微孔。如果碱基与特定微孔中的DNA分子互补,则该碱基被合成到DNA分子中,DNA链每延伸一个碱基时,就会释放一个质子(H+),导致局部pH发生变化。离子传感器检测到pH变化后,即刻便从化学信息转变为数字电子信息。如果DNA链含有2个相同的碱基,则记录电压信号是双倍的。如果碱基不匹配,则无H+释放,也就没有电压信号的变化。
IonTorrent测序技术直接检测DNA的合成,因少了CCD扫描、荧光激发等环节,几秒钟就可检测合成插入的碱基,大大缩短了运行时间。通过对H+的检测,明显改善碱基判读准确性,测序成本低;该系统无需光学检测和扫描系统,无需标记荧光染料和化学发光的配套试剂,技术的读长相对较短。但若单个碱基连续重复出现多次,会导致一个循环里产生大量的H+,引起pH值的剧烈变化,导致信号不准确。
1.5华大基因CG测序平台
CG平台拥有2种独特的测序相关技术:DNA纳米球芯片和组合探针锚定连接测序技术。DNA纳米球芯片制备(图3A):由DNA片段和2个接头组成DNA文库。测序时接头作为读取起始位点,可从DNA与接头连接处每次最多读取10个连续碱基,然后单链环状DNA分子通过滚环复制,形成一个包含多个拷贝的DNA纳米球。将建库得到的DNA纳米球采用高密度DNA纳米芯片技术,加到芯片上的网状小孔内,每个小孔只能容纳一个DNA纳米球,DNA纳米芯片的占用量超过90%,每一个制备好的芯片可容纳1亿个碱基用于成像。组合探针锚定连接法(图3B):组合探针锚定连接法利用4种不同颜色标记的探针去读取接头附近的碱基,每次最多读取10个连续碱基且每次测序是相互独立的,在测序时,加入anchor与接头互补配对,然后DNA连接酶将4种不同颜色标记的探针结合到模板的相应碱基上,通过对荧光基团的成像来判断碱基类型。