测序原理:第一代、第二代、第三代测序原理详解。
罗氏的454技术、illumina的Solexa/Hiseq技术和ABI的SOLID技术标志着第二代测序技术的诞生。罗氏的454测序系统是第二代测序技术中第一个商业化的测序平台。
其中Illumina的市场规模占75%以上,主要有Miseq和Hiseq。下面?本文主要介绍其PE(Pair End)测序原理:
名词:
流动池:测序反应的载体/容器。在1个流动池中有8个泳道。
泳道:测序反应的平行泳道,试剂添加和洗脱过程在此进行。
平铺:每次荧光扫描的位置肉眼看不到。
双端测序:序列可能有四五百bp长,两边都是120-150bp。
连接处:双端测序中间的一些未检测到的区域。
索引(条形码):一个泳道通常需要测量多个样本,每个样本都标有特定的序列,以区分不同的样本。
流通池结构:一个通道包含两个条带,每列有60个瓦片,每个瓦片将种植不同簇,每个瓦片将在一个循环中拍摄四次照片(每个基底一次)。
中断后末端会不平整,会被酶填满,所以现在的序列是平端的。
整平完成后,用酶在3’端加上一个特定的碱基A,加上A后,就可以利用互补配对的原理了。加上衔接子后,衔接子可分为两部分,一部分是测序所需的引物序列,另一部分是文库构建和扩增所需的引物序列。
进行PCR扩增,使我们的DNA样本浓度足以满足计算机要求。
Reads1和reads2不重叠。
流动池是吸附流动DNA片段的通道,测序在这里进行。上面构建的文库中的待测序列预先配置了一定的浓度,当它经过这里时,会在特定化学试剂的作用下,强烈地随机附着在lane上,与上面的短序列配对。作为装载的结果,lane吸附了冲走的DNA,并且它可以通过表面上的桥PCR扩增。
双端测序的正向链:
为什么Illumina测序有长度限制?
Hiseq2000序列器
测序仪配有两个流动池,称为双流池。经典的Hiseq2500一次可以产生700-800Gb的数据(其中Gb是测序碱基数,与字节数不同)。
数据量=单端读取长度*单端读取次数* 2(PE)
测序深度=数据大小/参考基因组大小
这是一个新的里程碑。以PacBio公司的SMRT和牛津纳米孔技术公司的纳米孔单分子测序技术为标志,被称为第三代测序技术。与前两代相比,最大的特点是单分子测序,不需要PCR扩增,阅读长度极长,平均达到10Kb-15Kb,是第二代测序技术的100倍以上。值得注意的是,在测序过程中,这些序列的阅读长度不再相等。
1./p/101c 14c 3a 1 D2
2./p/20702684
3./s/tw hwa-f 1 RNP _ xwy 66 p 12pg
4./s/9KUY43lD5miLdPZJKgRV0A