高通量测序知识学习

Introduction

高通量测序(high-throughput sequencing, HTS),即下一代测序(next generation sequencing, NGS),又称为大规模平行测序(massively parallel sequencing, MPS)

1. 高通量测序技术的特点

操作步骤多,程序复杂

1.1 湿桌实验过程(wet bench process)

实验室内的标本预处理,核酸提取及其片段化,建库,扩增,靶序列富集,混样(pooling),测序前准备及测序。

1.2 干桌实验过程(dry bench process)

测序后的数据质量分析,比对,变异识别,注释和结果报告与解释等生物信息学分析流程(bioinfomatics pipeline)

2. 第一代测序技术

发展历史

时期 测序技术 说明
20世纪50年代 Whitfld 等化学降解法测定无支链的RNA序列 操作复杂,并未广泛使用
20世纪60年代中期 Robert 等利用小片段重叠法测定酵母丙氨酰-tRNA序列76个核苷酸序列 耗时7年之久
20世纪70年代初 华裔分子生物学家吴瑞提出位置特异性引物延申策略,并于1971年首次成功测定了λ噬菌体12个碱基的黏性末端序列 这是文献记载的最早的DNA序列分析方法;但仅限于测定DNA短序列
1973年 Gibert和Maxam利用化学降解法测定Lac抑制子结构区24个碱基的DNA序列 -
1975年 Sanger报道了更为简易的加减测序法(plus-minus sequencing) -
1977年 Sanger在加减测序法的基础上创建了双脱氧链终止测序法(dideoxy chain-termination method/Sanger sequencing) 标志着第一代测序技术的诞生
1977年 Gilbert和Maxam在原有方法的基础上合创了化学降解测序法 与双脱氧链终止测序法类似,标志着第一代测序技术的诞生

双脱氧链终止测序方法化学降解测序法 原理大相径庭,但都是生成了相互独立的若干组带放射性标记的寡核苷酸混合物,这些混合物有共同的起点,随机终止于一种或多种特定的碱基。通过对各组寡核苷酸混合物进行聚丙烯酰胺凝胶电泳(polyacrylamide gel electrophoresisPAGE)即可从放射自显影片上直接读出DNA核苷酸序列。

基于前人的探索,这一时期还出现了鸟枪法(shotgun method),杂交测程序(sequencing by hybridization, SBH)

  • 优势:长读长、准确度高
  • 不足:测序成本高、耗时长、通量低;以至于不能满足深度测序和重复测序等大规模基因组测序的需求

3. 第二代测序技术

随着历时13年耗资近3亿美元的人类基因组计划的完成,生命科学划时代地进入后基因组时代,即功能基因组时代。

第二代测序技术又称为大规模平行测序(massively parallel sequencing, MPS)

时期 测序技术 说明
1996年 Ronaghi和Uhlen建立了焦糖酸测序(pyrosequencing) 与第一代测序技术最大的不同是边合成边测序
2005年 454 Life Sciences 公司划时代地推出了基于焦磷酸测序原理的 Genome Sequencer 20 测序系统 这是测序史上具有里程碑意义的大事件,改变了测序的规模化进程,成为第二代高通量测序的先行者

2009年以后出现了以单分子实时测序和纳米孔技术为代表的第三代测序,所以将2005年出现的高通量测序技术成为第二代测序技术

第二代测序技术的核心思想是:边合成边测序(sequencing by syntthsis, SBS),即通过捕捉新合成的末端标记来确定DNA的序列;

  • 优势:高通量、自动化、耗时短

5种主流二代测序平台:454(Roche), Solexa(Illumina), SOLiD(Life Technologies), Ion Torrent(Life Technologies), CG(MGI)

4. 第三代测序技术

第三代测序技术较前面的技术最大的区别是读长长,准确率低,难以用于临床、

理想的测序方法:对原始的DNA模板进行直接、准确测序且不受读长的限制。

第三代测序技术主要是指 单分子实时(single molecule real-time, SMRT)测序技术纳米孔(nanopore)测序技术,实现了 长读长单分子测序(不进行扩增)

【第三代测序技术最大的缺陷:高错误率;故目前难以应用于临床实际】

准确率:

  • PacBio SMRT:单次测序仅有85%准确度;可通过重复测序进行一定程度的纠正,但仍难以媲美二代测序的99.5%
  • ONT Nanopore:检测错误主要体现在对 Indel 的检测

ONT Nanopore 测序技术的主要特点是:超长读长、读取速度快、高通量、便携性;样本制备过程简单,基因组无需进行亚硝酸盐处理便可直接读取甲基化的C,对在基因组水平直接研究表观遗传相关现象有极大的帮助。

参考书

[1] 《高通量测序技术》,李金明主编,科学出版社出版