1. 引言
1953年,詹姆斯·沃森和弗朗西斯·克里克共同提出DNA双链结构,标志着生命科学发展向分子生物学的转变,引发了生命科学和生物技术的一场革命 [1] 。1990年,随着以Sanger测序技术为基础的第一代测序技术不断发展,人类基因组计划正式启动,到2004年,正式进入后基因组时代 [2] 。Sanger测序技术原理是,核酸模板在核酸聚合酶、引物、四种单脱氧核苷酸存在条件下复制或转录时,如果在四管反应系统中分别按比例引入四种双脱氧核苷酸,只要双脱氧核苷酸掺入链端,该链就停止延长,链端掺入单脱氧核苷酸的片段可继续延长。以分离长短不一的核酸片段(长度相邻者仅差一个核苷酸),根据片段链端的双脱氧核苷酸,便可依次阅读合成片段的核苷酸排列顺序。
深层次和效率等大规模测序技术的要求,促使了以罗氏公司的454、Illumina公司的HiSeq以及Life Technology公司的SOLiD、IonTorrent为代表的新一代测序技术(Next-Generation Sequencing,NGS)的诞生。其显著特点是高通量,在精确测序时,远优于基于Sanger测序法的第一代测序方法,且价格显著降低。454 life sciences是最早的基于焦磷酸序列的商业基因组学系统之一,于2004年左右推出。它具有高速、读取长度较长和高精度等优点,但由于其通量低、成本高等劣势,现在已慢慢退出市场。随着测序技术的发展和优化,Ilumina和Life Technoogy等公司现在主导着下一代高通量测量系统的安装。Illumina公司的Solexa和Hiseq测序仪器采用边合成边测序的方法,在使用中具有高通量密度、短时间和低成本的合成和测序技术,目前是主要市场中占主导地位的第二代产品。Life Technology公司推出的IonTorrent的核心技术,通过半导体技术与化学和数字信息相连接,具有高精度、高速、低成本解读等优点,见图1。
中国科学家 [3] 对从陈年葡萄酒中分离出来的奶酪牛奶棒菌株Lactobacillus caseiBD-II和保加利亚菌株Lactobacillus delbrueckiisubsp.bulgaricusstrain NDO2的酸奶棒进行了研究;韩国科学家分析了泡菜发酵的香肠乳杆菌Lactobacillus farciminis、棒状乳杆菌Lactobacillus coryniformissubsp.coryniformis和高丽魏斯氏菌Weissella koreensis;德国科学家对从奶酪表面分离的变异棒状杆菌Corynebacterium variabile和棒状杆菌Corynebacterium casei进行了分析。它们都依次进行了完整的基因组测序,并分析了与它们相关的比较基因组和代谢能力。
2. 高通量测序行业研究
1) 基于颜色或荧光的高通量研究
Figure 1. Technical route of strain detection
图1. 菌种检测技术路线
基于颜色或荧光 [2] 的细胞筛选是一种非常显而易见的高通量测序技术(图2),它在细菌进化中广泛有效地用于选择含有有色或荧光代谢物的菌株。对于生产彩色产物(如番茄红素、β-胡萝卜素和虾青素)菌株,颜色的类型和深度可以初步判断反应代谢产物的类型和产量。在现代机器人技术的帮助下,筛选效率可以达到每次106个突变体。
Figure 2. High-throughput sequencing techniques based on color or fluorescence
图2. 基于颜色或荧光的高通量测序技术
2) 基于转录因子的高通量测序研究
转录因子可以与基因的启动子或增强子区域结合,单独或与其他蛋白质形成复合物,进而刺激或阻断RNA聚合酶参与转录过程,从而调节基因表达。在大肠杆菌中发现了230多种转录因子,它们可以感知多种代谢物,包括氨基酸、糖类、磷酸糖和脂质。细胞中的一些小分子代谢物可以通过配体结合和磷酸化作用来激活或失活转录因子,进一步统制相关报导基因的表述,从而将代谢物的浓度与荧光强度、细胞生长等检测信号联系起来,最终达到高通量测序的目的。
3) 基于磁珠提取技术的高通量测序研究
固有的DNA提取手段有煮沸法、盐析法、苯酚氯仿法、异丙醇沉淀法、离心柱法、磁球法等。本实验应用磁珠法 [3] 通过高通量测序技术自动地提取血凝块DNA,将血凝块分成在不同条件下被蛋白酶K消化的血凝小块,把用DNA裂解液处理后的血凝小块进行比较,分析它们的消化率。通过电泳判断DNA的完整性,可以保证DNA的品质。研究表明,高通量测序技术的结合可以使提取DNA的过程简便高效,同时结合自动化精简人工操作。现阶段,磁珠作为一种精良的固相载体,通常应用于制备核酸、化学发光、细胞分选、纯化蛋白质等领域。硅磁技术普遍应用于研究分子生物学、临床诊断、高通量筛选等领域。
3. 高通量测序行业应用
3.1. 高通量测序在微生物生态学中的应用
目前,高通量测序技术越来越多地用于研究海洋微生物生态学 [4] 。高通量测序技术可以揭示海洋中极少数量的微生物,并发现更多新的微生物群落,但在每一级分类中都有不确定的分类信息。Inoue等人 [5] 使用高通量测序技术研究了Kath山谷浅层地下水的生物污染。结果表明,11个地下水样品中有10个被大肠杆菌严重污染。此外,DNA微阵列分析结果还揭示了37种病原菌的存在。Lu等人 [6] 利用454焦磷酸测序技术研究了农村生活废水和制革厂、服装厂、纽扣厂排放的废水对河流微生物生态系统的影响,研究表明,微生物群落的结构受温度、pH值等环境条件的影响。Maugeri等人使用Illumina测序技术研究了意大利帕纳雷阿岛浅水热液系统中微生物群落结构和优势菌的组成。研究表明,沉积物和流体中存在不同的群落结构,优势菌分别为小红卵菌属和绿菌属,序列衍生的原核生物在浅水热液系统的C、Fe和S循环中起关键作用 [7] 。
王鹏等人 [8] 采用高通量测序技术分析了鄱阳湖典型湿地土壤细菌群落特征。研究表明,沿湖面至坡地,空间位置相近的土壤细菌群落结构具有更大的相似性,苔草–虉草带、苔草带和芦苇带的细菌群落结构相近,泥滩带和藜蒿带的细菌群落结构差异较大。湿地土壤平均相对丰度最高的门是变形菌门,其次为酸杆菌门和绿弯菌门;多数门分类细菌相对丰度沿湖面至坡地存在一定变化趋势。硝化螺菌属是第一大属分类水平细菌群落。
3.2. 高通量测序在菌种筛选中的应用
徐瑛等 [9] 将脱硫菌的筛选与新一代高通量测序技术相结合,探索脱硫菌筛选的新方法,为生物甲烷的高值化利用提供技术支持。实验将富含硫细菌的环境土样及经过培养基富集培养后的液样分别进行16S rDNA V6区的高通量测序,并分析了物种组成和丰度、Alpha多样性和菌群结构。结果表明,高通量测序的平均数据利用率达99.177%,测序量能够充分反映样品在该区域细菌的群落组成和结构。通过高通量测序技术,能够在筛选脱硫菌之前就了解实验样品的菌群结构和组成,为有针对性地设计筛选脱硫菌实验提供了一种新的方法。
何志刚等 [10] 采集不同低温菌源的样品,进行低温连续富集继代培养,利用第二代高通量测序方法分析不同处理的细菌群落结构和数量,并测定不同世代的纤维素酶、秸秆失重率等数据,筛选获得一组高效稳定分解玉米秸秆的复合菌群。
3.3. 高通量测序在病毒检测中的应用
2009年首次报道了应用高通量测序技术检测植物病毒 [9] 。Al Rwahnih等人使用以植物总RNA为模板的NGS平台在西拉子葡萄上找到了三种已知病毒、三种已知类病毒和一种新病毒——西拉葡萄病毒1号(Grapevine Syrah Virus-1, GSyV-1) [11] 。Kreutze等人对单独感染或复合感染甘薯羽斑病毒(SPFMV)和甘薯褪绿病毒(SPCSV)的甘薯小RNA进行测序。他们不仅鉴定了SPFMV和SPCSV,还发现了一些其他新的双链DNA病毒和单链DNA病毒 [12] 。并且Adams等人使用文库抑制和减法的手段通过NGS发现了一种新的RNA病毒——蛇鞭菊属轻斑驳病毒(Gayfeather Mild Mottle Virus, GMMV) [13] 。
4. 高通量研究现状及发展动态
4.1. 高通量测序研究现状
随着病原体宏基因组测序(mNGS)技术的不断发展和优化,mNGS检测技术不仅在感染的临床诊断中得到广泛实验和赞同,而且在越来越多的医院中实现本地化,能够快速地满足临床早期传染性病原体诊断的需求。但现阶段mNGS的国产化仍存在技术复杂度较高、操作流程较为复杂、报告解读较为复杂、临床应用标准有待提高、质量评价结果不理想、行业中目前缺乏统一规范的行业培训机制等诸多困难。
随着高通量测序技术的发展,大量的基因组测序已经不再是问题。数据规模庞大,类型多样,包括转录组、基因组和蛋白质组等等。同时重复性不强,数据存储和可视化也是需要优化的问题。在算法优化、软件并行化、流程自动化、大规模数据存储、处理和高级分析等方面需要做大量工作。样品污染也是影响测序结果准确性的主要问题。
由于高通量测序技术的出现,这些序列的增长趋势 [14] [15] 犹如潮水一般。一个实验室甚至可以每年发布PT级别的数据。如此大规模数据的高效存储、高效分析、共享循环利用是一项巨大的挑战,是高性能计算系统面临的重大挑战。目前,这些序列数据还不到冰山一角,只有少数完成了深入的分析。
据资料表明,高通量测序技术含有很多的优点,但高通量测序技术的局限性也不容忽视。一是测序速度提高了,但是后续对大量的测序数据的分析成为了一个非常困难的问题。其次,高通量测序技术不适合小型的测序。虽然高通量测序技术的价格正在逐渐下降,但每个反应的成本仍然在几千到几万元。普通客户会发现很难接受PCR产物和质粒等数十到数千个碱基的测序。目前,传统的Sanger测序法肯定是最佳选择。而且最新一代的测序仪器报价十分高,需要将近几百万,简单的小研究所难以承受此价格。因此,传统的Sanger测序法将与高通量测序技术一起成长、发展,短期内不会被淘汰。
4.2. 高通量测序发展动态
高通量测序技术的逐步发展促进了菌株进化工程在微生物工程领域的应用,在提高微生物菌株的环境耐受性、底物利用、代谢产物生产等方面取得了许多有意义的成就。随着生物学合成技术的发展,研究工作人员对菌种有了更加深切的认知,尤其是近年来人工合成酵母的出现,能够使研究人员能够更合理、更有效地进行菌株设计和大片段基因重组,以及获得更多样化的基因型和表型。这就是人工合成酵母的出现,它可以在未来的基础科学研究领域更好地研究基因结构的变异。这可以使研究人员更合理、更高效地实施菌种设计和大片段基因重组,产生更多样化的基因型和表型,是基础科学研究领域更好地研究基因结构变异与表型功能关系的重要模板。未来,为菌株的快速进化带来巨大机遇的同时,也为开发合适的高通量筛选平台提出了更大的挑战。尽管近年来高通量筛选方法的研究和应用取得了长足的进步,但它们一般只适用于筛选特定的代谢物、酶或代谢途径,缺乏普遍性和适用性。将来,由于生物检测信息的不断深化,在生物传感器领域,我们有更多的机会尝试开发更多对小分子具有特异性反应的生物传感器。同时,我们还需要探索更多的生物传感器机制,以使生物传感器的精度和准确度能够得到很大的提高。随着人工智能的发展和对人体微生物系统认识的不断加深,将极大地推动自动筛选的进步和自动数据分析的能力,为打造高通量测序技术提供强有力的技术支持。
高通量测序技术的成功与否是由筛选广度和精确度决定的,其实主要是由所选择的筛选模型决定。其中,最大程度地简化筛选步骤是最为重要的。这就好比用笼子捕鸟,笼子的大小对捕鸟能否顺利有决定性作用。如果笼子太大,就比较显眼,同时比较小的鸟也有可能逃脱掉;如果笼子太大,大一点的鸟就不会被逮到,有可能一天下来一只鸟都没有。总而言之,高通量SrDNA测序技术 [12] 现在已经成为生命科学研究项目中必不可少的工具。随着上一代测序技术和最新一代测序技术的快速发展,将高通量测序技术与筛选方法相结合必将加快菌种检测研究的发展。
基金项目
国家级大学生创新创业训练计划项目:202110449152;滨州学院实验技术项目:BZXYSYXM202008。
NOTES
*第一作者。