News
/
Nanopore Tech Tour: 北京场精彩回顾
26 September 2019
本周, 我们在中国举办了我们的首个 Nanopore Technology Tour。9月23日,伴随来自Nanopore社区的优秀演讲嘉宾阵容、纳米孔教学专场以及现场技术演示的紧凑日程, 我们在北京拉开了首场NTT的帷幕。阅读下文了解北京活动的摘要回顾。
Oxford Nanopore 技术和应用更新: 从首要原理到应用
Oxford Nanopore Technologies 应用部门副总裁 Dan Turner, 以及基因组应用总监 Sissel Juul, 为参会者提供了纳米孔测序技术更新和有关最新产品发布的信息:
- 自动文库制备仪 VolTRAX V2。
- 读长和准确率更新:当前最长的测序读长达2.3Mb,利用R9.4.1版纳米孔, DNA单读长碱基识别准确度高达95%,RNA单读长碱基识别准确度高达94%,在金黄色葡萄球菌(S. Aureus)的一致性Q值为44。
- 介绍纳米孔测序文库制备的不同选择方案:包括10分钟快速测序试剂盒、PCR文库以及PCR-free文库、最新的试剂盒版本对通量的提升。
- 使用实验方案生成器(Protocol Builder)生成特定应用的完整实验方案,从样本提取到数据分析的指导。
- Pore-C最新进展:染色质构象捕获技术,具有矫正错配、检测基因组重排和拷贝数变化以及解决复杂的结构变异的能力。 Pore-C的好处在NA12878细胞系的组装中得到了证明,生成的contig N50超过30 Mb,最长的scaffold长度为129 Mb,相当于包括着丝粒在内的整个8号染色体的89%。
- 无需PCR的CRISPR / Cas9介导的富集,利用长读长纳米孔测序来进行变体定相和甲基化分析。Cas9富集的好处在Friedreich’s ataxia 共济失调病的纯合子和杂合子携带者中量化三联体重复序列的扩增并检查相关的高甲基化得到了证明。
全球科学家使用纳米孔测序获得的热门研究结果
Yutaka Suzuki教授,东京大学,日本
“长读长测序可能帮助在分子病因学上理解那些在患者中仍处于未知且尚无有效治疗措施的癌性突变。”
Yutaka Suzuki教授主要分享他利用纳米孔测序进行临床癌症全基因组测序的经验。着手于肺癌,Yutaka团队在PromethION上进行靶向扩增子测序以精准鉴定癌症相关基因(如EGFR、KRAS、NRAS和NF1基因)的单碱基突变和等位基因在抗癌药物敏感性和抗性突变中的角色,为选择治疗方案提供有价值的信息。PromethION芯片单次运行能够生成>50Gb的测序数据,这将长读长癌症基因组测序的费用降到了一个较为切合实际的水平。对6种类型的肺癌细胞系全基因组测序生成的数据覆盖度为30X,读长N50为20Kb,并识别出一类难以用短读长识别的新型癌症结构变异,将其命名为癌性局部拷贝数损伤(Cancerous Local Copy Number Lesion; CLCL)。在CLCL区域,基因组序列受到了复杂的畸变模式的影响,这种模式由串联重复、短倒置和重复组成,这样的结构畸变也发现在临床肺腺癌标本中。
Yutaka及团队还对神户牛(Wagyu)进行了全基因组测序,神户牛育种大多通过人工授精完成,虽然产量有所提高,但导致遗传病尤其是隐性遗传病的增加。我们将在后续分享这个研究的更多信息,敬请期待。
夏雨助理教授,南方科技大学,中国
“基于纳米孔的长读长宏基因组测序技术可成为目前NGS组装和分箱的有效替代方案。”
污水处理厂排放的废水是抗生素耐药细菌(ARB)和抗生素抗性基因(ARGs)的源头,可导致抗性基因在排放水体中富集。由于缺乏可靠的 ARB 鉴定方法,这些抗性环境中抗性基因的传播扩散机理尚不完全清楚。基于纳米孔宏基因组测序技术可为环境中ARB的鉴定提供有效的方法,她的结果显示污水收纳水体中的抗性基因组的浓度通常比普通海水中高10倍, ARB的环境再生可能在ARB富集中发挥着重要作用,污水排水携带的ARB占据了受纳水体中抗性基因组的87%。
夏雨团队还在海拔4000米的祁连山使用MinION对冻土和冰川融水进行现场测序,结果显示冻土中适应能力较强的核心微生物群落对海拔高度的变化具有抵抗力,光合自养的Oscillatoria(蓝细菌门)在海拔4000米的样品中较为丰富,该地点较强的太阳辐射可为依赖光驱动模式生存微生物提供较有利的条件。
Martin Frith 教授,日本产业技术综合研究所(ASIT)&东京大学,日本
Martin Frith 教授给大家带来了全中文的演讲,他讲到复杂突变(例如串联重复扩增/收缩、同源重组、染色体破碎、病毒/转座子插入)经常引发疾病,但由于难以鉴定而一直被忽略。Martin利用纳米孔PromethION平台进行了全基因组测序,发现长读长和参考基因组之间最可能的比对,允许基于核苷酸、替换,插入和缺失概率的任意重排。这些重排的一些性质,例如序列丢失是整体的:它们不存在于重排的任何部分,而只存在于整个重排中。通过PromethION生成的长读长,他们还发现了转座子,假基因和线粒体DNA的插入。
以一个神经退行性疾病为例,通过Cas9介导的富集并构建一致性序列来研究突变,Frith发现了神经元核内包涵体疾病的病因与串联重复扩增相关联。由此能够完全鉴定由染色体断裂引起的先天突变,以及重复扩增与疾病症状的关联。
Yue Wan 博士,新加坡基因研究所
研究RNA如何折叠对于理解细胞内的RNA功能至关重要。使用短读长测序进行的RNA二级结构定位能够提供大规模结构信息,但缺乏沿转录本结构之间的连接性信息。Yue Wan和她的团队利用纳米孔直接RNA测序来检测结构修饰,结合使用机器学习模型,准确地检测了RNA二级结构及其在已知RNA上的动态。
使用纳米孔直接RNA测序对人类胚胎干细胞转录组进行结构探测,捕获了在其他高通量测序的结构数据集中看到的结构特征,并使Yue能够检测基因中单个异构体的结构信息。所使用的实验系统显示出高再现性和低噪音。结果表明结构特征可以被定位到例如特定转录本的5'UTR区域。纳米孔长读测序还能够跨越特定部分的整个结构,从而帮助团队了解不同转录本之间的关系。
大规模纳米孔测序
Fritz Sedlazeck 博士,贝勒医学院,美国
生物和医学的核心是更好的理解基因与表型之间的关系,即遗传变异、基因调控等研究领域。Fritz说,测序技术的进步如纳米孔长读长测序的MinION,GridION,PrmethION平台让他们能够更好的理解遗传变异多样性,其中PromrthION平台适合大规模的高通量应用研究。
Fritz首先验证了PromethION平台能够检测这些变异的生物学相关性和重要性,他们在首次运行中单张测序芯片获得74Gb的数据,现在能够获得约140Gb的数据,这是使用短读长测序技术难以完成的。在常见疾病遗传学中心(CCDG)4400个人类基因组计划用于心血管疾病的研究中,他们根据现有短读长数据结合SVCollector软件选取部分样品,利用PromethION平台,结合自主研发的PRINCESS工具,探索不同类型的结构变异(SNV,SV,定相和甲基化)。与短读长测序相比,提高了每个基因组的分辨率。在1000个番茄基因组计划中,Fritz参与使用PromethION在100天内测序了100个番茄基因组。
刘敏,产品总监,百迈客生物科技
“使用纳米孔平台,我们能够对转录物和基因进行精确和可量化的分析,从而能够更好的分析生物体内转录物的表达。”
百迈客产品总监刘敏首先解释了全长转录组学如何能够揭示生物体内复杂的转录情况,鉴定基因在转录过程中的可变剪接、多聚腺苷酸化、融合基因和基因家族等基因结构信息。纳米孔长读长测序技术能够跨越整个异构体、移除或减少不确定的比对等,因此在高质量基因组组装上有明显的优势。
百迈客生物科技拥有MinION、GridION和PromethION平台,他们已经利用纳米孔测序技术组装超过60个物种,这些数据Contig N50水平几乎均在1 Mb以上,高难度的海洋生物Contig N50高达22 Mb-27 Mb。纳米孔转录组数据的加入可以提供有关基因的可变剪接的信息,有助于改善基因组注释。
刘敏总监进而展示了一些百迈客进行的实测数据和案例。在基因表达的定量分析中,纳米孔测序与预测的转录本频率相关性好,能够进行差异基因表达及异构体鉴定。纳米孔转录组数据还能够用于基因结构分析,百迈客已经获得了在每个数据集中超过70%的全长转录本,相较短读长RNA数据,能够更有效地分析基因家族、进化关系和非编码RMA。
在与短读长数据比较时,百迈客的结果呈现高度一致,结果显示所有运行的相关系数>0.8,每个数据集中发现的基因数目相似。在与其他长读长RNA测序比较时,以一个植物转录组为例,纳米孔2Gb发现的转录本数量与其他长读长平台20Gb数据相似。
张士伟,研究部总监,诺禾致源
“纳米孔长读长及超长读长对于Contig组装非常必要。”
张士伟总监在开场说到,植物基因组从0.6G到148G不等,大多数植物基因组中含有大部分重复序列, 这些重复序列从几个到数百万个拷贝不等。纳米孔长读长测序具有更低的GC偏差,并且可以跨越高重复/杂合区域,能够更准确完整的组装基因组,检测不同类型的突变(如删除、插入、易位或SNP)等。
他们使用目前R9芯片测序了2个植物基因组,得到的数据分别超过115Gb (N50为38Kb)和81Gb (N50为41Kb)。诺禾致源也是新版R10芯片的早期测试用户。
在PromethION平台上使用纳米孔连接测序试剂盒对选择的长片段(>10-20kb)和超长片段(>40-50kb)进行测序,其中普通文库的平均读长>25kb,N50>40kb,单测序芯片的平均产出>60Gb,最大产量高达106Gb。超长文库的平均读长>35Kb,N50>55Kb,单测序芯片的平均产出大于30Gb,最大产量高达45Gb。结合多平台,他们得到了3种高质量植物基因组组装结果。
我们在这里简单分享了演讲嘉宾的部分精彩内容,完整的演讲视频及闪电演讲精彩内容请关注我们后续在微信公众号(ID: NanoporeTechnologies)及中文网站的分享。我们期待与大家很快在上海NTT相聚。