串联质谱筛查与基因检测的区别(当质谱技术结合人体代谢物)

澎湃新闻首席记者 贺梨萍

癌症正在成为全世界主要的死亡原因和公共卫生的主要关切目标,约占死亡率的15%。世界卫生组织相关数据显示,全球每年的癌症负担预计将不断增加,仅2020年就有1900多万新病例和1000万死亡病例。

在和癌症斗争的漫长进程中,除了免疫治疗等方法带来新的希望之外,将斗争的“关口”不断往前移,这也是科学界和医疗界的努力方向之一。由此而衍生出的一种现象是:近年来,开发早期、可靠的癌症筛查诊断技术并使其成功商业化,已成为一条热门赛道。

日前,四川大学国家生物医学材料工程技术研究中心、复旦大学附属中山医院、武汉大学、安徽医科大学第一附属医院、清华大学药学院等团队的研究人员在国际学术期刊《自然-通讯》(Nature Communication)上发表了一项研究。他们开发了一种用于泛癌症诊断的多重纳米材料辅助的激光解吸/电离(LDI)质谱方法(简称为“MNALCI”)。在进一步结合机器学习进行高处理能力的分析后,MNALCI可以高度灵敏地捕获和分析1000道尔顿(Da)以下的小分子代谢物信号。

来自上海复旦大学附属中山医院的患者和健康对照组作为内部验证队列,该队列显示,MNALCI表现出了93%的灵敏度和91%的特异性;来自合肥的安徽医科大学第一附属医院的患者和健康对照组则作为外部验证队列,该队列显示,MNALCI表现出了84%的灵敏度和84%的特异性。

串联质谱筛查与基因检测的区别(当质谱技术结合人体代谢物)(1)

“从临床角度来说,肿瘤筛查确实存在着一个非常大的需求,并且它是一个比较新兴的领域,是一个蓝海的市场。”该项研究的作者之一、中国科学院生物化学与分子生物学博士钟晟在接受澎湃新闻(www.thepaper.cn)记者采访时表示,“要作为一款面对大众的肿瘤筛查产品,它的一个基础条件是灵敏度要达到80%以上、特异性要达到90%甚至95%以上的指标。”他认为,无论是从临床角度,还是从宏观的卫生经济学角度考虑,达到上述这些指标才会有其意义和价值。

所谓的灵敏性(Sensitivity)是指真实阳性样本中预测为阳性的比例,即对真正癌症群体检测出有癌症的比例;特异性(Specificity)则是指真实阴性样本中预测为阴性的比例,即对非患癌群体检测出阴性的比例。

值得一提的是,钟晟强调一点,“只有提高了灵敏度,也就是提高了筛查的效率,才能够去节约社会资源。而追求特异性的极限,更是我们在做肿瘤筛查的过程中需要去提升的一个性能指标参数。”他进一步解释道,就癌症筛查来说,没有患病的群体基数是非常大的,“比如说有100万人筛查,可能其中99万人都是健康人群,如果特异性太低,哪怕差一个百分点,那么就会多将近1万个人被误诊为肿瘤。”

谈及这项研究的初衷,该项研究的共一作者、武汉大学郑杰博士在接受澎湃新闻(www.thepaper.cn)记者采访时表示,团队想解决的一个问题是,“想看看高通量非靶向的质谱技术和机器学习技术是否能解决在多个癌症中找到生物标记物的几率?我们经过大半年的实验,也在不断地去调整纳米基质、质谱仪器参数和机器学习算法之间的配合,最终无论是在内部验证还是外部验证,表现都很不错。”基于这些前提研究,研究团队启动了规模更大的进一步研究。

郑杰同时强调一点,代谢组学是当前医学研究的热点之一,“而无论是质谱技术,还有影像分析技术或是基因组技术,通过不同技术的搭配,然后再结合样本的采集处理,还有和算法相互结合,我们会有不同的方案去针对不同的场景解决癌症的这样一个大的话题。”

串联质谱筛查与基因检测的区别(当质谱技术结合人体代谢物)(2)

利用MNALCI检测和分类癌症。

基于代谢组学的泛癌症筛查技术

论文指出,迄今为止,像甲胎蛋白(AFP)、癌抗原19-9(CA19-9)和癌胚抗原(CEA)这些相对有效的血液肿瘤生物标志物非常有限,但其敏感性仍然远不能令人满意,而非侵入性的无创早期诊断筛查方案又必不可少。

近年来,利用血液的液体活检作为一种非侵入性和高敏感度的技术手段,在相对早期的阶段检测和定位癌症领域显示出了巨大的潜力。相比适用于特定人群或高危人群的单癌种筛查,面向“健康人群”的泛癌种筛查也越来越受关注。

实际上,在泛癌种筛查领域中,全球多个实验室也已开发了许多新的技术方案。2015年,阿姆斯特丹自由大学的Myron G Best等人在《Cancer Cell》上发表了一项研究,他们基于肿瘤血小板(TEPs)的RNA测序可用于泛癌症分析、癌症类型的区分和肿瘤基因突变诊断。结果表明,血小板的RNA测序可以区分癌症患者与健康人,其准确率达到96%,也能区分6种常见的原发肿瘤类型,其准确度达到71%,并能识别几种肿瘤中发现的基因改变。

论文中也举例提到,通过对从全血中分离的TEPs进行RNA-seq检测,一种名为CancerSEEK的复合式分析血清检测可依靠无细胞DNA和循环蛋白来检测8种常见癌症;血清细胞外小泡的表面蛋白可被用来对6种不同癌症进行分类;最近,一种通过检测无细胞DNA的异常片段的方法(DELFI)也被应用于针对多达7种不同癌症进行诊断和分类。

“然而,这些方法大都需要复杂的样本制备、复杂的机器设备以及采集大量的血样,且准确性有待提高,限制了它们的临床应用。”论文中如是写道。

让研究团队尤其关注的一点是,癌症被认为是一种代谢紊乱性疾病,多项研究也已经证明了代谢组学在某些癌症诊断中的潜在应用。只不过,长期以来,基于代谢组学的泛癌症筛查技术还未被开发到最优。

“代谢组学是当前医学研究的热点之一,我们为什么基于代谢组学,而且还是基于高分辨率的质谱?是因为在无论是二代测序技术NGS还是传统的液质联用LC-MS,它们整个的实验样本前处理和上机的通量、效率都是很低的,无法真正满足大规模商业化落地的需求。”郑杰表示。

他提到,测序需要很高的成本,LC-MS的样本处理工作则特别麻烦,“它并不是一个高通量的质谱技术,通常处理40个样本基本就需要一天的时间。”同时,研究团队认为,代谢组学是整个生物信号的终端产物,“我们认为代谢组学提供的信息和表型更为接近,更适合于疾病的分型和标志物的发现。”

生物系统可以在不同层次上进行研究,从DNA到维持生命的反应。代谢组学即是系统生物学的重要组成部分,继基因组学和蛋白质组学之后新近发展起来。其研究对象大都是相对分子质量1000Da以内的小分子物质。代谢组学随后得到迅速发展,并渗透到疾病诊断、医药研制开发、营养食品科学、毒理学等多领域。

钟晟提及,随着人类基因组计划的推进,差不多在2000年前后,基因组学就慢慢地应用到到了科研领域,甚至是临床领域。“代谢组学大概落后基因组学10年左右,基本上是从2010年开始,逐步地在科研、临床诊断,包括跟消费者检测这一块发挥作用。”

他认为,代谢组学和基因组学“是一个平行的维度”,“市面上有很多基于DNA的技术,它可能是一个预测级别的产品,比方说预测一个人他们家族的一个基因的遗传,或者能够提早3年或者5年发现癌症的踪迹,但是我们的代谢组学检测更多地反映个体当下的表型情况,所以是一个肿瘤普筛的技术平台。”

值得关注的是,目前国内已有多家初创公司在布局基于代谢组学的癌症早筛技术。其中,钟晟等人于2018年创立的深圳泰莱生物科技有限公司即在其列。

更适合检测生化小分子的质谱仪

除了代谢组学应用得日益广泛之外,另外值得注意的是,在过去的20年里,基于质谱技术的检测方法也正发挥着越来越大的作用。

钟晟谈到,在这项研究中,他们面临的挑战即是,“质谱检测技术目前确实没有像NGS这么成熟,所以面对质谱仪的研发,我们需要去解决很多的问题。”

首先是代谢物数据库,“它不像基因这么丰富,因为代谢组学相对基因组学的发展要滞后一些。在这样的背景下,目前国际的权威数据库中,代谢物的数据库相对来讲是偏少的。”研究团队需要先行完成的是,建立一套适合中国肿瘤患者的肿瘤相关代谢物数据库。

而建数据库,则需要投入巨大的资源,包括大规模样本的反复检测,乃至数据和算法的不断打磨。

据介绍,该研究项目启动于2017年,团队在近3年的时间里,从复旦大学附属中山医院、四川大学华西医院、中国医学科学院肿瘤医院等数十家三甲医院及国家级科研机构合作完成了超2万例的临床样本采集和研究。“这是一个回顾性的临床队列,并且所有的肿瘤患者都是有临床病理金标准确诊的肿瘤患者。”

钟晟还提及,随着该项技术的进一步商业化推广,这一代谢组学数据库也在不断更新。截至目前样本量已达到近10万例,其中3万多例为科研样本,6万多例是真实的商业检测样本。“基于这些数据及生信团队的进一步挖掘,最终建立了一个中国人群的肿瘤代谢物的数据库。”

接下来的挑战则是需要一台“重器”出场。“如果要更好地解决检测的问题,那么我们还要从相对来讲比较底层的质谱的原理和质谱仪器这一块去入手。”

1898年,在研究电离气体流时,出生于东普鲁士的德国物理学家Wilhelm Wien(1911年获诺贝尔物理学奖)发现了一种与氢原子质量相等的正粒子。他发明了第一台质谱仪,并以此奠定了质谱学的基础。随后的20世纪里,JJThomson和Francis Aston等人的开创性工作使得这项技术有了质的飞跃。

所谓的质谱(MS),就是一种化学分析形式,用于测量样品中原子或分子的质荷比(m/z)。“它能检测的东西非常多,包括小分子领域,比如说50-1000Da分子量的物质,这些物质可能是代谢物;1000-5000Da分子量的区间里,可能是一些多肽;5000Da以上分子量的可能是一些蛋白质,甚至是一些DNA的片段。”钟晟提到一点,“那么我们要解决一个问题,怎么样设计一台能够更适合于做生化小分子的质谱仪,这其实也是我们在做肿瘤筛查中需要解决的仪器的升级和迭代问题。”

第三个挑战则是来自样本的处理。尽管质谱仪有许多不同的类型,但总体而言均有三大环节,第一就是可以使样品中的原子或分子离子化的方法这,统称为离子源;第二是质量分析仪;第三则是检测或计数m/z值离子数的方法,也被称为检测器。

在这项最新的研究中,研究团队使用的技术为MALDI-TOF。MALDI即基质辅助激光解吸电离(Matrix-assisted laser desorption/ionization),为一种离子源;TOF是质量分析仪,离子根据其m/z比率进行分离,而该比率则基于它们穿过已知长度的飞行管到达检测器所花费的时间长度。

“MALDI-TOF跟传统的串联质谱或液相质谱来比较有一个很大的不同,它没有非常复杂的液相的样本分离的流程,如果有这样一个样本分离的流程,处理的周期就会非常长,导致了这个技术可能很难大面积地普适性地去推广。”钟晟谈到,其团队技术在非常巧妙的样本前处理的基础上,能够非常高效地分离和富集需要检测的代谢小分子,“所以在样本前处理的环节上面也进行了大量的研发尝试。”

最后一个挑战则是来自质谱仪的基质材料。论文中也指出,激光解吸/电离(LDI)通常需要一个辅助的有机基质将能量传递给分析物,由于基质的本底离子,小分子代谢物检测的准确性受到影响。而纳米材料辅助的方法可以很好地适用于LDI研究低质量范围的代谢组学,这些纳米材料在吸收激光能量的同时,不会产生令检测信号复杂化的团簇离子。

串联质谱筛查与基因检测的区别(当质谱技术结合人体代谢物)(3)

两种纳米材料的制备。

钟晟也进一步解释道,从传统的MALDI-TOF质谱来讲,用的最多的基质是有机小分子基质,比如说 CHCA(a-氰基-4-羟基肉桂酸),或者是DHB(2,5-二羟基苯甲酸)等。“小分子基质在做代谢物检测的时候会存在一个问题,因为它本身的分子量就是跟检测的这些代谢物的分子量是相似的,所以如果用这种有机小分子基质来做检测的话,它会存在一个很大的信号干扰。”正因如此,传统的MALDI-TOF检测的往往是大分子,例如微生物的膜蛋白检测,或者是用于单核苷酸多态性(SNPs)分型等。

论文中同时指出一点,此前的研究一般都依靠单一的纳米材料基质进行LDI分析,指纹分析信息有限,容易出现误报。

在这项研究中,研究团队在经过大量的筛选后,“最终确定了两大类可行的纳米材料,能够对我们检测的质谱检测的信号进行很好的富集和放大,最终得到高质量的数据结果。”钟晟表示。第一种类型的纳米材料是第一种纳米材料是Au/SiO2核/壳纳米粒子,第二种类型的纳米材料则是利用Agassisted化学蚀刻技从n型硅片上获得的高多孔性硅纳米线。

“纳米材料在这项研究中最核心的作用就是去放大激光能量,并且由于纳米材料具有物理化学的稳定性,它比较难产生小分子区间的干扰,所以相比传统的基质材料,在做代谢物或者小分子物质检测上面,它有较强的独特优势。”

值得一提的是,目前国内使用的质谱仪系统多数由德国布鲁克、美国SCIEX、日本岛津等进口厂商主导,而钟晟等人创建的泰莱生物的团队还在进行质谱仪的国产化。“我们转向仪器自研国产化是基于实际科研需求,也符合宏观政策的方向。从整个产业的角度来看,我们认为上游仪器‘卡脖子’的问题也必须解决。”郑杰表示。

钟晟则谈及,如果类比称手机或者电脑,质谱仪也会涉及很多零部件的采购,“激光器、探测器、采集卡,包括无数的电源、开关、芯片,包括印制线路板 PCB等,里面的各个零部件难免涉及到跨国采购。但是这不仅仅只是个单纯组装的过程,需要对各个零部件有深刻的了解和对真实业务场景需求的理解,通过不断的调试和测试数据的反馈,才能做出一台真正适合自己的质谱仪。”他同时提到,MALDI-TOF也是目前各类型质谱仪中国产化进度最快的一个平台,“目前我们的国产化率基本上可以实现85%以上。”

郑杰同时强调一点,无论是纳米基质材料的筛选,还是质谱仪的国产化,这些研究并不仅仅是一项科学实验,“它最终还是反映到数据上,让检测结果真正可实现基层应用。”

多种液体活检策略的结合可进一步提高准确性

在这项研究中,研究团队从中国两个医院选取的队列进行了MNALCI泛癌筛查测试。

上海队列由1008人组成,包括203名健康对照组和805名被美国癌症联合委员会(AJCC)诊断为I-IV期癌症的患者:其中肝癌(n = 139)、肺癌(n = 76)、胰腺癌(n = 97)、结直肠癌(n = 238)、胃癌(n = 119)和甲状腺癌(n = 136),来自中国上海复旦大学附属中山医院。

合肥队列包括175人,其中包括30名健康对照组和145名I-IV期癌症患者:肝癌(n = 29)、肺癌(n = 28)、结直肠癌(n = 30)、胃癌(n = 30)、甲状腺癌(n = 28),作为该研究的外部验证队列进行进一步调查。遗憾的是,在合肥队列中缺乏胰腺癌的病例。

结果显示,在内部验证队列中,MNALCI表现出了93%的灵敏度和91%的特异性;在外部验证队列中表现出了84%的灵敏度和84%的特异性。此外,在上述6种癌症中,识别肿瘤组织的总体准确性在内部验证队列中为92%,在外部验证中为85%。

研究团队发现了多达8个代谢物生物标志物。即2-氧代戊酸、组胺、葡萄糖、5-羟甲基尿嘧啶、2-糠酸、甲基丙二酸、4-甲基儿茶酚和L-肉碱,这些代谢物中,有大部分在其他地方被报道过与癌症有关系。

研究团队在论文中强调,需要注意的是,MNALCI方法并非要取代其它液体活检方法。相反,这种方法可与如mRNA、miRNA、突变的或5-羟甲基化的cfDNA、循环蛋白等其它生物标志物筛选策略相结合。他们还指出,MNALCI方法并不能区分NSCLC、CRC和PTC中常见的致病性突变。然而,基于cfDNA突变的液体活检在很大程度上依赖于驱动基因的突变,对于具有阴性驱动基因突变的癌症(占癌症中的很大一部分)来说,其灵敏度可能会受影响。

串联质谱筛查与基因检测的区别(当质谱技术结合人体代谢物)(4)

MNALCI与血清肿瘤抗原诊断特异性肿瘤的比较。

研究团队认为,多种液体活检策略的结合可以提供额外的信息,进一步提高癌症诊断和识别肿瘤组织来源的准确性。

郑杰也对澎湃新闻记者表示,多组学是未来的一个大趋势。“代谢物是信号通路的终端产物,代谢物的信息和最终的表型更为接近,更利于癌症的分型和标志物的发现,但我们也认为临床患者的真实情况应该是从生命多个维度去反映的,所以我们也正在去从多组学这个方向去探索一些癌症的研究,会结合基因组、代谢组、影像组等,融合。”

钟晟则强调一点,肿瘤检测其实有非常细分的场景:“肿瘤的普筛(或叫肿瘤初筛),到高危人群的精筛,再到疑似肿瘤患者的早期诊断,再到临床金标准诊断,至少可以分为4个阶段或4个场景去做产品的设计和迭代。”

而他认为,从当前的技术来看,“这十几年里很难做到一种技术能够同时解决筛查和诊断的问题。”

“我们的真实的感受是,针对不同场景,我们从样本的采集、样本的处理到建库,再到算法,直至最后模型,这些都是不一样的。”郑杰也类似提及,“而无论是质谱技术,还有影像分析技术或是基因组技术,通过不同技术的搭配,然后再结合样本的采集处理,还有和算法相互结合,我们会有不同的方案去针对不同的场景解决癌症的这样一个大的话题。”

研究团队在论文中还总结提到,这行研究为实现高性价比和高通量的多癌种筛查技术奠定了概念和实践基础。“在不远的未来,该方法的检测成本预估可低于100美元,一个设备齐全的实验室每天可分析超过3000个样本。”

论文链接:https://www.nature.com/articles/s41467-021-26642-9

责任编辑:李跃群

校对:栾梦

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页