炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
近期,英国牛津大学团队连续开发出两项互补的测序纠错系列技术,“同源三聚体标记”(测序后纠错)和“锚固增强”(测序前纠错)技术,分别从分子标记设计和合成源头两个层面出发,协同提升单细胞长读长测序的准确性。
通过扩增核苷酸三倍,课题组设计了同源三聚体分子标记,并开发了实验和计算分析流程。
研究人员从密码学汲取灵感,提出了一套适用于同源三聚体分子标记的研究体系:
1. 实验和计算分析版本(即本次受访内容);
2. 计算工具和平台(UMIche,目前在审稿中),提供了关键性的测序性能分析和验证指标;
3. 理论推导(预印版)[3]。
目前,同源三聚体标记已发展成为相对较全地具有上下游分析配合的测序技术方案。
在论文投稿过程中,业内专家点评称在单细胞长读长测序和体细胞变异检测中,这项技术将会大有可为。并认为该团队使用“通用分子标记,CMI”在实验端做验证的策略,是一种巧妙的点子(ingenious idea)。其还指出在目前的论文中,课题组所提供的纠错场景可能局限了这一方法的潜力,事实上它能被用于更加复杂的纠错场景中,例如插入和缺失错误。
基于这一技术,该团队创办了一家名为 Entelo Bio(前身为 Caeruleus Genomics)的生物科技公司,希望能够革新已有的测序技术。
目前,本次成果依旧存在生产成本高以及合成偶联率低等局限,这让同源三聚体的量产依旧面临着不少挑战。
因此,研究人员正在携手业界合作方,探索实现量产的可能性。
在计算上和实验上,本次技术的先进性均得到了验证。假如可以实现量产,它能快速、精确地检出肿瘤生物标志物,也能通过催化方法找到新的药物分子,并优化其结构的速度,并能成为业界一个重要且独立的商业运行单元。
据介绍,测序技术对于理解复杂的生命科学现象以及阐释疾病致病机理是一种重要手段。
测序时,通常使用一个名为“分子唯一标记码”的序列,来标记待测物的身份。
但是,这段序列是随机合成,并且也会出现测错的情况,所以在测序之后的纠错就会变得非常困难。
而本次研究的开展始于一项临时实验的提议。德国慕尼黑工业大学博士、英国牛津大学博士后孙鉴锋,是本次论文的第一作者。
当他刚到牛津大学报道的第一天,合作教授亚当·克里布斯(Adam P. Cribbs)刚好于同一天刊发了一篇关于第三代测序纠错技术(scCOLOR-seq)的论文。于是,两人的不少谈话内容都涉及到了测序纠错这一话题。
当天,克里布斯教授在身旁的白板上比划了几下,写下几个二重和三重同源核苷酸字符,并对孙鉴锋说:“我对量子计算很感兴趣,但是我没有相关的理论和计算背景,这个项目难度未知,但我觉得实验上大体可行,数理计算是你的专长,你也许可以做出一番不一样的工作来,要不要试试?”
密码学和信息论算是孙鉴锋本科期间重点专业课之一,他立刻意识到克里布斯教授模棱两可的地方正是著名加密方法“三重冗余模块”算法扩展到非二元系统的应用问题,因此他觉得“可以动工”。
彼时,著名的牛津纳米孔测序技术还没有迭代到最新版本,平均错误率依旧高达 15% 左右,在特定情形下错误率甚至会迅猛激增。
因此,要想在这么高的错误率之下进行纠错,并能实现精准测序着实让人望而却步,在该团队眼中必须得有“妙手回春”的技术才行。
通过开发和验证完整的实验和计算方法,他们最终有效提升了测序技术的精度。
该系列研究的第一项成果“同源三聚体标记”技术的相关论文以《纠正唯一分子标识符中的 PCR 扩增错误,以生成准确数量的测序分子》(Correcting PCR amplification errors in unique molecular identifiers to generate accurate numbers of sequencing molecules)为题发在Nature Methods[1]。
图 | 相关论文(来源:Nature Methods)孙鉴锋是第一作者,牛津大学教授亚当·克里布斯(Adam P. Cribbs)担任通讯作者。
图 | 孙鉴锋(来源:孙鉴锋)在论文被预接收之时,Nature Methods编辑团队表示,打算邀请第三方专家为本次研究额外撰写一个评论并发表在Nature Methods上。
在那篇评论文章中,由一名 RNA 测序精度方面的顶尖专家之一对本次论文做了简评。
“其实,在更早之前的审稿阶段,他就对我们的成果持积极态度。”研究人员表示。另一位业内同行则评论称:“该技术理论层面的可靠性,在其他领域中也已经得到了验证和支持”。
研究人员表示,当采用逆转录来合成 RNA 序列的时候,会引入一些错误,而本次测序技术解决了这一问题。
在“同源三聚体标记”技术发表之后,课题组又讨论了这样一个问题:难道测序之后的序列错误,仅仅是在测序过程中引入的吗?假如在对唯一分子标识符进行测序之前出现问题了怎么办?
这个问题的产生源自于该研究团队在一次单细胞测序实验后对文库中分子数量的异常检测:他们观察到细胞条形码的多样性增多,而分子标记(又称分子条形码)的多样性减少。于是,他们怀疑测序文库的污染可能跟序列的异常截短或是缩进有关。
针对这一问题,该团队又开展了新的研究,借此发现在测序之前:由于微珠上多聚核苷酸 T 的缩进从而导致分子标记被截短,使得微珠上整条序列合成出现问题。
针对此,他们提出一种名为“锚固增强”的技术,将一段由 4 个核苷酸组成的固定序列置于细胞条形码和分子标记之间,从而有效识别分子标记起始位置。
这个设计方案能够侦测到比以往更多的 RNA 分子量,为难以侦测到罕见病致病基因的问题提供了新的思路和机遇。
该系列研究的第二项成果“锚固增强”技术的相关论文以《利用插入式锚固寡核苷酸序列提升单细胞转录组学分析》(Enhancing single-cell transcriptomics using interposed anchor oligonucleotide sequences)为题发在Communications Biology[2]。
图 | 相关论文(来源:Communications Biology)在后续计划上:
一方面,鉴于本次技术的可靠性已经得到验证,但是距离批量化生产和应用还有一定距离,因此他们将尝试增强合成同源三聚体的效率,以及优化其在微珠的附着效率,同时也会寻找更多合适的业界合作伙伴。
另一方面,尽管研究团队已经开展过多种计算分析,但是目前领域内依旧没有系统化的计算分析方法和平台。所以,他们会持续开发新的计算应用方法。
如果以上两项计划都能实现,这两项分别用于测序前和测序后纠错的系列技术将有望在揭示罕见病致病机理上进行协同贡献,也有望在已有的疾病知识体系之下挖出新的知识。
参考资料:
1. Sun, J., Philpott, M., Loi, D. et al. Correcting PCR amplification errors in unique molecular identifiers to generate accurate numbers of sequencing molecules.Nat Methods21, 401–405 (2024). https://doi.org/10.1038/s41592-024-02168-y
2. Sun, J., Philpott, M., Loi, D. et al. Enhancing single-cell transcriptomics using interposed anchor oligonucleotide sequences.Commun Biol8, 67 (2025). https://doi.org/10.1038/s42003-025-07474-5
3.https://www.researchsquare.com/article/rs-6710367
运营/排版:何晨龙