浙大发布 高精准基因组设计AI模型
创始人
2025-07-14 03:30:39

浙江大学郭国骥教授团队开发出一款用于基因组预测设计的深度学习AI模型“女娲CE”,能够以超过90%的准确率预测基因组调控区域发生突变之后带来的表型变化,并结合疾病表型设计出相应的治疗位点。据悉,相关成果已发表于国际学术期刊《细胞》。

据介绍,基因组由DNA组成,不仅包含蛋白质的编码序列,还包含大量不编码蛋白质的调控序列。这两类序列的协同作用,共同决定了生物体的复杂表型特征。

“读懂生物体的古老遗传‘语言’,是科学家们一直致力于攀登的科学高峰。”郭国骥说,人类基因组计划集全球科学家之力绘制出人类基因图谱,但多年来,科学家对其中的遗传信息的破译还不足10%。近年涌现的AI模型可帮助科学家们进一步快速、系统地理解隐藏在海量基因序列背后的复杂调控语言。

郭国骥团队自主开发了超高通量、超灵敏度的单核染色质可及性测序技术,在这一技术基础上构建了覆盖小鼠、鸡、守宫、蝾螈和斑马鱼五种代表性脊椎动物的全组织调控元件图谱,形成优质“数据库”,并开发出多任务深度学习AI模型“女娲CE”,实现从基因组到细胞图谱的直接预测。

“基于大量优质的数据,‘女娲CE’模型在多项指标上超越现有的基因组AI模型。”郭国骥介绍,“女娲CE”能够预测基因组调控元件发生突变之后对各种细胞类型带来的表型变化,经检测准确率超过90%。

“基于‘女娲CE’预测出的一个镰刀型贫血症治疗性基因位点,我们对该位点进行修改,使得胎儿血红蛋白表达量得到提升。”郭国骥表示,“女娲CE”系列模型将帮助研究人员更好地理解遗传病发生的复杂原因,为生命科学、医学和农学研究提供强大的支撑。

相关内容

热门资讯

湟源:水电暖无忧 乡村展新颜​ 村道平坦宽阔。温暖过冬。寒冬时节,西宁市湟源县乡村呈现新气象。昔日漏风旱厕变身洁净水厕,马桶、淋浴设...
2025年青海新能源产品出口火... 本报讯(西海新闻记者 范程程)1月19日,来自西宁海关的消息,2025年,青海新能源相关产品出口实现...
博时蛇口产园REIT季报解读:... 主要财务指标:季度净利润961万元 年化现金流分派率4.52%2025年第四季度,博时招商蛇口产业园...
青海省2026年征兵全面启动 本报讯 (记者 王煜鹏) 1月21日,记者从省征兵办公室获悉,青海省2026年征兵全面启动。上半年征...
将着力增强数字服务供给 据新华社北京1月21日电 (记者 唐诗凝 周圆) 工业和信息化部信息通信发展司司长谢存21日介绍,“...