Google DeepMind 发布 AlphaGenome

2026年1月28日,Google DeepMind 在《Nature》发表论文《Advancing regulatory variant effect prediction with AlphaGenome》(DOI:10.1038/s41586-025-10014-0),并在官方博客更新中给出模型获取入口与代码资源;AlphaGenome 早在2025年6月25日已通过非商业研究用途的API提供预览访问。

AlphaGenome 的核心定位是统一的DNA序列模型:输入最长可达100万碱基对(1 Mb)的DNA序列,在单碱基分辨率下输出上千条功能基因组预测轨迹,并可通过对比突变序列与参考序列的预测差异,对变异影响进行评分。

论文摘要列出的预测模态覆盖基因表达、转录起始、染色质可及性、组蛋白修饰、转录因子结合、染色质接触图谱,以及剪接位点使用与剪接连接(splice junction)坐标/强度等;作者称其目标是缓解既有方法在长序列上下文与高分辨率预测之间的取舍。

开放与使用方式方面,DeepMind 在 GitHub 发布了配套研究代码(含JAX实现与API实现),代码采用 Apache-2.0 许可;预训练权重可在 Kaggle 或 Hugging Face 下载,但需接受非商业模型条款。仓库同时提示本地运行对算力要求较高(例如建议使用H100级别GPU)。

在评测结果上,论文报告:在变异效应预测的26项评估中,AlphaGenome 有25项达到或超过“最强外部模型”的表现;并展示了其在TAL1致癌基因附近的临床相关变异机制复现能力。训练数据方面,DeepMind 表示模型使用了多个公共联盟数据资源(包括 ENCODE、GTEx、4D Nucleome、FANTOM5 等),覆盖人类与小鼠多种细胞类型/组织的调控相关测量信号;其应用重点指向占基因组大部分的非编码调控区域(常被描述为约98%)。

外部反馈与限制方面,多位专家在 Science Media Centre 的评论中强调:模型在若干任务上表现突出,但细胞类型特异性调控仍是挑战,且目前并不适合直接用于临床患者决策;媒体报道也提示其仍需要实验验证、并受训练物种范围等因素限制。

STAT 报道称,AlphaGenome 自2025年6月上线预览以来,已有接近3000名来自160个国家的科研人员通过API进行非商业研究使用,API日调用量约100万次(DeepMind在发布会上对媒体披露)。

Google Deepmind
 
 
Back to Top