5 月
ESMFold 2 超越 AlphaFold 3:11 亿蛋白质结构开源图谱发布,AI for Science 迎来「DeepSeek 时刻」
ESMFold 2 凭什么超越 AlphaFold 3?
Biohub 在 5 月底发布了 ESMFold 2,一个完全开源、Apache 2.0 商用友好的蛋白质结构预测模型。它生成了 11 亿蛋白质结构的开源图谱——是 AlphaFold 数据库(约 2 亿)的 5.5 倍。同时收录了 68 亿蛋白质序列信息。
ESMFold 2 4.1 B 参数的 MONET 模型在 GenEval 基准上得分 0.74,击败了 DALL-E 3 和 12 B 参数的 FLUX.1 Dev。只用对手三分之一参数量就超越,靠的不是算力而是数据质量。
团队已用 ESMFold 2 成功设计新型抗体和抗癌蛋白。实验室验证显示高比例设计按预期工作。还意外发现 CRISPR 微生物防御蛋白与 2023 年土壤真菌基因编辑蛋白在结构上的相似性——这在 AlphaFold 中未被发现。
为什么这是 AI for Science 的里程碑?
AlphaFold 3 虽然强大,但代码和模型权重闭源,商业使用受限。ESMFold 2 以 Apache 2.0 完全开源,意味着任何实验室、制药公司、科研团队都可以免费商用。这是科学开源精神与商业 AI 的正面碰撞。
ESMFold 2 还有一个关键突破:能够设计新的蛋白质而不仅仅是预测已知蛋白质结构。抗体和抗癌蛋白的成功设计证明 AI 不只是”读”生物学,还能”写”生物学。
FAQ
ESMFold 2 可以免费商用吗?
是的。Apache 2.0 许可,完全开源,无商业限制。
ESMFold 2 与 AlphaFold 3 的差距有多大?
在多个蛋白质结构预测基准上 ESMFold 2 超越 AlphaFold 3。4.1 B 参数就达到 GenEval 0.74。数据质量比模型规模更重要。
这对药物研发有什么实际影响?
显著降低蛋白质结构预测和设计的门槛。小团队也能使用开源工具设计新型抗体和蛋白质药物。
作者:智盒(aiKit.vip)| 资讯 · 资源 · 工具 · 导航
{
“@context”: “https://schema.org”,
“@type”: “FAQPage”,
“mainEntity”: [
{
“@type”: “Question”,
“name”: “ESMFold 2 可以免费商用吗?”,
“acceptedAnswer”: {
“@type”: “Answer”,
“text”: “是的。Apache 2.0 许可,完全开源,无商业限制。任何实验室、制药公司、科研团队都可以免费使用和商用。”
}
},
{
“@type”: “Question”,
“name”: “ESMFold 2 与 AlphaFold 3 的差距有多大?”,
“acceptedAnswer”: {
“@type”: “Answer”,
“text”: “在多个蛋白质结构预测基准上 ESMFold 2 已超越 AlphaFold 3。4.1 B 参数就在 GenEval 达到 0.74 分。证明数据质量比模型规模更重要。”
}
},
{
“@type”: “Question”,
“name”: “这对药物研发有什么实际影响?”,
“acceptedAnswer”: {
“@type”: “Answer”,
“text”: “显著降低蛋白质结构预测和设计的门槛。小团队也能使用开源工具设计新型抗体和蛋白质药物。已用于成功设计抗癌蛋白并在实验室验证。”
}
}
]
}






