将 ScienceAI 设为星标
第一时间掌握
新鲜的 AI for Science 资讯
![动态黑色音符 图片[1]-Protenix-v1发布:首个超越AlphaFold 3性能的开源结构预测模型-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/12/20251218074253324-1766014973-00be493474a13d5da8d80458eb06dc9a.gif)
![图片[2]-Protenix-v1发布:首个超越AlphaFold 3性能的开源结构预测模型-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260212003233714-1770827553-7503991e4f563e51b3b03baabb66178d.png)
在 AlphaFold 3 (AF3) 问世后,尽管开源社区迅速跟进(如 Chai-1, Protenix, Boltz-1 等),但在严格对齐训练数据和模型规模的前提下,开源模型与AF3之间始终存在着「性能鸿沟」。
近日,字节跳动 ByteDance Seed 团队发布了最新技术报告,推出了 Protenix-v1。这是一项里程碑式的工作:Protenix-v1 是首个在严格限制训练数据截止时间(2021 年 9 月 30 日)、模型参数量和推理预算的情况下,性能达到甚至超越 AlphaFold 3 的完全开源模型 。
打破「复刻魔咒」:严格对齐下的 SOTA 性能
目前的开源复刻模型往往难以进行公平比较——有的使用了更多的数据,有的使用更多参数。为了证明开源模型与 AF3 之间不存在根本性的技术壁垒,Protenix-v1 采取了极其严格的对照实验设计:
数据截止时间严格锁定在 2021 年 9 月 30 日(与 AF3 一致);
模型规模与推理预算完全对齐。
在这一「受控条件」下,Protenix-v1 在多个基准测试中表现强劲。
技术报告指出,现有的 FoldBench 基准存在数据覆盖不全和统计方差大的问题,导致跨模型比较不可靠 。Protenix 团队构建了一个 FoldBench-Corrected 子集,确保所有模型在相同的样本交集上进行评估。
结果显示: 在 FoldBench 修正集上,Protenix-v1 在蛋白质-蛋白质(Protein-Protein)和抗体-抗原(Ab-Ag)复合物预测上均优于 AlphaFold 3,同时大幅领先于 Chai-1、Boltz-1、Protenix-v0.5.0 等现有的开源模型 。
![图片[3]-Protenix-v1发布:首个超越AlphaFold 3性能的开源结构预测模型-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260212003235458-1770827555-f21c103bdd3eca5ad83ca806387b3292.png)
关键突破:Inference-Time Scaling(推理时扩展)
Protenix-v1 最引人注目的特性之一,是其推理时 Scaling 行为。
在 LLM 领域,Scaling Law 已是共识。而在结构预测领域,AF3 曾展示过通过增加采样数量(seeds)来提升性能的特性,但此前的开源模型大多未能复现这一能力。
Protenix-v1 成功解锁了这一技能点。报告数据显示,随着采样预算从基线水平增加到数百个候选样本,Protenix-v1 的预测准确率呈现出一致的、近似对数线性的提升。
抗体-抗原复合物(Ab-Ag)预测是当下最有挑战的结构预测问题之一。当使用多个 seeds 进行推理时,Protenix-v1 的 DockQ 成功率从单 seed 的 36.01% 飙升至 42.92%,80 Seeds 时更达到 47.68%。这意味着,用户获得了一个可调节的「控制旋钮」:在计算成本和预测精度之间进行权衡,这对于药物发现等高价值场景至关重要。
![图片[4]-Protenix-v1发布:首个超越AlphaFold 3性能的开源结构预测模型-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260212003237798-1770827557-0fe84f4f17bae8b29890a4aa09082d3e.png)
双版本策略:学术对标 vs 实战应用
为了解决「学术复刻」与「实际应用」之间的矛盾,Protenix 采取了明智的双版本发布策略 :
Protenix-v1 (标准版本):
定位:学术基准对齐。
数据截止:和 Alphafold 3 对齐,2021 年 9 月 30 日。
作用:证明模型架构和算法的有效性,确保与 AF3 的公平比较。
Protenix-v1-20250630 (数据扩展版本):
定位:真实世界应用(如药物发现)。
数据截止:2025 年 6 月 30 日,包含了最近几年发布的新结构。
优势:利用了最新的结构数据(包括 2022-2025 年发布的新靶点),在 PXM-2025H2 等新数据集上表现更佳,特别是在抗体-抗原任务上显著优于标准版本 。
这一策略让研究人员既能验证算法,又能直接上手最新的模型处理当前的实际问题。
全面升级的新 feature
除了模型本身,Protenix-v1 还提供了有价值的新 feature:
蛋白质模板(Templates):采用了类似 AF3 的策略,整合了模板信息,不仅提升了准确率,还使训练过程中的模型激活更加稳定。
支持RNA MSA:集成了 RNA 多序列比对,显著提升了 RNA 相关任务的表现。消融实验显示,移除 RNA MSA 会导致蛋白质-RNA 接口预测性能下降。
建立更充分、更透明的评估标准:PXMeter
针对当前生物分子结构预测领域基准测试(Benchmark)混乱、数据覆盖不一致等问题,Protenix 团队不仅发布了模型,还推出了一套完整的评估工具和数据集——PXMeter。
团队构建了按年份划分的测试集 PXM-2024 和 PXM-2025,可以用于评测模型在不同年度数据的表现。针对数据稀疏的抗体、小分子任务,构建了横跨 4 年的评测集 PXM-22to25-Antibody and PXM-22to25-Ligand。在这些更全面、数据量更大的测试集上,Protenix-v1 均展现出了优于 Chai-1 和 Boltz-1 的 SOTA 性能。
更多探索:Protenix-Mini 系列的「轻量级」突围
在追求极致精度的同时,Protenix 团队并没有忽视高通量场景的需求。他们之前发布的技术报告中还披露了在轻量化模型上的探索——Protenix-Mini 和 Protenix-Mini+。
针对需要极高推理速度的场景,Protenix-Mini 系列进行了大胆的架构瘦身:
极致轻量:通过精简模型结构和引入 Linear Attention(线性注意力机制),大幅降低了计算复杂度。
极速推理:在保持一定精度的前提下,实现了推理速度的质变,特别适合大规模筛选任务。
单序列推理:使用蛋白质语言模型替代 MSA 特征,避免了 MSA 搜索引入的巨大时间开销。
设计领域的「筛选器」:在蛋白质结合体(Binder)设计的验证中,Protenix-Mini 系列展现出了不俗的筛选能力(Filtering Capability)。
报告中的 Filter Results 显示,Protenix-Mini 系列在区分「结合」与「不结合」设计时的 AUC 分数甚至优于部分大模型 。这意味着在 binder 设计筛选环节,研究人员可以利用 Mini 版本快速过滤海量候选序列,再用 Protenix-v1 进行精细验证,打出一套高效的「组合拳」。
总结
Protenix-v1 的发布,标志着开源生物分子结构预测模型正式进入了「后 AlphaFold 3 时代」。它不仅是首个在严格限制条件下性能对标 AF3 的开源模型,更关键的是,它成功将 AF3 核心的「推理时 Scaling」能力带入了开源世界,为结构预测开源领域填补了最后一块拼图。
对于致力于 AI for Science、特别是大分子药物设计的社区来说,Protenix-v1 提供了一个强大、透明且实用的新基座。
相关链接:https://www.biorxiv.org/content/10.64898/2026.02.05.703733v1
人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。
<原文链接:https://mp.weixin.qq.com/s/zGo3Aerzo0wh1SRlmYkItQ















暂无评论内容