Google DeepMind 官宣:Gemini 3 Deep Think模式迎来重大升级

Gemini 3 是 Google DeepMind 目前最智能的通用 AI 模型,主打「将任何想法变为现实」。Gemini 3 Deep Think 是其专用推理模式:针对需要极强逻辑、严谨推导与跨学科知识的「硬核」问题,把思考深度与推理步骤拉满,用于解决最复杂的技术与学术难题。

近日 DeepMind 为 Deep Think 带来重大升级:在保持原有定位的前提下,在数学与算法、科学推理和真实世界工程场景中均有明显提升,多项权威基准刷新或巩固领先。下面从升级定位与具体能力说起。


一、升级定位:更专、更深的「深度思考」模式

本次升级是 对 Gemini 3 专用推理模式(Deep Think)的显著增强,而非对通用对话或多模态的泛化更新;重点始终落在「复杂问题求解」:需要严密推理、突破性创意与高度严谨性的任务都会受益。Gemini 3 Deep Think 面向 Google AI Ultra 订阅用户开放,可在 Gemini 产品内直接选用该模式进行体验。


二、数学与算法:在「最严」的基准上继续突破

升级后的 Deep Think 在数学与算法严谨性上继续往前推进,具体表现可从公开基准中窥见一斑:

  • • 抽象推理ARC-AGI-2(ARC Prize 验证)84.6%,大幅领先同族「Thinking High」及部分友商,抽象规律归纳与迁移优势明显。
  • • 数学2025 IMO 全部 6 题 81.5%,在参与对比的模型中处于领先,高难度数学证明与构造类题目表现突出。
  • • 代码与算法Codeforces(2025 年 4–10 月、中等难度及以上、无工具)Elo 3455,显著高于同门 Pro 与部分竞品,适合算法竞赛与代码推理场景。

本次升级把「数学 + 算法」这条线拉得更稳,适合科研、竞赛与工程中需要严格形式化推理的任务。

图片[1]-Google DeepMind 官宣:Gemini 3 Deep Think模式迎来重大升级-AI Express News

三、科学领域:物理、化学等复杂问题求解

除了数学与代码,Deep Think 在科学问题求解上也有明确加强,从公开评估可知:

  • • 物理2025 IPhO 理论 3 题 87.7%,经独立专家验证达金牌水平
  • • 化学2025 IChO 理论 9 题 82.8%,同样达金牌水平,在对比模型中领先。
  • • 凝聚态CMT-Benchmark50.5%,在「深度推理」类模型中表现突出。

本次升级让 Deep Think 在「科学推理」上更加均衡:不只数学强,物理、化学等需要建模、计算与概念辨析的题目也能系统性处理到较高水平,对科研、教学与竞赛辅导都有参考价值。


四、工程应用:从实验数据到优化问题

升级的另一条主线是真实世界工程能力。官方表述:Deep Think 擅长解读复杂实验数据、通过代码建模物理系统,以及解决复杂优化问题。可归纳为三类:

  1. 1. 复杂实验数据解读:从非结构化或高噪声数据中提炼规律与结论,适合「从数据到结论」的研发与决策场景。
  2. 2. 用代码建模物理系统:将物理/数学模型转为可执行代码并做推理与验证,利于仿真、预测与教学演示。
  3. 3. 复杂优化问题:在约束多、变量多、目标复杂的任务上发挥深度推理与搜索能力,贴近实际工程中的调度、设计与决策需求。

对工程师和研究人员来说,Deep Think 的这次升级相当于在「理论 + 实现」之间架了更稳的桥:既能做严谨推导,也能落到代码与数据层面。


五、多模态与综合推理

多模态理解与综合学术推理上,升级后的 Deep Think 同样保持高位:Humanity's Last Exam(全量文本+多模态)无工具 48.4%、搜索+代码执行 53.4%,在对比的深度推理模型中处于领先;MMMU-Pro81.5%,与同门 Pro 齐平并优于部分友商。Deep Think 不仅在「纯数理」上强,在需要图文结合、检索与代码协作的综合学术任务上也有稳定优势,适合「读题 + 查资料 + 推导 + 验证」的复杂工作流。

图片[2]-Google DeepMind 官宣:Gemini 3 Deep Think模式迎来重大升级-AI Express News

六、小结与使用建议

综合来看,Gemini 3 Deep Think 的这次升级主要集中在三点:数学与算法(IMO、Codeforces、ARC-AGI-2 等基准巩固或刷新领先);科学推理(物理、化学奥赛级与科研级题目达金牌水平,并覆盖凝聚态等专业方向);工程应用(强化对复杂实验数据、物理建模与优化问题的处理能力,更贴近真实研发与工程场景)。

适用人群:需要处理高难度数学/物理/化学题、算法竞赛、科研推导、工程优化与建模的用户,可在 Google AI Ultra 订阅下使用 Gemini 并选择 Deep Think 模式。若工作流中常有「一步错步步错」的推导或设计类任务,不妨把最难的几步交给升级后的 Deep Think 试一把。

<原文链接:https://mp.weixin.qq.com/s/BqKriz9CUWD-b0n_CcdbyQ

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
智瞰全球AI的头像-AI Express News
评论 抢沙发

请登录后发表评论

    暂无评论内容