Gemini 3 是 Google DeepMind 目前最智能的通用 AI 模型,主打「将任何想法变为现实」。Gemini 3 Deep Think 是其专用推理模式:针对需要极强逻辑、严谨推导与跨学科知识的「硬核」问题,把思考深度与推理步骤拉满,用于解决最复杂的技术与学术难题。 近日 DeepMind 为 Deep Think 带来重大升级:在保持原有定位的前提下,在数学与算法、科学推理和真实世界工程场景中均有明显提升,多项权威基准刷新或巩固领先。下面从升级定位与具体能力说起。 本次升级是 对 Gemini 3 专用推理模式(Deep Think)的显著增强,而非对通用对话或多模态的泛化更新;重点始终落在「复杂问题求解」:需要严密推理、突破性创意与高度严谨性的任务都会受益。Gemini 3 Deep Think 面向 Google AI Ultra 订阅用户开放,可在 Gemini 产品内直接选用该模式进行体验。 升级后的 Deep Think 在数学与算法严谨性上继续往前推进,具体表现可从公开基准中窥见一斑: 本次升级把「数学 + 算法」这条线拉得更稳,适合科研、竞赛与工程中需要严格形式化推理的任务。 除了数学与代码,Deep Think 在科学问题求解上也有明确加强,从公开评估可知: 本次升级让 Deep Think 在「科学推理」上更加均衡:不只数学强,物理、化学等需要建模、计算与概念辨析的题目也能系统性处理到较高水平,对科研、教学与竞赛辅导都有参考价值。 升级的另一条主线是真实世界工程能力。官方表述:Deep Think 擅长解读复杂实验数据、通过代码建模物理系统,以及解决复杂优化问题。可归纳为三类: 对工程师和研究人员来说,Deep Think 的这次升级相当于在「理论 + 实现」之间架了更稳的桥:既能做严谨推导,也能落到代码与数据层面。 在多模态理解与综合学术推理上,升级后的 Deep Think 同样保持高位:Humanity's Last Exam(全量文本+多模态)无工具 48.4%、搜索+代码执行 53.4%,在对比的深度推理模型中处于领先;MMMU-Pro81.5%,与同门 Pro 齐平并优于部分友商。Deep Think 不仅在「纯数理」上强,在需要图文结合、检索与代码协作的综合学术任务上也有稳定优势,适合「读题 + 查资料 + 推导 + 验证」的复杂工作流。 综合来看,Gemini 3 Deep Think 的这次升级主要集中在三点:数学与算法(IMO、Codeforces、ARC-AGI-2 等基准巩固或刷新领先);科学推理(物理、化学奥赛级与科研级题目达金牌水平,并覆盖凝聚态等专业方向);工程应用(强化对复杂实验数据、物理建模与优化问题的处理能力,更贴近真实研发与工程场景)。 适用人群:需要处理高难度数学/物理/化学题、算法竞赛、科研推导、工程优化与建模的用户,可在 Google AI Ultra 订阅下使用 Gemini 并选择 Deep Think 模式。若工作流中常有「一步错步步错」的推导或设计类任务,不妨把最难的几步交给升级后的 Deep Think 试一把。一、升级定位:更专、更深的「深度思考」模式
二、数学与算法:在「最严」的基准上继续突破
![图片[1]-Google DeepMind 官宣:Gemini 3 Deep Think模式迎来重大升级-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260214015120263-1771005080-e75b370f5d8fa727ce463afb15e31bd6.png)
三、科学领域:物理、化学等复杂问题求解
四、工程应用:从实验数据到优化问题
五、多模态与综合推理
![图片[2]-Google DeepMind 官宣:Gemini 3 Deep Think模式迎来重大升级-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/02/20260214015124103-1771005084-0b0feef8f1d9bfc13faef40c0fdf21e3.png)
六、小结与使用建议
<原文链接:https://mp.weixin.qq.com/s/BqKriz9CUWD-b0n_CcdbyQ












暂无评论内容