「gemini。」
谷歌 AI Studio 产品负责人 Logan Kilpatrick 昨晚发了这么一条平平无奇的推文。
![图片[1]-谷歌「新牛马」上线:Gemini 3.1 Flash-Lite,专干苦力活,成本砍半!-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260304195247939-1772625167-8e96905cbaa50182ae3e48ba2ae76515.png)
这是谷歌的老传统了,上新前都要整点儿「花活」。
有网友推测 Gemini 3.1 Flash 要来了。
结果今天来的不是 Flash,是 Flash-Lite。
谷歌 Gemini 家族里,Pro 是旗舰,Flash 是主力,Flash-Lite 是最底层的牛马。
Gemini 3.1 Flash-Lite 就是谷歌刚刚发布的「新牛马」。
![图片[2]-谷歌「新牛马」上线:Gemini 3.1 Flash-Lite,专干苦力活,成本砍半!-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260304195250731-1772625170-082ff6935a6d2161cfa8310f3f3f42af.png)
这个新牛马很「快」。
Gemini 2.5 Flash 输出速度 249 tokens/秒。Gemini 3.1 Flash-Lite 363,快 45%。首 token 响应快 2.5 倍。
跟上一代 2.5 Flash-Lite 的 366 基本持平,但实力提升了一个档次。
同级别的轻量模型 GPT-5 Mini 71,Claude 4.5 Haiku 108,Grok 4.1 Fast 145。
价格比 2.5 Flash-Lite 要贵不少。
输入 0.25 美元/百万 tokens,输出 1.50 美元/百万 tokens。
但比 Claude 4.5 Haiku(输入 1.00 美元、输出 5.00 美元),GPT-5 Mini(输入 0.25 美元、输出 2.00 美元)又要便宜一些。
![图片[3]-谷歌「新牛马」上线:Gemini 3.1 Flash-Lite,专干苦力活,成本砍半!-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260304195252718-1772625172-52dbd587e9d17f9bf00bbfbc66879ed9.png)
不只是快。这头牛马比上一代主力 Gemini 2.5 Flash 更「强」。
GPQA Diamond(博士级科学知识)86.9%,2.5 Flash 82.8%。
MMMU-Pro(多模态理解)76.8%,2.5 Flash 66.7%。
LiveCodeBench(代码生成)72.0%,2.5 Flash 62.6%。
MMMLU(多语言问答)88.9%,同级别最高。
SimpleQA(事实准确性)43.3%,2.5 Flash 只有 28.1%。
![图片[4]-谷歌「新牛马」上线:Gemini 3.1 Flash-Lite,专干苦力活,成本砍半!-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260304195254776-1772625174-cfe181cb6ebedebaa07fc413c8e53e54.png)
划重点,这里面参与对比的都是轻量级「小」模型,比如 GPT-5 Mini,Claude 4.5 Haiku 和 Grok 4.1 Fast。
毕竟只是 Flash-Lite,和最顶级模型还是没法比的。
所以,Flash-Lite 的定位从来不是「和你聊天」,而是「干苦力」。
比如翻译、内容审核、客服系统、数据清洗。
它们的特点是量大,单次任务简单。
以前用 2.5 Flash-Lite,便宜但质量一般。现在 3.1 Flash-Lite 质量追平了 2.5 Flash,成本还砍了一半。
另外,3.1 Flash-Lite 支持推理了。
一共四档「Minimal、Low、Medium、High」,可以根据任务复杂度自行调整推理深度。
比如分类提取、翻译这种简单活用 Minimal 就够了,速度拉满。
还有一个更有意思的玩法。
你可以用 Flash-Lite 当模型路由器,让它判断任务复杂度,简单活自己干,复杂任务就转发给 Flash 或 Pro。
和 Claude Code 里的任务分发理念类似,简单搜索都是 Claude Haiku 干的。
Gemini 3.1 Flash-Lite 目前是预览版,模型 ID gemini-3.1-flash-lite-preview。
划重点,只能通过 API 调用,没在 Gemini App 上线。
所以最推荐的自然还是 AI Studio。
量大管饱,还免费。
![图片[5]-谷歌「新牛马」上线:Gemini 3.1 Flash-Lite,专干苦力活,成本砍半!-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260304195257954-1772625177-28a842972aad55f61680738b38f78fbc-scaled.png)
Flash-Lite,肯定不是「最强」,但可能是「最划算」的。
我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。
关注「AI信息Gap」,让 AI 成为你的外挂。
![图片[6]-谷歌「新牛马」上线:Gemini 3.1 Flash-Lite,专干苦力活,成本砍半!-AI Express News](https://www.aiexpress.news/wp-content/uploads/2026/03/20260304195302705-1772625182-3487e7c2564148528b6308d033e9b89f-scaled.png)
<原文链接:https://mp.weixin.qq.com/s/q8Wm_z_gnC041Bxg2OgmWQ


















暂无评论内容