DeepSeek V4 神秘代码曝光，智谱开源最强 Flash，字节扣子 2.0 重磅升级！| AI Weekly 1.19-1.25-AI Express News

这周，国产 AI「杀疯了」！

📢 本周 AI 快讯 | 1 分钟速览🚀

1️⃣ 🔮 DeepSeek V4 或 2 月中旬发布 ：GitHub 代码库出现神秘「MODEL1」标识，技术分析显示新增 Blackwell 架构支持和 Engram 记忆系统，主打更强代码生成能力。

2️⃣ ⚡ 智谱开源 GLM-4.7-Flash ：30B 参数混合思考模型，激活仅 3B，比上代快 40%，SWE-bench 得分 59.2 超越 gpt-oss-20b，32GB Mac 可本地运行。

3️⃣ 🔒 智谱 GLM Coding Plan 限售 ：算力紧张致高峰期限流，1 月 23 日起日销量降至 20%，每日 10:00 刷新额度，已开启自动续订用户不受影响。

4️⃣ 🤖 字节扣子 2.0 品牌升级 ：定位从开发平台转向「职场工作伙伴」，Agent 可执行长周期任务并主动汇报，新增技能商店支持一键安装专项模块。

5️⃣ 🧠 百度文心 5.0 正式版上线 ：2.4 万亿参数原生全模态，激活比例低于 3%，LMArena 文本榜 1459 分位列国内第一、全球第八。

6️⃣ 🎙️ 阿里开源 Qwen3-TTS ：全系列语音合成模型，3 秒音频即可克隆声音，支持 10 种语言，纯语言模型架构实现端到端建模。

7️⃣ 💰 小米 MiMo API 开放充值 ：MiMo-V2-Flash 定价输入 0.7 元/百万 tokens，官方称代码能力比肩 Claude 4.5 Sonnet，成本仅为其 2.5%。

8️⃣ 💻 OpenAI Codex 登陆 JetBrains ：官方集成至全系 IDE，支持 Chat、Agent、Agent (Full Access) 三种模式，JetBrains AI 用户限时免费体验。

9️⃣ 📚 Gemini 上线免费 SAT 模考 ：与普林斯顿评论合作提供题库，模拟自适应格式含计时分节，完成后即时评分并生成个性化学习计划。

🔟 📈 Gemini 提升付费用户配额 ：Thinking 和 Pro 模型分开计算，AI Ultra 用户 Thinking 配额涨至每日 1500 次，较此前提升 3 倍。

01｜DeepSeek 代码库现神秘「MODEL1」标识，V4 或 2 月中旬发布

1 月 20 日，正值 DeepSeek-R1 发布一周年，开发者在 GitHub 上发现 DeepSeek FlashMLA 代码库更新中出现「MODEL1」标识符，横跨 114 个文件，共 28 处提及。代码逻辑显示 MODEL1 与现有 V3.2（内部代号 V32）处于独立分支，技术社区普遍解读为下一代旗舰 DeepSeek-V4 的内部开发代号。

代码分析显示 MODEL1 在 KV Cache 布局、稀疏处理和 FP8 解码方面均有调整。注意力机制 head_dim 从 V3 的 576 维回归至 512 维标准配置，更好对齐 GPU Tensor Core 特性。代码还新增对英伟达 Blackwell（SM100）架构的支持，并出现 Engram 条件记忆系统相关实现。据 The Information 月初报道，V4 预计 2 月中旬农历新年期间发布，主打更强的代码生成能力，内部测试显示在长代码场景可能超越 Anthropic 和 OpenAI。

02｜智谱开源「GLM-4.7-Flash」，30B 参数同级 SOTA

1 月 20 日，智谱发布并开源混合思考模型 GLM-4.7-Flash，总参数 30B，激活参数仅 3B（约 10%）。模型采用 MoE 架构结合动态参数激活，根据任务复杂度灵活调整推理深度，官方称比上一代快 40%，32GB 内存的 Mac 即可本地运行。

在 SWE-bench Verified 代码修复任务中，GLM-4.7-Flash 得分 59.2，超过 gpt-oss-20b 和 Qwen3-30B-A3B-Thinking-2507，在 τ²-Bench 智能体测试中同样领先。模型已上线智谱开放平台 BigModel.cn 免费调用，替代此前的 GLM-4.5-Flash。后者将于 1 月 30 日下线，届时相关请求自动路由至新版本。

03｜智谱「GLM Coding Plan」宣布限售，日销量降至 20%

1 月 21 日，智谱发布公告称 GLM Coding Plan 将于 1 月 23 日起限量发售。随着 GLM-4.7 上线，订阅用户数高速增长导致算力紧张，部分用户在工作日 15:00 至 18:00 高峰期遭遇并发限流报错和响应变慢。限售后每日可购额度降为此前的 20%，每日 10:00 刷新，已开启自动续订的用户不受影响。

智谱同时表示将加强违规账号监测，并正在研发更高效的模型、加速算力扩容。GLM-4.7-Flash 于近日发布并开源，为 30B 参数混合思考模型，激活参数 3B，主打轻量化部署的性能效率平衡。恢复常规销售的时间将另行通知。

04｜字节「扣子 2.0」升级，Agent 可执行长期计划并主动汇报

1 月 19 日，字节跳动 AI Agent 平台扣子（Coze）宣布 2.0 品牌升级。平台诞生于 2024 年 2 月，已服务超 1000 万真实开发场景，新版本定位从「AI Agent 开发平台」转向「职场工作伙伴」，集成 Agent Skills、Agent Plan、Agent Coding、Agent Office 四大能力模块。

Agent Skills 推出技能商店，用户可一键安装「法律类案检索」「投资知识库」等专项模块，行业专家也可将经验封装为可售卖的技能包。Agent Plan 让智能体从单次问答升级为长周期任务执行，能自动拆解目标、持续追踪进度并主动汇报。Agent Office 针对 Word 报告、PPT 制作、Excel 数据处理等职场场景优化。Agent Coding 则升级为一站式云开发平台，支持自然语言对话构建智能体和工作流，一键部署上线。

05｜百度「文心 5.0」正式版上线，2.4 万亿参数原生全模态

1 月 22 日，百度上线 文心大模型 5.0 正式版，距去年 11 月 Preview 版发布约两个月。模型采用超稀疏 MoE 架构，总参数 2.4 万亿，激活比例低于 3%，支持文本、图像、音频、视频的输入与输出。个人用户可在文心 App 和文心一言官网体验，开发者通过千帆平台调用 API。

文心 5.0 与业内常见的「后期融合」方案不同，从训练阶段即将多模态数据在统一自回归架构下联合建模，实现理解与生成一体化。1 月 16 日 LMArena 文本榜显示，文心 5.0 以 1459 分位列国内第一、全球第八，超过 GPT-5.1-High 和 Gemini-2.5-Pro。

06｜阿里千问开源「Qwen3-TTS」，3 秒音频即可克隆声音

1 月 22 日，阿里云通义千问团队开源 Qwen3-TTS 全系列语音合成模型，包含 1.7B（4.54GB）和 0.6B（2.52GB）两种规格，采用 Apache 2.0 协议。模型基于自研多码本语音编码器 Qwen3-TTS-Tokenizer-12Hz，支持实时流式生成，覆盖中、英、日、韩、德、法、俄等 10 种语言。

模型提供三种使用模式。声音克隆，只需 3 秒参考音频即可复制音色；声音设计，可通过自然语言描述生成全新声音，如「低沉的英式男声」；自定义声音，提供 9 个预设高质量音色。相比传统 LM+DiT 架构，Qwen3-TTS 采用纯语言模型架构实现端到端建模，在保留副语言信息的同时支持情感、语速、语调的自适应控制。模型已上线 Hugging Face 和 ModelScope。

07｜小米「MiMo API」开放充值，输入 0.7 元 / 百万 tokens

1 月 20 日，小米 MiMo API 平台正式开放充值功能，计费系统将于近期上线。MiMo-V2-Flash 模型 API 定价如下：国内输入 0.7 元 / 百万 tokens，输出 2.1 元 / 百万 tokens，命中缓存仅 0.07 元；海外输入 0.1 美元 / 百万 tokens，输出 0.3 美元 / 百万 tokens。新老用户可领取免费额度，部分用户已获 20 元赠款。

国内用户充值前需完成个人实名认证，支持小米支付、支付宝、微信；海外用户无需实名，可用 Apple Pay、Google Pay 或信用卡。MiMo-V2-Flash 为总参数 309B、激活 15B 的 MoE 模型，官方称代码能力比肩 Claude 4.5 Sonnet，推理成本仅为其 2.5%。

08｜OpenAI「Codex」登陆 JetBrains IDE，限时免费开放

1 月 22 日，JetBrains 宣布将 OpenAI Codex 集成至旗下 IDE（需 2025.3 及以上版本）。用户可通过 JetBrains AI 订阅、ChatGPT 账号或自带 API Key 三种方式认证使用。Codex 支持 Chat、Agent、Agent (Full Access) 三种交互模式，开发者可自行决定赋予 agent 多少自主权，还能在 IDE 内切换 OpenAI 模型和调整推理预算。

此前 Codex 仅支持 VS Code 及其衍生编辑器，JetBrains 用户长期通过第三方插件曲线使用。本次官方集成后，开发者可在 IDE 内同时调用云端和本地 agent，云端任务在隔离沙盒并行运行，本地则直接操作代码仓库。JetBrains AI 用户目前可限时免费体验，额度用尽后将消耗 AI Credits。Codex 包含在 ChatGPT Plus、Pro、Business、Enterprise 等订阅计划中。

09｜Gemini 上线免费「SAT 模考」，普林斯顿评论提供题库

1 月 21 日，谷歌在 BETT 教育大会宣布 Gemini App 新增 SAT 全真模考功能，与备考机构普林斯顿评论合作提供题库内容。用户输入「I want to take a practice SAT test」即可开始完整测试，模拟数字化 SAT 的自适应格式，包含计时和分节。完成后 Gemini 即时评分，标注优势和薄弱环节，还能逐题解释答案并生成个性化学习计划。

功能面向所有 Gemini App 用户免费开放。去年约 200 万学生参加 SAT，传统备考课程动辄数百美元，Gemini 此举直接切入付费市场。不过题目来自普林斯顿评论而非 College Board 官方，谷歌也未公布模考分数与真实成绩的相关性，实际备考效果有待验证。目前仅支持 SAT，更多考试类型将陆续上线。

10｜Gemini 提升付费用户「用量上限」，Thinking 配额涨 3 倍

1 月 23 日，谷歌宣布提升 Gemini App 付费订阅的每日用量限制。AI Ultra 订阅（249.99 美元/月）现可每天使用 1500 次 Thinking 模型、500 次 Pro 模型；AI Pro 订阅（19.99 美元/月）则为 300 次 Thinking、100 次 Pro。此前两个模型共享配额池，Ultra 用户总共 500 次、Pro 用户 100 次，现在分开计算且 Thinking 配额提升至原来的 3 倍。

调整回应了用户对配额透明度的反馈。Thinking 模型基于 Gemini 3 Flash 优化复杂推理速度，Pro 模型则专攻数学和代码任务，两者使用场景不同，分开计算后用户可更灵活分配。免费用户仍可使用两种模型，但仅有「基础访问」权限。