DeepSeek V4 神秘代码曝光,智谱开源最强 Flash,字节扣子 2.0 重磅升级!| AI Weekly 1.19-1.25

这周,国产 AI「杀疯了」!

📢 本周 AI 快讯 | 1 分钟速览🚀

1️⃣ 🔮 DeepSeek V4 或 2 月中旬发布 :GitHub 代码库出现神秘「MODEL1」标识,技术分析显示新增 Blackwell 架构支持和 Engram 记忆系统,主打更强代码生成能力。

2️⃣ ⚡ 智谱开源 GLM-4.7-Flash :30B 参数混合思考模型,激活仅 3B,比上代快 40%,SWE-bench 得分 59.2 超越 gpt-oss-20b,32GB Mac 可本地运行。

3️⃣ 🔒 智谱 GLM Coding Plan 限售 :算力紧张致高峰期限流,1 月 23 日起日销量降至 20%,每日 10:00 刷新额度,已开启自动续订用户不受影响。

4️⃣ 🤖 字节扣子 2.0 品牌升级 :定位从开发平台转向「职场工作伙伴」,Agent 可执行长周期任务并主动汇报,新增技能商店支持一键安装专项模块。

5️⃣ 🧠 百度文心 5.0 正式版上线 :2.4 万亿参数原生全模态,激活比例低于 3%,LMArena 文本榜 1459 分位列国内第一、全球第八。

6️⃣ 🎙️ 阿里开源 Qwen3-TTS :全系列语音合成模型,3 秒音频即可克隆声音,支持 10 种语言,纯语言模型架构实现端到端建模。

7️⃣ 💰 小米 MiMo API 开放充值 :MiMo-V2-Flash 定价输入 0.7 元/百万 tokens,官方称代码能力比肩 Claude 4.5 Sonnet,成本仅为其 2.5%。

8️⃣ 💻 OpenAI Codex 登陆 JetBrains :官方集成至全系 IDE,支持 Chat、Agent、Agent (Full Access) 三种模式,JetBrains AI 用户限时免费体验。

9️⃣ 📚 Gemini 上线免费 SAT 模考 :与普林斯顿评论合作提供题库,模拟自适应格式含计时分节,完成后即时评分并生成个性化学习计划。

🔟 📈 Gemini 提升付费用户配额 :Thinking 和 Pro 模型分开计算,AI Ultra 用户 Thinking 配额涨至每日 1500 次,较此前提升 3 倍。


01|DeepSeek 代码库现神秘「MODEL1」标识,V4 或 2 月中旬发布

1 月 20 日,正值 DeepSeek-R1 发布一周年,开发者在 GitHub 上发现 DeepSeek FlashMLA 代码库更新中出现「MODEL1」标识符,横跨 114 个文件,共 28 处提及。代码逻辑显示 MODEL1 与现有 V3.2(内部代号 V32)处于独立分支,技术社区普遍解读为下一代旗舰 DeepSeek-V4 的内部开发代号。

图片[1]-DeepSeek V4 神秘代码曝光,智谱开源最强 Flash,字节扣子 2.0 重磅升级!| AI Weekly 1.19-1.25-AI Express News

代码分析显示 MODEL1 在 KV Cache 布局、稀疏处理和 FP8 解码方面均有调整。注意力机制 head_dim 从 V3 的 576 维回归至 512 维标准配置,更好对齐 GPU Tensor Core 特性。代码还新增对英伟达 Blackwell(SM100)架构的支持,并出现 Engram 条件记忆系统相关实现。据 The Information 月初报道,V4 预计 2 月中旬农历新年期间发布,主打更强的代码生成能力,内部测试显示在长代码场景可能超越 Anthropic 和 OpenAI。


02|智谱开源「GLM-4.7-Flash」,30B 参数同级 SOTA

1 月 20 日,智谱发布并开源混合思考模型 GLM-4.7-Flash,总参数 30B,激活参数仅 3B(约 10%)。模型采用 MoE 架构结合动态参数激活,根据任务复杂度灵活调整推理深度,官方称比上一代快 40%,32GB 内存的 Mac 即可本地运行。

图片[2]-DeepSeek V4 神秘代码曝光,智谱开源最强 Flash,字节扣子 2.0 重磅升级!| AI Weekly 1.19-1.25-AI Express News

在 SWE-bench Verified 代码修复任务中,GLM-4.7-Flash 得分 59.2,超过 gpt-oss-20b 和 Qwen3-30B-A3B-Thinking-2507,在 τ²-Bench 智能体测试中同样领先。模型已上线智谱开放平台 BigModel.cn 免费调用,替代此前的 GLM-4.5-Flash。后者将于 1 月 30 日下线,届时相关请求自动路由至新版本。


03|智谱「GLM Coding Plan」宣布限售,日销量降至 20%

1 月 21 日,智谱发布公告称 GLM Coding Plan 将于 1 月 23 日起限量发售。随着 GLM-4.7 上线,订阅用户数高速增长导致算力紧张,部分用户在工作日 15:00 至 18:00 高峰期遭遇并发限流报错和响应变慢。限售后每日可购额度降为此前的 20%,每日 10:00 刷新,已开启自动续订的用户不受影响。

图片[3]-DeepSeek V4 神秘代码曝光,智谱开源最强 Flash,字节扣子 2.0 重磅升级!| AI Weekly 1.19-1.25-AI Express News

智谱同时表示将加强违规账号监测,并正在研发更高效的模型、加速算力扩容。GLM-4.7-Flash 于近日发布并开源,为 30B 参数混合思考模型,激活参数 3B,主打轻量化部署的性能效率平衡。恢复常规销售的时间将另行通知。


04|字节「扣子 2.0」升级,Agent 可执行长期计划并主动汇报

1 月 19 日,字节跳动 AI Agent 平台扣子(Coze)宣布 2.0 品牌升级。平台诞生于 2024 年 2 月,已服务超 1000 万真实开发场景,新版本定位从「AI Agent 开发平台」转向「职场工作伙伴」,集成 Agent Skills、Agent Plan、Agent Coding、Agent Office 四大能力模块。

图片[4]-DeepSeek V4 神秘代码曝光,智谱开源最强 Flash,字节扣子 2.0 重磅升级!| AI Weekly 1.19-1.25-AI Express News

Agent Skills 推出技能商店,用户可一键安装「法律类案检索」「投资知识库」等专项模块,行业专家也可将经验封装为可售卖的技能包。Agent Plan 让智能体从单次问答升级为长周期任务执行,能自动拆解目标、持续追踪进度并主动汇报。Agent Office 针对 Word 报告、PPT 制作、Excel 数据处理等职场场景优化。Agent Coding 则升级为一站式云开发平台,支持自然语言对话构建智能体和工作流,一键部署上线。


05|百度「文心 5.0」正式版上线,2.4 万亿参数原生全模态

1 月 22 日,百度上线 文心大模型 5.0 正式版,距去年 11 月 Preview 版发布约两个月。模型采用超稀疏 MoE 架构,总参数 2.4 万亿,激活比例低于 3%,支持文本、图像、音频、视频的输入与输出。个人用户可在文心 App 和文心一言官网体验,开发者通过千帆平台调用 API。

图片[5]-DeepSeek V4 神秘代码曝光,智谱开源最强 Flash,字节扣子 2.0 重磅升级!| AI Weekly 1.19-1.25-AI Express News

文心 5.0 与业内常见的「后期融合」方案不同,从训练阶段即将多模态数据在统一自回归架构下联合建模,实现理解与生成一体化。1 月 16 日 LMArena 文本榜显示,文心 5.0 以 1459 分位列国内第一、全球第八,超过 GPT-5.1-High 和 Gemini-2.5-Pro


06|阿里千问开源「Qwen3-TTS」,3 秒音频即可克隆声音

1 月 22 日,阿里云通义千问团队开源 Qwen3-TTS 全系列语音合成模型,包含 1.7B(4.54GB)和 0.6B(2.52GB)两种规格,采用 Apache 2.0 协议。模型基于自研多码本语音编码器 Qwen3-TTS-Tokenizer-12Hz,支持实时流式生成,覆盖中、英、日、韩、德、法、俄等 10 种语言。

图片[6]-DeepSeek V4 神秘代码曝光,智谱开源最强 Flash,字节扣子 2.0 重磅升级!| AI Weekly 1.19-1.25-AI Express News

模型提供三种使用模式。声音克隆,只需 3 秒参考音频即可复制音色;声音设计,可通过自然语言描述生成全新声音,如「低沉的英式男声」;自定义声音,提供 9 个预设高质量音色。相比传统 LM+DiT 架构,Qwen3-TTS 采用纯语言模型架构实现端到端建模,在保留副语言信息的同时支持情感、语速、语调的自适应控制。模型已上线 Hugging Face 和 ModelScope。


07|小米「MiMo API」开放充值,输入 0.7 元 / 百万 tokens

1 月 20 日,小米 MiMo API 平台正式开放充值功能,计费系统将于近期上线。MiMo-V2-Flash 模型 API 定价如下:国内输入 0.7 元 / 百万 tokens,输出 2.1 元 / 百万 tokens,命中缓存仅 0.07 元;海外输入 0.1 美元 / 百万 tokens,输出 0.3 美元 / 百万 tokens。新老用户可领取免费额度,部分用户已获 20 元赠款。

图片[7]-DeepSeek V4 神秘代码曝光,智谱开源最强 Flash,字节扣子 2.0 重磅升级!| AI Weekly 1.19-1.25-AI Express News

国内用户充值前需完成个人实名认证,支持小米支付、支付宝、微信;海外用户无需实名,可用 Apple Pay、Google Pay 或信用卡。MiMo-V2-Flash 为总参数 309B、激活 15B 的 MoE 模型,官方称代码能力比肩 Claude 4.5 Sonnet,推理成本仅为其 2.5%。


08|OpenAI「Codex」登陆 JetBrains IDE,限时免费开放

1 月 22 日,JetBrains 宣布将 OpenAI Codex 集成至旗下 IDE(需 2025.3 及以上版本)。用户可通过 JetBrains AI 订阅、ChatGPT 账号或自带 API Key 三种方式认证使用。Codex 支持 Chat、Agent、Agent (Full Access) 三种交互模式,开发者可自行决定赋予 agent 多少自主权,还能在 IDE 内切换 OpenAI 模型和调整推理预算。

图片[8]-DeepSeek V4 神秘代码曝光,智谱开源最强 Flash,字节扣子 2.0 重磅升级!| AI Weekly 1.19-1.25-AI Express News

此前 Codex 仅支持 VS Code 及其衍生编辑器,JetBrains 用户长期通过第三方插件曲线使用。本次官方集成后,开发者可在 IDE 内同时调用云端和本地 agent,云端任务在隔离沙盒并行运行,本地则直接操作代码仓库。JetBrains AI 用户目前可限时免费体验,额度用尽后将消耗 AI Credits。Codex 包含在 ChatGPT Plus、Pro、Business、Enterprise 等订阅计划中。


09|Gemini 上线免费「SAT 模考」,普林斯顿评论提供题库

1 月 21 日,谷歌在 BETT 教育大会宣布 Gemini App 新增 SAT 全真模考功能,与备考机构普林斯顿评论合作提供题库内容。用户输入「I want to take a practice SAT test」即可开始完整测试,模拟数字化 SAT 的自适应格式,包含计时和分节。完成后 Gemini 即时评分,标注优势和薄弱环节,还能逐题解释答案并生成个性化学习计划。

图片[9]-DeepSeek V4 神秘代码曝光,智谱开源最强 Flash,字节扣子 2.0 重磅升级!| AI Weekly 1.19-1.25-AI Express News

功能面向所有 Gemini App 用户免费开放。去年约 200 万学生参加 SAT,传统备考课程动辄数百美元,Gemini 此举直接切入付费市场。不过题目来自普林斯顿评论而非 College Board 官方,谷歌也未公布模考分数与真实成绩的相关性,实际备考效果有待验证。目前仅支持 SAT,更多考试类型将陆续上线。


10|Gemini 提升付费用户「用量上限」,Thinking 配额涨 3 倍

1 月 23 日,谷歌宣布提升 Gemini App 付费订阅的每日用量限制。AI Ultra 订阅(249.99 美元/月)现可每天使用 1500 次 Thinking 模型、500 次 Pro 模型;AI Pro 订阅(19.99 美元/月)则为 300 次 Thinking、100 次 Pro。此前两个模型共享配额池,Ultra 用户总共 500 次、Pro 用户 100 次,现在分开计算且 Thinking 配额提升至原来的 3 倍。

图片[10]-DeepSeek V4 神秘代码曝光,智谱开源最强 Flash,字节扣子 2.0 重磅升级!| AI Weekly 1.19-1.25-AI Express News

调整回应了用户对配额透明度的反馈。Thinking 模型基于 Gemini 3 Flash 优化复杂推理速度,Pro 模型则专攻数学和代码任务,两者使用场景不同,分开计算后用户可更灵活分配。免费用户仍可使用两种模型,但仅有「基础访问」权限。


我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。

关注「AI信息Gap」,让 AI 成为你的外挂。


图片[11]-DeepSeek V4 神秘代码曝光,智谱开源最强 Flash,字节扣子 2.0 重磅升级!| AI Weekly 1.19-1.25-AI Express News
图片[12]-DeepSeek V4 神秘代码曝光,智谱开源最强 Flash,字节扣子 2.0 重磅升级!| AI Weekly 1.19-1.25-AI Express News

<原文链接:https://mp.weixin.qq.com/s/WXLp9DNgm0UUTicsevCKUA

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容