腾讯研究院AI速递 20260320-AI Express News

生成式AI

一、英伟达DGX Station GB300：数据中心级算力搬上桌面

1. 英伟达DGX Station GB300首批交付，搭载748GB统一内存和FP4精度下最高20petaflops算力，支持万亿参数模型，首台送至前OpenAI创始成员Karpathy手中；

2. 该设备定位为本地构建长时运行自主智能体的开发平台，与数据中心同架构可无缝扩展，英伟达同步推出NemoClaw开源软件栈为OpenClaw提供安全运行环境；

3. 高性能算力正从云端回流桌面，背后驱动力是智能体AI从实验性提示词演变为持续运行系统的趋势转变。

https://mp.weixin.qq.com/s/1LFk8UU6ospjUgu7Oenorg

二、CMU与普林斯顿发布Mamba-3，推理优先的新架构

1. CMU与普林斯顿原班人马发布Mamba-3，在15亿参数规模下平均准确率达57.6%，比Transformer高出4%，端到端推理延迟仅为Transformer的七分之一；

2. 三大核心改进包括指数梯形离散化提升记忆精度、复数值状态空间补齐逻辑推理短板、MIMO机制榨干GPU闲置算力，用一半状态大小达到Mamba-2同等性能；

3. 团队坦承纯SSM在检索任务上仍不如Transformer，提出5:1混合架构方案，与Nemotron-H、Kimi Linear等行业趋势一致，未来最优解大概率是各取所长。

https://mp.weixin.qq.com/s/ydBmqGZ6OBvuIV2Xi6zJcQ

三、小米发布MiMo-V2-Pro，面向Agent时代的旗舰模型

1. 小米发布MiMo-V2-Pro，总参数超1T（42B激活），采用混合注意力架构支持1M超长上下文，在Artificial Analysis全球综合排行榜位列第八、国内第二；

2. 模型针对Agent场景深度优化，在OpenClaw和Claude Code等框架中展现出超越Claude Sonnet 4.6的端到端任务完成能力，API定价仅为Opus 4.6的五分之一；

3. 此前以匿名身份Hunter Alpha上线OpenRouter，调用量多天登顶日榜突破1T tokens，现已联合OpenClaw、Cline等框架提供限时免费接口。

https://mp.weixin.qq.com/s/GWseVZ0yDdewSEOXr1tGTw

四、面壁智能发布EdgeClaw Box，给龙虾装上安全大脑

1. 面壁智能发布EdgeClaw Box智能硬件，内置开源框架EdgeClaw，支持模型与智能体均部署在本地，集成MiniCPM端侧模型实现断网可用、零Token消耗；

2. 核心创新为自研隐私路由中间件，将数据按敏感程度自动分为三级处理：默认云端、脱敏后上云、强制本地，并通过双轨记忆机制杜绝隐私数据通过上下文泄露；

3. 产品定位为OPC群体的数字公司基础设施，已适配英伟达DGX Spark、Mac Mini等主流硬件，开箱即用无需技术部署，企业版已开启预售。

https://mp.weixin.qq.com/s/5awq6K3xjfdgWtT0n8li8Q

五、阶跃星辰发布StepClaw，桌面端一键部署OpenClaw

1. 阶跃AI发布桌面端StepClaw，基于OpenClaw深度优化，支持Windows和Mac双端，无需服务器和命令行即可一键部署，降低智能体使用门槛；

2. 接入拥有5000+创作者和5000+应用资源的水产市场生态，支持Skill、插件、触发器等五类资产，智能体可自动复盘能力缺口并主动搜索补齐短板实现自主进化；

3. 安全层面提供应用资产双重审查、数据本地存储和通用安全配置预装，同时支持个性化形象换肤与灵魂人设定制。

https://mp.weixin.qq.com/s/EWiO_RCJgiTqPzquGMVSDg

六、QQ浏览器上线AI PPT功能，实现文档到演示一键转换

1. QQ浏览器新增AI PPT功能，用户点击右上角AI+按钮或在文档查看器中直接触发，输入指令即可一键生成结构化PPT，无需切换工具；

2. 支持从零搭建汇报框架和从Word、PDF文档中自动提取核心信息转化为PPT，自动生成图表、匹配配图和统一排版；

3. 功能覆盖工作汇报、活动策划、财报分析、求职自我介绍等场景，实现从文档到演示文稿的工作流无缝衔接。

https://mp.weixin.qq.com/s/5YVVcFC26W7MlR8_2nc9_Q

七、Midjourney V8 Alpha发布，从出图模型到图像操作系统

1. Midjourney V8 Alpha上线，核心升级包括原生2K渲染、约5倍生成速度提升和更强的文字渲染能力，但官方将个性化、风格参考和情绪板等控制能力放在了更优先的位置；

2. V8不是V7的平滑升级而是工作流重构，新的sref系统更精准但逻辑不同于旧版，老用户需要重新建立控制习惯，短期内工作流会经历阵痛；

3. 这标志着AI图像工具竞争从单张出图效果转向风格稳定性和工作流承接能力，目标市场从灵感图扩展到品牌视觉和系列化商业生产。

https://mp.weixin.qq.com/s/2eSBnxDqzjuA0nko7vcckw

报告观点

八、GTC巅峰对话：Jeff Dean与Bill Dally纵论AI五年未来

1. 两位首席科学家一致认为推理已取代训练成为重头戏，数据中心90%功耗花在推理上，英伟达正通过重新设计片上片外通信架构将延迟压缩至物理极限，目标实现每用户万级token/s；

2. Jeff Dean认为预训练范式将被重写，未来模型应像AlphaGo一样在环境中主动行动和学习而非被动观察数据流，预训练与后训练的边界长期不会存在；

3. Agent规模化后最大瓶颈不在模型速度而在为人类设计的工具——编译器启动、办公软件响应等将成为Amdahl定律式硬瓶颈，大量工具需要为Agent速度重新工程化。

https://mp.weixin.qq.com/s/yL9YHzyOkgEzL8eVR2K44w

👇加入AGI数据库，AI智能问答

👇订阅下方合集，获取每日推送

<原文链接：https://mp.weixin.qq.com/s/t6lmC-s3J5uJzFQTRlz0vQ

文章版权归作者所有，未经允许请勿转载。

THE END

AI 资讯

腾讯研究院AI速递 20260320

请登录后发表评论