生成式AI
一、英伟达DGX Station GB300:数据中心级算力搬上桌面
1. 英伟达DGX Station GB300首批交付,搭载748GB统一内存和FP4精度下最高20petaflops算力,支持万亿参数模型,首台送至前OpenAI创始成员Karpathy手中;
2. 该设备定位为本地构建长时运行自主智能体的开发平台,与数据中心同架构可无缝扩展,英伟达同步推出NemoClaw开源软件栈为OpenClaw提供安全运行环境;
3. 高性能算力正从云端回流桌面,背后驱动力是智能体AI从实验性提示词演变为持续运行系统的趋势转变。
https://mp.weixin.qq.com/s/1LFk8UU6ospjUgu7Oenorg
二、CMU与普林斯顿发布Mamba-3,推理优先的新架构
1. CMU与普林斯顿原班人马发布Mamba-3,在15亿参数规模下平均准确率达57.6%,比Transformer高出4%,端到端推理延迟仅为Transformer的七分之一;
2. 三大核心改进包括指数梯形离散化提升记忆精度、复数值状态空间补齐逻辑推理短板、MIMO机制榨干GPU闲置算力,用一半状态大小达到Mamba-2同等性能;
3. 团队坦承纯SSM在检索任务上仍不如Transformer,提出5:1混合架构方案,与Nemotron-H、Kimi Linear等行业趋势一致,未来最优解大概率是各取所长。
https://mp.weixin.qq.com/s/ydBmqGZ6OBvuIV2Xi6zJcQ
三、小米发布MiMo-V2-Pro,面向Agent时代的旗舰模型
1. 小米发布MiMo-V2-Pro,总参数超1T(42B激活),采用混合注意力架构支持1M超长上下文,在Artificial Analysis全球综合排行榜位列第八、国内第二;
2. 模型针对Agent场景深度优化,在OpenClaw和Claude Code等框架中展现出超越Claude Sonnet 4.6的端到端任务完成能力,API定价仅为Opus 4.6的五分之一;
3. 此前以匿名身份Hunter Alpha上线OpenRouter,调用量多天登顶日榜突破1T tokens,现已联合OpenClaw、Cline等框架提供限时免费接口。
https://mp.weixin.qq.com/s/GWseVZ0yDdewSEOXr1tGTw
四、面壁智能发布EdgeClaw Box,给龙虾装上安全大脑
1. 面壁智能发布EdgeClaw Box智能硬件,内置开源框架EdgeClaw,支持模型与智能体均部署在本地,集成MiniCPM端侧模型实现断网可用、零Token消耗;
2. 核心创新为自研隐私路由中间件,将数据按敏感程度自动分为三级处理:默认云端、脱敏后上云、强制本地,并通过双轨记忆机制杜绝隐私数据通过上下文泄露;
3. 产品定位为OPC群体的数字公司基础设施,已适配英伟达DGX Spark、Mac Mini等主流硬件,开箱即用无需技术部署,企业版已开启预售。
https://mp.weixin.qq.com/s/5awq6K3xjfdgWtT0n8li8Q
五、阶跃星辰发布StepClaw,桌面端一键部署OpenClaw
1. 阶跃AI发布桌面端StepClaw,基于OpenClaw深度优化,支持Windows和Mac双端,无需服务器和命令行即可一键部署,降低智能体使用门槛;
2. 接入拥有5000+创作者和5000+应用资源的水产市场生态,支持Skill、插件、触发器等五类资产,智能体可自动复盘能力缺口并主动搜索补齐短板实现自主进化;
3. 安全层面提供应用资产双重审查、数据本地存储和通用安全配置预装,同时支持个性化形象换肤与灵魂人设定制。
https://mp.weixin.qq.com/s/EWiO_RCJgiTqPzquGMVSDg
六、QQ浏览器上线AI PPT功能,实现文档到演示一键转换
1. QQ浏览器新增AI PPT功能,用户点击右上角AI+按钮或在文档查看器中直接触发,输入指令即可一键生成结构化PPT,无需切换工具;
2. 支持从零搭建汇报框架和从Word、PDF文档中自动提取核心信息转化为PPT,自动生成图表、匹配配图和统一排版;
3. 功能覆盖工作汇报、活动策划、财报分析、求职自我介绍等场景,实现从文档到演示文稿的工作流无缝衔接。
https://mp.weixin.qq.com/s/5YVVcFC26W7MlR8_2nc9_Q
七、Midjourney V8 Alpha发布,从出图模型到图像操作系统
1. Midjourney V8 Alpha上线,核心升级包括原生2K渲染、约5倍生成速度提升和更强的文字渲染能力,但官方将个性化、风格参考和情绪板等控制能力放在了更优先的位置;
2. V8不是V7的平滑升级而是工作流重构,新的sref系统更精准但逻辑不同于旧版,老用户需要重新建立控制习惯,短期内工作流会经历阵痛;
3. 这标志着AI图像工具竞争从单张出图效果转向风格稳定性和工作流承接能力,目标市场从灵感图扩展到品牌视觉和系列化商业生产。
https://mp.weixin.qq.com/s/2eSBnxDqzjuA0nko7vcckw
报告观点
八、GTC巅峰对话:Jeff Dean与Bill Dally纵论AI五年未来
1. 两位首席科学家一致认为推理已取代训练成为重头戏,数据中心90%功耗花在推理上,英伟达正通过重新设计片上片外通信架构将延迟压缩至物理极限,目标实现每用户万级token/s;
2. Jeff Dean认为预训练范式将被重写,未来模型应像AlphaGo一样在环境中主动行动和学习而非被动观察数据流,预训练与后训练的边界长期不会存在;
3. Agent规模化后最大瓶颈不在模型速度而在为人类设计的工具——编译器启动、办公软件响应等将成为Amdahl定律式硬瓶颈,大量工具需要为Agent速度重新工程化。
https://mp.weixin.qq.com/s/yL9YHzyOkgEzL8eVR2K44w
👇加入AGI数据库,AI智能问答
![图片[1]-腾讯研究院AI速递 20260320-AI Express News](https://www.aiexpress.news/wp-content/uploads/2025/10/ba0b11144103938c1b8af70ae02ab732.png)
👇订阅下方合集,获取每日推送
<原文链接:https://mp.weixin.qq.com/s/t6lmC-s3J5uJzFQTRlz0vQ
















暂无评论内容