腾讯研究院AI速递 20260306-AI Express News

生成式AI

一、GPT-5.4核心内幕曝光：极限推理与百万token上下文

1. GPT-5.4已在LMArena和Codex内部进行A/B测试，通过错误日志、GitHub PR和员工截图被多次意外泄露，测试版一次提示可生成6000+行代码；

2. The Information爆料GPT-5.4将配备极限推理模式（Extreme Reasoning Mode），上下文窗口从40万翻倍至100万tokens，追平Gemini和Claude；

3. 最引人注目的传闻是GPT-5.4可能实现永久记忆（持久状态），疑似结合SSM与Transformer架构，坊间甚至称上下文或超预期。

https://www.aiexpress.news/50089.html

二、谷歌发布Workspace官方CLI，一行命令操作全线产品

1. Google Workspace CLI上线GitHub，覆盖Drive、Gmail、Calendar、Sheets、Docs等全部Workspace产品，所有输出均为JSON格式；

2. 工具实时读取谷歌API目录自动生成命令，支持MCP Server模式一行命令启动，内置100多个SKILL.md文件和50个常用操作配方，可直接被Claude Code等Agent调用；

3. 仓库包含专为AI编程助手编写的AGENTS.md贡献指南，支持Google Cloud Model Armor防注入攻击，当前版本v0.3.4仍在活跃开发中。

https://www.aiexpress.news/50105.html

三、谷歌与OpenAI同日发布轻量新模型，主打速度与体验

1. 谷歌推出Gemini 3.1 Flash-Lite，定价输入0.25美元/百万tokens，首token响应比2.5 Flash快2.5倍，输出速度提升45%，Arena Elo评分达1432；

2. OpenAI发布GPT-5.3 Instant，主打对话体验优化，联网幻觉率降低26.8%，减少不必要拒答和免责声明，写作能力和语气自然度显著提升；

3. OpenAI发布同时暗示GPT-5.4即将到来，GPT-5.2 Instant将于2026年6月3日正式下线。

https://www.aiexpress.news/50116.html

四、谷歌NotebookLM大更新，PPT一键生成影视级视频

1. NotebookLM发布影院级视频概览功能，由Gemini 3担任总导演把控叙事逻辑、Nano Banana Pro负责生成创意图片、Veo 3制作流畅动画和音效，三模型协同工作；

2. 新版支持一个笔记本存储多个同类型产出，可为不同语言、不同岗位定制专属版本，并支持多任务处理——一边听音频一边看思维导图；

3. 界面改版为音频、视频、思维导图、报告四大区块，功能将在未来几周陆续发布，目前已向Ultra用户推出英文版。

https://www.aiexpress.news/50130.html

五、MiniMax Music 2.5+发布，纯音乐创作覆盖全场景

1. MiniMax Music 2.5+新增纯音乐创作能力，支持古典管弦、极简主义、电子、氛围音、自然声景等多元风格，覆盖冥想助眠、广告配乐、游戏影视等场景；

2. 模型具备强大的跨风格融合能力，可将东方民族乐器与西方管弦乐自然融合，对笛子、琵琶、古筝等中国传统乐器的音色还原处于行业领先水平；

3. 单一模型即可处理从纯自然声到多轨器乐编排的完整复杂度，声场三频分明，已开放C端产品体验和API接口。

https://www.aiexpress.news/50136.html

前沿科技

六、宇树春晚武BOT论文发布，OmniXtreme架构同步开源

1. 宇树发布春晚武BOT技术论文（王兴兴署名），提出OmniXtreme双阶段框架：流匹配预训练构建统一动作策略，执行器感知后训练弥合仿真与现实鸿沟；

2. 真机测试完成157次独立试验覆盖24种高动态极限动作，后空翻成功率达96.36%，端到端推理延迟控制在10毫秒，全部在宇树G1机载Orin NX芯片上原生执行；

3. 架构已同步开源，通过写实驱动器建模、激进域随机化和功率安全正则化，首次解决了高保真动作追踪与多动作可扩展性之间的长期权衡难题。

https://www.aiexpress.news/50139.html

报告观点

七、外媒称OpenClaw在中国AI圈的发酵速度远超硅谷想象

1. 字节、阿里、腾讯已在各自云平台上线OpenClaw服务，开发者可直接在云端运行Agent，而AWS、Azure、Google Cloud三家美国云巨头尚未跟进；

2. 中国创业者围绕OpenClaw爆发式创新，春节黑客马拉松涌现AI相亲平台、AI招聘网站、AI旅行日志等Agent应用，有产品经理用11台二手MacBook组建AI内容创作军团；

3. OpenClaw的影响已从软件溢出到硬件领域，广州初创公司实现通过Agent远程控制充电设备，创业者认为这是中国AI行业一次「不可逆的冲击」。

https://www.aiexpress.news/50155.html

八、Anthropic CEO：Scaling Law没撞墙，甚至将激进加速

1. Dario Amodei在摩根士丹利会议上用棋盘稻米寓言类比AI发展，称当前正处于第40格，前39格的所有震撼加在一起不过是后24格的零头；

2. 代码生成是AI能力爆发的最强领先指标，Anthropic端到端生产效率已翻两到三倍，模型开始搭建工具和脚手架改进自身工作流，递归式自我改进（RSI）初现端倪；

3. 面对Meta开出1亿至5亿美元挖角单个研究员的天价，Anthropic仅流失两人，7位联合创始人至今全部在职，Dario强调「技术可以买，文化买不到」。

https://www.aiexpress.news/50156.html

九、Altman对话硅谷著名投资人：2035年将进入极度通缩经济体

1. Sam Altman在IIT Delhi对话中表示，AI同等智能水平的成本18个月内下降约1000倍，智能成本将持续趋近于零，GDP将因AI通缩效应变成糟糕的衡量指标；

2. Altman认为科学进步和经济引擎将被同时自动化，代码领域的变革将以相同模式复制到金融、医疗、法律等所有行业，最被低估的机会是「零人公司」；

3. Vinod Khosla预言2035年世界将进入极其通缩的经济体，双方共同强调能动性（agency）和好奇心是AI时代最重要的元技能，年轻人应学会用工具而非听老一辈的职业建议。

https://www.aiexpress.news/50169.html

十、图灵奖得主Knuth发论文致谢Claude，一小时攻克数周难题

1. 88岁图灵奖得主Don Knuth发表论文《Claude's Cycles》，记录Claude Opus 4.6在约一小时内通过31次探索，解决了他研究数周未果的三维环面图哈密顿环分解问题；

2. Claude发明了「蛇形模式」并从失败的模拟退火结果中提取隐藏规律，找到适用于所有奇数维度的通用构造方法，Knuth据此证明共存在760种同类分解方案；

3. 三年前称AI"让胡话听上去像真的"的Knuth坦言"得修正对生成式AI的看法"，偶数情况后由GPT-5.3-codex解决，Claude解奇数、GPT解偶数，两个AI各解半题。

https://www.aiexpress.news/50173.html

<原文链接：https://mp.weixin.qq.com/s/eXoJY908cgSvtz_idt_LwA

文章版权归作者所有，未经允许请勿转载。

THE END

AI 资讯

腾讯研究院AI速递 20260306

请登录后发表评论