生成式AI
一、GPT-5.4核心内幕曝光:极限推理与百万token上下文
1. GPT-5.4已在LMArena和Codex内部进行A/B测试,通过错误日志、GitHub PR和员工截图被多次意外泄露,测试版一次提示可生成6000+行代码;
2. The Information爆料GPT-5.4将配备极限推理模式(Extreme Reasoning Mode),上下文窗口从40万翻倍至100万tokens,追平Gemini和Claude;
3. 最引人注目的传闻是GPT-5.4可能实现永久记忆(持久状态),疑似结合SSM与Transformer架构,坊间甚至称上下文或超预期。
https://www.aiexpress.news/50089.html
二、谷歌发布Workspace官方CLI,一行命令操作全线产品
1. Google Workspace CLI上线GitHub,覆盖Drive、Gmail、Calendar、Sheets、Docs等全部Workspace产品,所有输出均为JSON格式;
2. 工具实时读取谷歌API目录自动生成命令,支持MCP Server模式一行命令启动,内置100多个SKILL.md文件和50个常用操作配方,可直接被Claude Code等Agent调用;
3. 仓库包含专为AI编程助手编写的AGENTS.md贡献指南,支持Google Cloud Model Armor防注入攻击,当前版本v0.3.4仍在活跃开发中。
https://www.aiexpress.news/50105.html
三、谷歌与OpenAI同日发布轻量新模型,主打速度与体验
1. 谷歌推出Gemini 3.1 Flash-Lite,定价输入0.25美元/百万tokens,首token响应比2.5 Flash快2.5倍,输出速度提升45%,Arena Elo评分达1432;
2. OpenAI发布GPT-5.3 Instant,主打对话体验优化,联网幻觉率降低26.8%,减少不必要拒答和免责声明,写作能力和语气自然度显著提升;
3. OpenAI发布同时暗示GPT-5.4即将到来,GPT-5.2 Instant将于2026年6月3日正式下线。
https://www.aiexpress.news/50116.html
四、谷歌NotebookLM大更新,PPT一键生成影视级视频
1. NotebookLM发布影院级视频概览功能,由Gemini 3担任总导演把控叙事逻辑、Nano Banana Pro负责生成创意图片、Veo 3制作流畅动画和音效,三模型协同工作;
2. 新版支持一个笔记本存储多个同类型产出,可为不同语言、不同岗位定制专属版本,并支持多任务处理——一边听音频一边看思维导图;
3. 界面改版为音频、视频、思维导图、报告四大区块,功能将在未来几周陆续发布,目前已向Ultra用户推出英文版。
https://www.aiexpress.news/50130.html
五、MiniMax Music 2.5+发布,纯音乐创作覆盖全场景
1. MiniMax Music 2.5+新增纯音乐创作能力,支持古典管弦、极简主义、电子、氛围音、自然声景等多元风格,覆盖冥想助眠、广告配乐、游戏影视等场景;
2. 模型具备强大的跨风格融合能力,可将东方民族乐器与西方管弦乐自然融合,对笛子、琵琶、古筝等中国传统乐器的音色还原处于行业领先水平;
3. 单一模型即可处理从纯自然声到多轨器乐编排的完整复杂度,声场三频分明,已开放C端产品体验和API接口。
https://www.aiexpress.news/50136.html
前沿科技
六、宇树春晚武BOT论文发布,OmniXtreme架构同步开源
1. 宇树发布春晚武BOT技术论文(王兴兴署名),提出OmniXtreme双阶段框架:流匹配预训练构建统一动作策略,执行器感知后训练弥合仿真与现实鸿沟;
2. 真机测试完成157次独立试验覆盖24种高动态极限动作,后空翻成功率达96.36%,端到端推理延迟控制在10毫秒,全部在宇树G1机载Orin NX芯片上原生执行;
3. 架构已同步开源,通过写实驱动器建模、激进域随机化和功率安全正则化,首次解决了高保真动作追踪与多动作可扩展性之间的长期权衡难题。
https://www.aiexpress.news/50139.html
报告观点
七、外媒称OpenClaw在中国AI圈的发酵速度远超硅谷想象
1. 字节、阿里、腾讯已在各自云平台上线OpenClaw服务,开发者可直接在云端运行Agent,而AWS、Azure、Google Cloud三家美国云巨头尚未跟进;
2. 中国创业者围绕OpenClaw爆发式创新,春节黑客马拉松涌现AI相亲平台、AI招聘网站、AI旅行日志等Agent应用,有产品经理用11台二手MacBook组建AI内容创作军团;
3. OpenClaw的影响已从软件溢出到硬件领域,广州初创公司实现通过Agent远程控制充电设备,创业者认为这是中国AI行业一次「不可逆的冲击」。
https://www.aiexpress.news/50155.html
八、Anthropic CEO:Scaling Law没撞墙,甚至将激进加速
1. Dario Amodei在摩根士丹利会议上用棋盘稻米寓言类比AI发展,称当前正处于第40格,前39格的所有震撼加在一起不过是后24格的零头;
2. 代码生成是AI能力爆发的最强领先指标,Anthropic端到端生产效率已翻两到三倍,模型开始搭建工具和脚手架改进自身工作流,递归式自我改进(RSI)初现端倪;
3. 面对Meta开出1亿至5亿美元挖角单个研究员的天价,Anthropic仅流失两人,7位联合创始人至今全部在职,Dario强调「技术可以买,文化买不到」。
https://www.aiexpress.news/50156.html
九、Altman对话硅谷著名投资人:2035年将进入极度通缩经济体
1. Sam Altman在IIT Delhi对话中表示,AI同等智能水平的成本18个月内下降约1000倍,智能成本将持续趋近于零,GDP将因AI通缩效应变成糟糕的衡量指标;
2. Altman认为科学进步和经济引擎将被同时自动化,代码领域的变革将以相同模式复制到金融、医疗、法律等所有行业,最被低估的机会是「零人公司」;
3. Vinod Khosla预言2035年世界将进入极其通缩的经济体,双方共同强调能动性(agency)和好奇心是AI时代最重要的元技能,年轻人应学会用工具而非听老一辈的职业建议。
https://www.aiexpress.news/50169.html
十、图灵奖得主Knuth发论文致谢Claude,一小时攻克数周难题
1. 88岁图灵奖得主Don Knuth发表论文《Claude's Cycles》,记录Claude Opus 4.6在约一小时内通过31次探索,解决了他研究数周未果的三维环面图哈密顿环分解问题;
2. Claude发明了「蛇形模式」并从失败的模拟退火结果中提取隐藏规律,找到适用于所有奇数维度的通用构造方法,Knuth据此证明共存在760种同类分解方案;
3. 三年前称AI"让胡话听上去像真的"的Knuth坦言"得修正对生成式AI的看法",偶数情况后由GPT-5.3-codex解决,Claude解奇数、GPT解偶数,两个AI各解半题。
https://www.aiexpress.news/50173.html
<原文链接:https://mp.weixin.qq.com/s/eXoJY908cgSvtz_idt_LwA
















暂无评论内容