生成式AI
一、Claude Mythos 5.0开启内测,自主发现Linux内核零日漏洞
1. Anthropic旗下Claude Mythos 5.0已开始灰度测试,被定位为比Opus更大更智能的顶配模型,Polymarket预测6月上线概率达73%;
2. 安全研究员Nicholas Carlini现场演示Claude自主发现Ghost CMS盲SQL注入漏洞和Linux内核NFSv4守护程序中存在20年的堆栈缓冲区溢出漏洞;
3. Anthropic内部工程师已转向多智能体并行工作模式,团队不再手写代码,角色从工程师转变为AI智能体的管理者。
https://www.aiexpress.news/56310.html
二、Claude Code推出自动模式,用模型分类器替代人工审批
1. Claude Code新增自动模式,用基于Sonnet 4.6的转录分类器替代人工审批,在1万条真实流量中误拦率仅0.4%,解决用户93%审批通过率带来的审批疲劳问题;
2. 分类器采用双层架构,输入层检测提示注入,输出层评估操作安全性,刻意剥离模型自身回复以防止自我辩护干扰判断;
3. 针对过度主动行为的漏报率为17%,系统设置连续3次或累计20次拦截后交还控制权,多Agent场景下在委派和返回节点均执行安全检查。
https://www.aiexpress.news/56311.html
三、谷歌发布Gemini 3.1 Flash Live,推进实时语音Agent落地
1. 谷歌推出Gemini 3.1 Flash Live预览版,大幅提升语音交互的延迟和自然度,增强对音高、语速、重音和意图的识别能力,在嘈杂环境中任务完成率显著提升;
2. 该模型基于有状态WebSocket连接,支持连续音视频流输入,并具备工具调用、多语言支持、用户打断和Google Search接入等能力;
3. 已通过Gemini API和Google AI Studio向开发者开放,在设计协作、老年陪伴和游戏NPC等场景展示了实时语音加视觉Agent的应用潜力。
https://www.aiexpress.news/56317.html
四、智谱新模型GLM-5.1上线,编程评测与Opus 4.6仅差2.6分
1. 智谱发布GLM-5.1模型,编程能力较上一代GLM-5提升近10分,与全球最强编程模型Claude Opus 4.6仅差2.6分,支持约200K上下文窗口和reasoning模式;
2. 该模型面向GLM Coding Plan全部用户开放,支持接入Claude Code和OpenClaw使用,兼容OpenAI接口,上线后因需求火爆一度售罄;
3. 网友实测用GLM-5.1生成了可交互的国际象棋游戏和在线版"我的世界",模型在空间理解、动态补全和复杂任务执行方面表现突出。
https://www.aiexpress.news/56326.html
五、Runway上新推出Multi-Shot App,一句话生成多镜头视频
1. Runway上线Multi-Shot App,用户输入一段文字描述即可自动生成最多5个镜头的完整视频,包含对话、音效、镜头切换和节奏控制,无需手动剪辑;
2. 该App基于Gen-4.5模型,支持自动镜头语言编排、角色对话口型同步、环境音效匹配和电影化构图,输出分辨率720p,单镜头最长10秒;
3. Runway近期完成3.15亿美元融资,估值53亿美元,正从单镜头生成向完整成片制作方向发力。
https://www.aiexpress.news/56345.html
六、Claude Code推出Memory 2.0,AutoDream自动整理记忆
1. Claude Code推出实验性AutoDream功能,通过后台子Agent周期性回顾历史会话,对记忆文件执行合并、压缩、修剪和刷新操作,类似人类睡眠巩固记忆的机制;
2. 该功能通过/memory入口开启,运行时状态栏显示"dreaming",可自动或手动触发,每次运行约10分钟,能复盘数十至数百个会话;
3. 核心价值在于减少重复交代背景、控制上下文膨胀、提升关键信息召回率,将记忆文件从信息堆积转变为结构化索引。
https://www.aiexpress.news/56349.html
七、谷歌TurboQuant论文遭RaBitQ作者公开指控学术不端
1. RaBitQ第一作者高健扬发布公开信,指出谷歌ICLR 2026论文TurboQuant存在三处严重问题:回避与RaBitQ的方法相似性、无证据将RaBitQ理论保证定性为"次优"、用单核CPU测试RaBitQ却用A100 GPU测试自身算法;
2. 这些问题在论文投稿前已通过邮件告知TurboQuant团队且对方知情,但选择不予修正,论文仍被ICLR 2026接收并经谷歌官方大规模推广;
3. 第三方研究者也独立指出论文与博客在速度基准上口径不一致的问题,高健扬团队已向ICLR提交正式投诉并将发布详细技术报告。
https://www.aiexpress.news/56361.html
前沿科技
八、NeurIPS就制裁合规条款致歉,从新增条款到撤回仅用4天
1. NeurIPS 2026手册新增条款禁止OFAC制裁名单机构投稿,涉及华为、商汤、中芯国际等873家机构,引发中国学术圈强烈反对;
2. 中国计算机学会发布声明倡议暂停投稿与审稿,中国科协叫停相关资助申请,多位学者公开拒绝担任领域主席和审稿人;
3. NeurIPS在4天内发布致歉声明,称系基金会与法律团队沟通失误,已更新政策文本,欢迎所有合规机构和个人投稿。
https://www.aiexpress.news/56371.html
报告观点
九、中关村论坛圆桌:多位AI企业负责人探讨大模型与智能体走向
1. 智谱张鹏表示智能体让token用量增长10倍但实际需求可能达100倍,GLM-5 Turbo专为长程任务优化,近期涨价是回归正常商业价值;
2. 小米罗福莉认为"自进化"是未来一年AGI最关键方向,国产开源模型加OpenClaw的任务完成度已接近Claude,团队借助AI工具研究效率提升近10倍;
3. 无问芯穹夏立雪提出当前基础设施是为人设计而非为Agent设计,需打造"Agentic Infra",未来基础设施本身也应是能自我进化的智能体。
https://www.aiexpress.news/56377.html
<原文链接:https://mp.weixin.qq.com/s/-WYQV0FUzLRmm-UEBQLstw
















暂无评论内容