腾讯研究院AI速递 20260403-AI Express News

生成式AI

一、Anthropic测试Conway智能体，Claude将获得永久在线

1. Conway以侧边栏形式常驻系统，支持Webhook外部唤醒，实现从被动会话向事件驱动的Always-On模式进化；

2. 引入.cnw.zip扩展标准并深度集成Chrome浏览器，让AI绕过聊天界面直接操作办公软件；

3. 配合Cowork通用智能体面向95%非技术职场人士，Anthropic目标是为AI打造全新操作系统。

https://www.aiexpress.news/57283.html

二、智谱发布GLM-5V-Turbo，打造多模态Coding基座模型

1. 从预训练阶段深度融合视觉与文本能力，支持200K上下文窗口，可理解设计稿和截图直接生成代码；

2. 在多模态Coding、GUI Agent等基准上取得领先表现，纯文本编程能力未退化；

3. 深度适配Claude Code与AutoClaw等Agent框架，提供全套官方Skills开箱即用。

https://www.aiexpress.news/57298.html

三、阿里发布Qwen3.6-Plus，重点在于提升智能体编程能力

1. 默认支持100万上下文窗口，在代码修复和终端自动化等智能体编程任务中达到业界领先水平；

2. 多模态推理能力升级，在复杂文档理解、视频推理和视觉编程等任务上取得稳定提升；

3. 兼容OpenClaw、Claude Code等主流编程助手，新增preserve_thinking功能优化长程任务表现。

https://www.aiexpress.news/57304.html

四、阶跃星辰发布Step 3.5 Flash优化版，新增低推理模式

1. 新增low think mode，低推理模式下token消耗降低56%，默认模式下token消耗降低14%；

2. 针对Coding框架与Agent框架进行优化训练，提升稳定性和token效率；

3. 在高频Agent场景中速度优势明显，总耗时仅为其他参评模型的一半。

https://www.aiexpress.news/57316.html

五、美团开源语音克隆模型LongCat-AudioDiT，提供双版本

1. 直接在波形潜空间进行扩散建模，抛弃梅尔谱中间表示，从根源阻断数据转换的级联误差；

2. 在Seed基准测试中取得SOTA零样本语音克隆性能，说话人相似度超越Seed-TTS等知名模型；

3. 提出双重约束机制和自适应投影引导替代传统无分类器引导，提升语音自然度和声学质量。

https://www.aiexpress.news/57319.html

六、百度健康发布医生版AI助手"有医助理"，基于Claw框架

1. 首创"检索+任务"双引擎模式，整合6000万+专业文献和20万+用药知识图谱，主打结论可溯源；

2. 基于Claw框架打造，涵盖内容创作、学术检索、临床诊疗等5大场景共800+项Skill；

3. 与中国抗癌协会合作引入覆盖53大癌种的CACA指南，实测在文献检索和辅助诊断上表现实用。

https://www.aiexpress.news/57326.html

前沿科技

七、英伟达开源CaP-X框架，使大模型可用代码控制机器人

1. 基于"代码即策略"理念，机器人通过摄像头看懂环境后由大模型编写Python代码实现自主控制；

2. CaP-Agent0在7项核心任务中4项成功率追平或超越人类专家，展现强大鲁棒性；

3. 框架包含CaP-Gym训练环境、CaP-Bench基准测试等四大组件，成功代码自动存入可复用技能库。

https://www.aiexpress.news/57336.html

报告观点

八、OpenAI总裁称AGI已完成70%至80%，预告Spud模型

1. 代号Spud的新基座模型已完成预训练，集结OpenAI过去两年顶尖研究成果，将大幅提升问题理解能力；

2. Sora因日烧1500万美元且用户留存暴跌被关停，算力全部押注GPT推理路线；

3. 计划将ChatGPT、Codex和Atlas整合为"个人AGI"超级应用，秋季推出自动化AI研究员。

https://www.aiexpress.news/57350.html

<原文链接：https://mp.weixin.qq.com/s/YbAu_IuhfFN0nvmbNB13PA

文章版权归作者所有，未经允许请勿转载。

THE END

AI 资讯

腾讯研究院AI速递 20260403

请登录后发表评论