腾讯研究院AI速递 20260403

生成式AI

一、Anthropic测试Conway智能体,Claude将获得永久在线

1. Conway以侧边栏形式常驻系统,支持Webhook外部唤醒,实现从被动会话向事件驱动的Always-On模式进化;

2. 引入.cnw.zip扩展标准并深度集成Chrome浏览器,让AI绕过聊天界面直接操作办公软件;

3. 配合Cowork通用智能体面向95%非技术职场人士,Anthropic目标是为AI打造全新操作系统。

https://www.aiexpress.news/57283.html

二、智谱发布GLM-5V-Turbo,打造多模态Coding基座模型

1. 从预训练阶段深度融合视觉与文本能力,支持200K上下文窗口,可理解设计稿和截图直接生成代码;

2. 在多模态Coding、GUI Agent等基准上取得领先表现,纯文本编程能力未退化;

3. 深度适配Claude Code与AutoClaw等Agent框架,提供全套官方Skills开箱即用。

https://www.aiexpress.news/57298.html

三、阿里发布Qwen3.6-Plus,重点提升智能体编程能力

1. 默认支持100万上下文窗口,在代码修复和终端自动化等智能体编程任务中达到业界领先水平;

2. 多模态推理能力升级,在复杂文档理解、视频推理和视觉编程等任务上取得稳定提升;

3. 兼容OpenClaw、Claude Code等主流编程助手,新增preserve_thinking功能优化长程任务表现。

https://www.aiexpress.news/57304.html

四、阶跃星辰发布Step 3.5 Flash优化版,新增低推理模式

1. 新增low think mode,低推理模式下token消耗降低56%,默认模式下token消耗降低14%;

2. 针对Coding框架与Agent框架进行优化训练,提升稳定性和token效率;

3. 在高频Agent场景中速度优势明显,总耗时仅为其他参评模型的一半。

https://www.aiexpress.news/57316.html

五、美团开源语音克隆模型LongCat-AudioDiT,提供双版本

1. 直接在波形潜空间进行扩散建模,抛弃梅尔谱中间表示,从根源阻断数据转换的级联误差;

2. 在Seed基准测试中取得SOTA零样本语音克隆性能,说话人相似度超越Seed-TTS等知名模型;

3. 提出双重约束机制和自适应投影引导替代传统无分类器引导,提升语音自然度和声学质量。

https://www.aiexpress.news/57319.html

六、百度健康发布医生版AI助手"有医助理"Claw框架

1. 首创"检索+任务"双引擎模式,整合6000万+专业文献和20万+用药知识图谱,主打结论可溯源;

2. 基于Claw框架打造,涵盖内容创作、学术检索、临床诊疗等5大场景共800+项Skill;

3. 与中国抗癌协会合作引入覆盖53大癌种的CACA指南,实测在文献检索和辅助诊断上表现实用。

https://www.aiexpress.news/57326.html

前沿科技

七、英伟达开源CaP-X框架,使大模型用代码控制机器人

1. 基于"代码即策略"理念,机器人通过摄像头看懂环境后由大模型编写Python代码实现自主控制;

2. CaP-Agent0在7项核心任务中4项成功率追平或超越人类专家,展现强大鲁棒性;

3. 框架包含CaP-Gym训练环境、CaP-Bench基准测试等四大组件,成功代码自动存入可复用技能库。

https://www.aiexpress.news/57336.html

报告观点

八、OpenAI总裁称AGI已完成70%至80%,预告Spud模型

1. 代号Spud的新基座模型已完成预训练,集结OpenAI过去两年顶尖研究成果,将大幅提升问题理解能力;

2. Sora因日烧1500万美元且用户留存暴跌被关停,算力全部押注GPT推理路线;

3. 计划将ChatGPT、Codex和Atlas整合为"个人AGI"超级应用,秋季推出自动化AI研究员。

https://www.aiexpress.news/57350.html

<原文链接:https://mp.weixin.qq.com/s/YbAu_IuhfFN0nvmbNB13PA

© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容