生成式AI
一、Anthropic测试Conway智能体,Claude将获得永久在线
1. Conway以侧边栏形式常驻系统,支持Webhook外部唤醒,实现从被动会话向事件驱动的Always-On模式进化;
2. 引入.cnw.zip扩展标准并深度集成Chrome浏览器,让AI绕过聊天界面直接操作办公软件;
3. 配合Cowork通用智能体面向95%非技术职场人士,Anthropic目标是为AI打造全新操作系统。
https://www.aiexpress.news/57283.html
二、智谱发布GLM-5V-Turbo,打造多模态Coding基座模型
1. 从预训练阶段深度融合视觉与文本能力,支持200K上下文窗口,可理解设计稿和截图直接生成代码;
2. 在多模态Coding、GUI Agent等基准上取得领先表现,纯文本编程能力未退化;
3. 深度适配Claude Code与AutoClaw等Agent框架,提供全套官方Skills开箱即用。
https://www.aiexpress.news/57298.html
三、阿里发布Qwen3.6-Plus,重点在于提升智能体编程能力
1. 默认支持100万上下文窗口,在代码修复和终端自动化等智能体编程任务中达到业界领先水平;
2. 多模态推理能力升级,在复杂文档理解、视频推理和视觉编程等任务上取得稳定提升;
3. 兼容OpenClaw、Claude Code等主流编程助手,新增preserve_thinking功能优化长程任务表现。
https://www.aiexpress.news/57304.html
四、阶跃星辰发布Step 3.5 Flash优化版,新增低推理模式
1. 新增low think mode,低推理模式下token消耗降低56%,默认模式下token消耗降低14%;
2. 针对Coding框架与Agent框架进行优化训练,提升稳定性和token效率;
3. 在高频Agent场景中速度优势明显,总耗时仅为其他参评模型的一半。
https://www.aiexpress.news/57316.html
五、美团开源语音克隆模型LongCat-AudioDiT,提供双版本
1. 直接在波形潜空间进行扩散建模,抛弃梅尔谱中间表示,从根源阻断数据转换的级联误差;
2. 在Seed基准测试中取得SOTA零样本语音克隆性能,说话人相似度超越Seed-TTS等知名模型;
3. 提出双重约束机制和自适应投影引导替代传统无分类器引导,提升语音自然度和声学质量。
https://www.aiexpress.news/57319.html
六、百度健康发布医生版AI助手"有医助理",基于Claw框架
1. 首创"检索+任务"双引擎模式,整合6000万+专业文献和20万+用药知识图谱,主打结论可溯源;
2. 基于Claw框架打造,涵盖内容创作、学术检索、临床诊疗等5大场景共800+项Skill;
3. 与中国抗癌协会合作引入覆盖53大癌种的CACA指南,实测在文献检索和辅助诊断上表现实用。
https://www.aiexpress.news/57326.html
前沿科技
七、英伟达开源CaP-X框架,使大模型可用代码控制机器人
1. 基于"代码即策略"理念,机器人通过摄像头看懂环境后由大模型编写Python代码实现自主控制;
2. CaP-Agent0在7项核心任务中4项成功率追平或超越人类专家,展现强大鲁棒性;
3. 框架包含CaP-Gym训练环境、CaP-Bench基准测试等四大组件,成功代码自动存入可复用技能库。
https://www.aiexpress.news/57336.html
报告观点
八、OpenAI总裁称AGI已完成70%至80%,预告Spud模型
1. 代号Spud的新基座模型已完成预训练,集结OpenAI过去两年顶尖研究成果,将大幅提升问题理解能力;
2. Sora因日烧1500万美元且用户留存暴跌被关停,算力全部押注GPT推理路线;
3. 计划将ChatGPT、Codex和Atlas整合为"个人AGI"超级应用,秋季推出自动化AI研究员。
https://www.aiexpress.news/57350.html
<原文链接:https://mp.weixin.qq.com/s/YbAu_IuhfFN0nvmbNB13PA
















暂无评论内容