腾讯研究院AI速递 20260319

生成式AI

一、OpenAI发布GPT-5.4 mini和nano,价格仅为旗舰版1/3

1. OpenAI发布GPT-5.4 mini和nano两款轻量模型,mini在SWE-Bench Pro编码测试达54.4%仅差满血版3.3%,计算机使用OSWorld达72.1%媲美旗舰;

2. mini输入价格0.75美元/百万token、输出4.5美元,仅为GPT-5.4的1/3;nano更低至输入0.2美元输出1.25美元,已向ChatGPT免费用户开放;

3. OpenAI提出"大模型决策+小模型执行"的子智能体架构,mini在Codex中仅消耗旗舰配额30%,长上下文处理仍是短板但分层调度思路正成为行业共识。

https://www.aiexpress.news/54238.html

二、Anthropic发布Dispatch,手机远程指挥Mac上Claude

1. Anthropic上线Cowork新功能Dispatch,用户通过手机扫码配对即可远程指挥Mac上的Claude操作电脑,实现从"盯着AI干"到"AI自己干"的跨设备Agent跃迁;

2. MacStories实测综合成功率约50%,文件查找、Notion操作、邮件总结等可完成,打开应用、跨应用发送和Safari操作仍失败,目前仅面向Max订阅用户;

3. 所有操作在本地Mac执行不经过云端,手机仅为遥控器,与此前面向程序员的Claude Code Remote Control形成双线布局,覆盖GUI桌面和命令行两大场景。

https://www.aiexpress.news/54239.html

三、MiniMax发布M2.7,首个深度参与自我迭代的模型

1. MiniMax M2.7是首个模型深度参与自身迭代的模型,能自主构建RL Harness、更新记忆、驱动强化学习并优化过程,在内部脚手架上自主迭代超100轮实现30%效果提升;

2. SWE-Pro编码得分56.22%接近Opus水平,VIBE-Pro端到端项目交付55.6%,支持原生Agent Teams多智能体协作,40个复杂skills保持97%遵循率;

3. GDPval-AA专业办公ELO得分1500为开源最高,可自主完成研报分析、营收建模到PPT/Word/Excel全套交付,同步开源互动娱乐框架OpenRoom。

https://www.aiexpress.news/54240.html

四、腾讯QClaw重大更新,微信小程序入口与灵感广场上线

1. 腾讯QClaw宣布重大版本更新,微信入口从客服号升级为小程序,支持直接接收电脑端文件,即将支持语音、图片等多模态交互;

2. 全新上线"灵感广场"功能,围绕办公提效、深度研究、娱乐游戏等场景预置常用任务和skills,用户无需编写指令即可一键运行;

3. QClaw基于OpenClaw极简封装,主打下载即用的零门槛体验,后续将支持小程序创建定时任务、实时接收消息、远程切换底层模型等能力。

https://www.aiexpress.news/54262.html

五、LibTV上线,首个同时面向人与Agent的AI视频创作平台

1. LiblibAI推出LibTV,同时为人类创作者提供无限画布专业工具和为Agent提供Skill接口,支持从剧本到成片的全流程闭环创作;

2. 一次性上线20多个独家AI能力,包括角色三视图、360度角度呈现、多机位9宫格、大师运镜、视频精准编辑等专业控制功能;

3. 已发布OpenClaw适配的Skill,Agent可一句话完成剧本生成到视频剪辑全流程,集成可灵3.0等顶级模型,定价比竞品低最高达92%。

https://www.aiexpress.news/54269.html

前沿科技

六、2025图灵奖授予量子信息科学奠基人Bennett和Brassard

1. ACM将2025年图灵奖授予Charles Bennett和Gilles Brassard,表彰二人创建量子信息科学基础,这是图灵奖首次颁给与量子物理直接相关的研究;

2. 两人1984年提出的BB84量子密码协议安全性直接根植于量子力学定律而非数学假设,1993年又证明量子隐形传态可行,奠定了量子互联网的技术基石;

3. 二人合作始于1979年波多黎各一次泳池偶遇,历经四十余年将量子信息从边缘想法发展为拥有完整学科体系和国家战略的领域,BB84变体已在全球量子通信网络中实际部署。

https://www.aiexpress.news/54282.html

报告观点

七、Claude Code团队分享内部Skill构建经验与最佳实践

1. Anthropic内部已积累数百个活跃Skills,团队成员Thariq将其归纳为9大类型:库和API参考、产品验证、数据获取分析、业务流程自动化

2. 核心经验包括:Skill是文件夹而非单个Markdown文件,应利用文件系统实现渐进式信息披露;聚焦"常见坑"专区而非陈述显而易见的知识;给方向而非剧本避免过度约束;

3. 推荐用日志文件或SQLite实现Skill记忆能力,通过PreToolUse Hook记录调用日志衡量效果,并建议团队建立内部插件市场实现Skills的发现与分发。

https://www.aiexpress.news/54288.html

八、杨植麟:重构Transformer底层,公开K2.5技术路线

1. 单纯堆算力不够,需对优化器、注意力机制和残差连接等底层基石进行重构,推出Kimi Linear和Attention Residuals方案获Karpathy和马斯克高度评价;

2. 将Kimi进化逻辑归纳为Token效率、长上下文和智能体集群三个维度的共振,K2.5通过Orchestrator机制将复杂任务拆解给数十个子Agent并行处理;

3. 月之暗面估值从去年底43亿美元不到半年跳涨至180亿美元正进行10亿美元融资,将继续开源MuonClip、Kimi Linear等底层创新。

https://www.aiexpress.news/54292.html

九、黄仁勋:AI不会让人失业,而会让人变得越来越忙

1. 黄仁勋在GTC大会后受访表示AI不会让人失业反而会更忙碌,30分钟完成过去一个月的工作意味着人们将持续处于执行关键任务中;

2. 英伟达发布Rubin架构7颗芯片和5个机架等新品,将加速芯片收入预期提至1万亿美元,展望10年后员工从4.2万增至7.5万并配备750万个全天候工作的智能体;

3. 黄仁勋高度看好OpenClaw称其为开源代理式AI标准,类比Linux生态将持续获得全球开发者贡献,英伟达已针对性推出NemoClaw软件栈。

https://www.aiexpress.news/54300.html

<原文链接:https://mp.weixin.qq.com/s/sb6yTHdBFdPZ_o40SOJ_5Q

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容