腾讯研究院AI速递 20260126

生成式AI

一、OpenAI Codex预告,今先揭秘Codex CLI核心智能体循环

1. OpenAI CEO奥特曼预告下周起将发布Codex相关重磅内容,官方同步发布技术博客揭秘Codex CLI核心架构——智能体循环;

2. 智能体循环通过Responses API协调用户指令、模型推理与本地工具执行,采用"提示词前缀一致"策略触发缓存优化性能;

3. Codex支持零数据保留配置保障隐私,利用自动压缩技术管理上下文窗口,后续将深入介绍工具调用和沙箱模型。

挑战Claude Code?OpenAI Codex发布月将至,今先揭秘智能体循环-AI Express News

二、谷歌 DeepMind 发布 D4RT,彻底颠覆了动态 4D 重建范式

1. 谷歌DeepMind发布D4RT,将3D重建、相机追踪、动态物体捕捉统一成"查询"动作,速度比现有SOTA快18至300倍;

2. 核心创新是统一的时空查询接口,AI先全局"阅读"视频生成场景表征,再按需搜索任意像素的3D轨迹、深度和位姿;

3. 该技术对具身智能、自动驾驶和AR意义重大,让AI实时理解动态环境,但训练仍需10亿参数模型和64个TPU。

谷歌4D世界模型来了,比SOTA快300倍!-AI Express News

三、Claude Code 宣布重磅升级:将内部的Todos升级为 Tasks

1. Claude Code将内部"Todos"升级为"Tasks",支持多会话或子代理协作完成跨越多个上下文窗口的长期复杂项目;

2. Tasks存储在文件系统中便于多个会话协同,当一个会话更新Task时会广播给所有处理同一任务列表的会话;

3. 新功能适配Opus 4.5更强的自主运行能力,用户可通过环境变量让多个会话在同一任务列表上协作。

Claude Code 重磅升级:Task 正式取代 Todo,专治多会话、长周期大工程-AI Express News

四、文心5.0正式版发布,霸榜LMArena的最强文科生强在哪

1. 百度文心5.0正式版上线,参数量达2.4万亿,采用原生全模态统一建模技术,支持文本、图像、音频、视频的理解与生成;

2. 在LMArena文本和视觉理解榜单五次登顶,进入全球第一梯队,语言与多模态理解能力稳居国际领先;

3. 实测显示模型在复杂情感理解、弦外之音分析、创意写作等文科任务表现突出,被称为"最强文科生"。

文心5.0正式版发布,霸榜LMArena的“最强文科生”到底强在哪?-AI Express News

五、Clawdbot刷屏,AI智能体+网关,现阶段使用请注意风险

1. 开源项目Clawdbot在硅谷爆火,可在Mac mini上运行,兼具本地AI智能体和聊天网关双重身份,通过WhatsApp、iMessage等随时对话;

2. Clawdbot解决了大模型记忆力痛点,能记住两周前的对话,还会主动推送邮件、日程提醒,并可直接操控电脑执行任务;

3. 项目GitHub获9.2k星,最低月成本约25美元,但需要一定技术基础部署,用户反馈它能自动管理生意、写代码替代Zapier等付费服务。

7×24h「全职AI员工」爆火硅谷!退休码农让Mac mini一夜卖爆-AI Express News

六、LeCun创业官宣核心方向,掀起对Next-token范式的「叛变」

1. 图灵奖得主LeCun创立的AMI Labs官宣核心方向为"世界模型",旨在构建理解现实世界、具备持久记忆和推理规划能力的智能系统;

2. 该路线认为仅靠预测下一个token无法真正理解现实,需在更高层次表征空间进行预测与推理,过滤不可预测的噪声信息;

3. AMI Labs据传正以35亿美元估值融资,目标应用于工业控制、机器人、医疗等对可靠性要求极高的领域。

估值35亿美元,LeCun创业公司官宣核心方向,掀起对Next-token范式的「叛变」-AI Express News

七、实测:Claude in Excel,能联网、能做表、办公完全自动化

1. Anthropic推出Claude in Excel插件,支持Pro、Max、Team、Enterprise用户,基于Opus 4.5模型,可通过Microsoft Marketplace安装激活;

2. 插件能联网搜索并自动填充表格,支持读取公式、Debug错误、从零建模、制作透视表等功能,支持.xlsx和.xlsm格式;

3. 当前不支持条件格式、宏和VBA,官方提醒存在prompt injection风险,建议只用可信来源文件,高危函数会弹确认框。

实测:Claude in Excel,能联网、能做表、办公完全自动化-AI Express News

报告观点

八、Claude Code之父最新私教课:手把手教你Claude Cowork

1. Claude Code创造者Boris Cherny详解Cowork使用方法,强调将其当作"执行者"而非聊天工具,可直接操控文件、浏览器和各类工具;

2. X基础次强调:核心工作流是并行运行多个任务照看Claude们,先用"计划模式"来回沟通直到满意,再切换"自动接受编辑"模式执行;

3. 强调Claude.md作为团队复利式知识库的重要性,任何Claude犯的错都应添加进去,以及给Claude验证输出的方式能显著提升质量。

万字实录!Claude Code之父最新私教课来了:手把手教Claude Cowork使用,还有个人CC配置详解-AI Express News

九、谷歌总监警告:只会写Prompt的程序员,2026年将被淘汰

1. 谷歌云AI总监Addy Osmani警告"氛围编程"已撞南墙,AI能完成70%前期工作但剩余30%只有经验丰富的工程师能搞定;

2. Stack Overflow调查显示开发者对AI准确性信任度从40%降至29%,73%受访者遇到过氛围编码导致的代码理解问题;

3. 2026年真正核心竞争力是把模糊问题转化为明确执行意图、设计好上下文结构,以及区分真正重要的东西。

氛围编程将死!谷歌总监警告:只会写Prompt的程序员,2026年将被淘汰-AI Express News

十、「AI 无处不在」的达沃斯论坛,科技巨头们都说了哪些金句?

1. 马斯克预测2026年底前AI将超越人类智慧,到2030年AI将比全人类集体智慧更聪明,特斯拉明年底将开售人形机器人Optimus;

2. 微软CEO纳德拉警告若AI只消耗资源不改善结果社会会失去容忍,黄仁勋称具身智能是"一代人一次的机会";

3. DeepMind CEO哈萨比斯认为AGI还需5-10年,Anthropic CEO达里奥称只差6-12个月模型就能端到端完成软件开发。

「AI 无处不在」的达沃斯,科技巨头们都说了哪些金句?-AI Express News

<原文链接:https://mp.weixin.qq.com/s/szeVb5l4OJhFhp2ygnPFKg

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容