AI 每日速递 20260105-AI Express News

生成式AI

一、Anthropic去CUDA化？210亿美元豪购谷歌100万块TPU

1. Anthropic计划从博通采购近100万块谷歌TPU v7芯片自建超算，交易金额或达210亿美元，芯片部署在自控基础设施中，将不再依赖CUDA生态和云厂商"算力税"；

2. Anthropic坚持"少即是多"战略，押注高质量训练数据、后训练技术和模型效率，收入已连续三年实现同比十倍增长，Claude出现在所有主流云平台上；

3. 谷歌正洽谈追加投资Anthropic，新一轮融资或使其估值突破3500亿美元，Claude Opus 4.5仅用一小时便复现了谷歌工程师钻研整年的AI系统。

Anthropic打响「去CUDA」第一枪！210亿美元豪购谷歌100万块TPU-AI Express News

二、xAI豪购第三座超大规模数据中心，自建、自营并自供能源

1. xAI在田纳西州孟菲斯郊外购置81万平方英尺仓库作为第三个超大规模数据中心，马斯克确认新设施将使xAI训练算力接近2GW，目标部署100万颗芯片；

2. xAI选择独立发展路径，自建、自营并自供能源，与依赖云服务商的OpenAI和Anthropic形成差异化竞争，预计到2027年初通过合资企业获得超过1吉瓦功率；

3. 该公司正以2300亿美元估值筹集150亿美元资金，虽面临孟菲斯居民对燃气轮机空气污染的抗议，但已将关键基础设施迁至密西西比州以规避政治反对。

速递｜xAI豪购第三座超大规模数据中心，马斯克的“自营算力”帝国，旨在自建、自营并自供能源-AI Express News

三、前Liblib CTO创业，为Agent设计原生搜索和行动路由引擎

1. 前Liblib CTO王林芳创立Qveris AI，聚焦Agent时代基础设施层，构建AI-Ready数字孪生引擎，让大模型可秒级搜索和调用上万种专业工具与数据，已获近千万元种子轮融资；

2. 该平台解决Agent"眼瞎手残"困境，将互联网上为人类设计的服务转化为机器可调用的能力，实现语义级快速发现、标准化一键调用和动态路由高可用三大核心价值；

3. 王林芳预测未来10年内90%业务将由Agent自主完成，Qveris AI定位为Model Agent体系中的"Google"，作为跨平台中立连接器聚合分散服务统一分发。

前Liblib CTO创业，打造Agent时代的基础设施，可秒级调用上万种工具-AI Express News

四、张吕敏长视频新技术：20秒视频历史压缩成5000个Token

1. 斯坦福博士生张吕敏（ControlNet作者）联合MIT、CMU、港科大团队提出新型神经网络结构，将20秒视频历史压缩至约5000个Token，消费级显卡也能运行长视频生成；

2. 该方法通过预训练记忆编码器进行随机帧检索，迫使模型在有限带宽内保留高频细节，解决了自回归视频生成中长历史记忆与计算成本的矛盾，避免角色变脸等崩坏现象；

3. 实验显示该方法在衣物、身份、物体一致性等指标上接近或超过未压缩基线，为AI电影制作和长篇故事生成提供了高效高质量的技术路径。

张吕敏长视频生成新技术：20秒视频历史压缩成5000个Token，消费级显卡也能跑-AI Express News

前沿科技

五、宇树发布人形机器人H2训练视频：展现空翻、踹沙袋等动作

1. 宇树科技发布人形机器人H2日常训练视频，身高180厘米、体重70公斤的H2展现了飞踢、空翻、踢踹沙袋等高难度动作，腾空侧踢吓退创始人王兴兴；

2. 视频中H2展示空中回旋踢将西瓜踢得粉碎，展现了人形机器人在动态平衡和力量控制方面的突破性进展，该机器人于2025年10月正式发布；

3. 宇树科技同日声明，否认申请上市"绿色通道"相关报道，表示相关内容与事实不符，已向主管部门反映并督促撤回不实报道，上市工作正常推进。

宇树发布人形机器人H2训练视频：展现空翻、踹沙袋等动作，腾空侧踢吓退王兴兴，空中回旋踢将西瓜踢得粉碎-AI Express News

报告观点

六、谷歌团队埋头研究1年=Claude Code 1小时？负责人大赞竞品

1. 谷歌首席工程师、Gemini API负责人Jaana Dogan公开称赞Claude Code，表示仅用三段提示词、1小时就生成了与团队过去一年研究方向一致的"分布式智能体编排器"方案；

2. 该言论引发开发者社区激烈争议，质疑包括"为何不用自家Gemini"、“1小时vs1年是否夸张”，Dogan解释称这是"玩具版"而非产品，真正价值在于验证思路而非替代工程师；

3. Claude Code作者Boris Cherny分享实战数据，过去30天合并259个PR、约4万行代码全由AI编写，强调给AI验证工作的反馈回路可使结果质量提升2-3倍。

谷歌团队埋头研究1年=Claude Code 1小时？Gemini API负责人大赞竞品，却引程序员破防-AI Express News

七、田渊栋年终总结：救火Llama4但被裁，现任神秘初创公司联创

1. 知名华人AI科学家田渊栋分享2025年终总结，透露曾被要求加入Llama 4救火项目，在强化学习训练稳定性、训推互动等核心问题上有所探索，但最终于10月被Meta裁员；

2. 田渊栋已于2025年12月加入一家新初创公司担任联合创始人，细节暂不公开，其2025年主要研究方向为大模型推理和打开模型黑箱，包括连续隐空间推理（coconut）等工作；

3. 他提出"费米能级"概念描述AI时代人才价值分布，认为人的价值将从"本人产出"转变为"能否提高AI能力"，低于阈值的职业可能一夜之间被颠覆。

田渊栋2025年终总结：救火Llama4但被裁，现任神秘初创公司联创-AI Express News

八、让 AI 干活反而更累，Vibe Coding 正在掏空编程老兵的大脑？

1. 40年经验的编程老兵Stephan Schmidt使用Claude Code和Cursor后感到"大脑被掏空"的虚脱感，Vibe Coding取消了传统编程中给大脑处理信息的"加载条"，复杂任务被压缩到几秒内完成；

2. 开发者从"生产者"变成"审查者"反而更累，需要高频上下文切换、双向对齐"我的意图"与"AI的实现"，像空中交通管制员同时监控五个跑道，产生"隐性疲劳"；

3. Schmidt建议有意识控制节奏不被AI带跑、每天手动回顾建立心理模型、方案先行做好引导工作，在AI夺走节奏之前学会按下"暂停"键重新夺回"思考"的间隙。

让 AI 干活反而累成狗？Vibe Coding 正在掏空我的大脑-AI Express News

九、知名开发者24个关键词！浓缩大模型2025席卷世界这一年

1. 知名开发者Simon Willison发表年终总结，用24个关键词概括2025年大模型发展：推理之年、Agent之年、编程Agent与Claude Code之年、中国顶级无差别模型之年、Llama迷失之年、OpenAI失去领先地位之年等；

2. Claude Code于2月发布后年化收入达10亿美元，AI辅助搜索和代码生成能力大幅提升；中国AI实验室全面崛起，DeepSeek R1发布引发英伟达市值蒸发约5930亿美元的抛售潮；

3. METR研究显示"AI能执行的任务长度每7个月翻一番"，GPT-5和Claude Opus 4.5能完成人类需数小时的任务；每月200美元订阅服务成为新定价标准，Anthropic、OpenAI、谷歌均推出高价套餐。

24个关键词！浓缩大模型2025席卷世界这一年-AI Express News

十、MIT重磅论文提出让AI变聪明的秘密，竟然和人类一模一样

1. MIT发布《Recursive Language Models》论文，提出递归语言模型（RLM）解决大模型"上下文腐化"问题，核心思想是让AI多过几遍而非堆参数，复杂推理任务正确率提升10%-25%；

2. RLM将超长文档当作外置资料库而非直接塞进模型，AI通过代码按需查询，可递归调用自身分身处理子任务，在1000万+token规模下依然稳定，而传统模型直接崩盘；

3. 实验显示CodeQA任务中GPT-5准确率24%，RLM达62%提升2.7倍；处理600-1100万token文档成本从1.5-2.75美元降至0.99美元，更便宜效果更好。

MIT新论文：2026推理模型过时了，“套娃模型”当立-AI Express News

【原文链接】https://mp.weixin.qq.com/s/IAjWlFuDaRz4jIm1vcptkw

文章版权归作者所有，未经允许请勿转载。

THE END

AI 每日速递 20260105

请登录后发表评论