生成式AI
一、Anthropic去CUDA化?210亿美元豪购谷歌100万块TPU
1. Anthropic计划从博通采购近100万块谷歌TPU v7芯片自建超算,交易金额或达210亿美元,芯片部署在自控基础设施中,将不再依赖CUDA生态和云厂商"算力税";
2. Anthropic坚持"少即是多"战略,押注高质量训练数据、后训练技术和模型效率,收入已连续三年实现同比十倍增长,Claude出现在所有主流云平台上;
3. 谷歌正洽谈追加投资Anthropic,新一轮融资或使其估值突破3500亿美元,Claude Opus 4.5仅用一小时便复现了谷歌工程师钻研整年的AI系统。
Anthropic打响「去CUDA」第一枪!210亿美元豪购谷歌100万块TPU-AI Express News
二、xAI豪购第三座超大规模数据中心,自建、自营并自供能源
1. xAI在田纳西州孟菲斯郊外购置81万平方英尺仓库作为第三个超大规模数据中心,马斯克确认新设施将使xAI训练算力接近2GW,目标部署100万颗芯片;
2. xAI选择独立发展路径,自建、自营并自供能源,与依赖云服务商的OpenAI和Anthropic形成差异化竞争,预计到2027年初通过合资企业获得超过1吉瓦功率;
3. 该公司正以2300亿美元估值筹集150亿美元资金,虽面临孟菲斯居民对燃气轮机空气污染的抗议,但已将关键基础设施迁至密西西比州以规避政治反对。
速递|xAI豪购第三座超大规模数据中心,马斯克的“自营算力”帝国,旨在自建、自营并自供能源-AI Express News
三、前Liblib CTO创业,为Agent设计原生搜索和行动路由引擎
1. 前Liblib CTO王林芳创立Qveris AI,聚焦Agent时代基础设施层,构建AI-Ready数字孪生引擎,让大模型可秒级搜索和调用上万种专业工具与数据,已获近千万元种子轮融资;
2. 该平台解决Agent"眼瞎手残"困境,将互联网上为人类设计的服务转化为机器可调用的能力,实现语义级快速发现、标准化一键调用和动态路由高可用三大核心价值;
3. 王林芳预测未来10年内90%业务将由Agent自主完成,Qveris AI定位为Model Agent体系中的"Google",作为跨平台中立连接器聚合分散服务统一分发。
前Liblib CTO创业,打造Agent时代的基础设施,可秒级调用上万种工具-AI Express News
四、张吕敏长视频新技术:20秒视频历史压缩成5000个Token
1. 斯坦福博士生张吕敏(ControlNet作者)联合MIT、CMU、港科大团队提出新型神经网络结构,将20秒视频历史压缩至约5000个Token,消费级显卡也能运行长视频生成;
2. 该方法通过预训练记忆编码器进行随机帧检索,迫使模型在有限带宽内保留高频细节,解决了自回归视频生成中长历史记忆与计算成本的矛盾,避免角色变脸等崩坏现象;
3. 实验显示该方法在衣物、身份、物体一致性等指标上接近或超过未压缩基线,为AI电影制作和长篇故事生成提供了高效高质量的技术路径。
张吕敏长视频生成新技术:20秒视频历史压缩成5000个Token,消费级显卡也能跑-AI Express News
前沿科技
五、宇树发布人形机器人H2训练视频:展现空翻、踹沙袋等动作
1. 宇树科技发布人形机器人H2日常训练视频,身高180厘米、体重70公斤的H2展现了飞踢、空翻、踢踹沙袋等高难度动作,腾空侧踢吓退创始人王兴兴;
2. 视频中H2展示空中回旋踢将西瓜踢得粉碎,展现了人形机器人在动态平衡和力量控制方面的突破性进展,该机器人于2025年10月正式发布;
3. 宇树科技同日声明,否认申请上市"绿色通道"相关报道,表示相关内容与事实不符,已向主管部门反映并督促撤回不实报道,上市工作正常推进。
宇树发布人形机器人H2训练视频:展现空翻、踹沙袋等动作,腾空侧踢吓退王兴兴,空中回旋踢将西瓜踢得粉碎-AI Express News
报告观点
六、谷歌团队埋头研究1年=Claude Code 1小时?负责人大赞竞品
1. 谷歌首席工程师、Gemini API负责人Jaana Dogan公开称赞Claude Code,表示仅用三段提示词、1小时就生成了与团队过去一年研究方向一致的"分布式智能体编排器"方案;
2. 该言论引发开发者社区激烈争议,质疑包括"为何不用自家Gemini"、“1小时vs1年是否夸张”,Dogan解释称这是"玩具版"而非产品,真正价值在于验证思路而非替代工程师;
3. Claude Code作者Boris Cherny分享实战数据,过去30天合并259个PR、约4万行代码全由AI编写,强调给AI验证工作的反馈回路可使结果质量提升2-3倍。
谷歌团队埋头研究1年=Claude Code 1小时?Gemini API负责人大赞竞品,却引程序员破防-AI Express News
七、田渊栋年终总结:救火Llama4但被裁,现任神秘初创公司联创
1. 知名华人AI科学家田渊栋分享2025年终总结,透露曾被要求加入Llama 4救火项目,在强化学习训练稳定性、训推互动等核心问题上有所探索,但最终于10月被Meta裁员;
2. 田渊栋已于2025年12月加入一家新初创公司担任联合创始人,细节暂不公开,其2025年主要研究方向为大模型推理和打开模型黑箱,包括连续隐空间推理(coconut)等工作;
3. 他提出"费米能级"概念描述AI时代人才价值分布,认为人的价值将从"本人产出"转变为"能否提高AI能力",低于阈值的职业可能一夜之间被颠覆。
田渊栋2025年终总结:救火Llama4但被裁,现任神秘初创公司联创-AI Express News
八、让 AI 干活反而更累,Vibe Coding 正在掏空编程老兵的大脑?
1. 40年经验的编程老兵Stephan Schmidt使用Claude Code和Cursor后感到"大脑被掏空"的虚脱感,Vibe Coding取消了传统编程中给大脑处理信息的"加载条",复杂任务被压缩到几秒内完成;
2. 开发者从"生产者"变成"审查者"反而更累,需要高频上下文切换、双向对齐"我的意图"与"AI的实现",像空中交通管制员同时监控五个跑道,产生"隐性疲劳";
3. Schmidt建议有意识控制节奏不被AI带跑、每天手动回顾建立心理模型、方案先行做好引导工作,在AI夺走节奏之前学会按下"暂停"键重新夺回"思考"的间隙。
让 AI 干活反而累成狗?Vibe Coding 正在掏空我的大脑-AI Express News
九、知名开发者24个关键词!浓缩大模型2025席卷世界这一年
1. 知名开发者Simon Willison发表年终总结,用24个关键词概括2025年大模型发展:推理之年、Agent之年、编程Agent与Claude Code之年、中国顶级无差别模型之年、Llama迷失之年、OpenAI失去领先地位之年等;
2. Claude Code于2月发布后年化收入达10亿美元,AI辅助搜索和代码生成能力大幅提升;中国AI实验室全面崛起,DeepSeek R1发布引发英伟达市值蒸发约5930亿美元的抛售潮;
3. METR研究显示"AI能执行的任务长度每7个月翻一番",GPT-5和Claude Opus 4.5能完成人类需数小时的任务;每月200美元订阅服务成为新定价标准,Anthropic、OpenAI、谷歌均推出高价套餐。
24个关键词!浓缩大模型2025席卷世界这一年-AI Express News
十、MIT重磅论文提出让AI变聪明的秘密,竟然和人类一模一样
1. MIT发布《Recursive Language Models》论文,提出递归语言模型(RLM)解决大模型"上下文腐化"问题,核心思想是让AI多过几遍而非堆参数,复杂推理任务正确率提升10%-25%;
2. RLM将超长文档当作外置资料库而非直接塞进模型,AI通过代码按需查询,可递归调用自身分身处理子任务,在1000万+token规模下依然稳定,而传统模型直接崩盘;
3. 实验显示CodeQA任务中GPT-5准确率24%,RLM达62%提升2.7倍;处理600-1100万token文档成本从1.5-2.75美元降至0.99美元,更便宜效果更好。
MIT新论文:2026推理模型过时了,“套娃模型”当立-AI Express News
【原文链接】https://mp.weixin.qq.com/s/IAjWlFuDaRz4jIm1vcptkw











暂无评论内容