共计 2914 个字符,预计需要花费 8 分钟才能阅读完成。
生成式 AI
一、OpenAI 将英特尔 CTO 招入麾下,专攻算力基础设施建设
1. OpenAI 成功招募英特尔 CTO 兼首席 AI 官 Sachin Katti,负责为 OpenAI 打造面向 AGI 的算力基础设施,而英特尔 CEO 陈立武被迫亲自接管 AI 部门;
2. Katti 拥有 20 多年无线通信和 AI 基础设施领域深耕经验,曾创办多家科技公司并在斯坦福任教,今年 4 月刚被英特尔提拔为 CTO;
3. OpenAI 计划未来 8 年斥资约 1.4 万亿美元打造 AI 基础设施,Katti 的加入对其自主算力布局版图意义重大,但对英特尔而言是一次重大失血。
https://mp.weixin.qq.com/s/ln_0w1uq8Vlzf7R53EUYVQ
二、Meta 开源最强语音 "基座模型",可支持 1600+ 种语言?
1. Meta AI FAIR 团队发布 Omnilingual ASR 语音识别模型套件,能为超过 1600 种语言提供自动语音识别能力,78% 语言字符错误率低于 10%;
2. 该框架采用社区驱动设计,用户仅需提供少量样本即可将模型扩展到新语言,首次实现大规模 ASR 框架的上下文学习能力;
3. 同时开源 Omnilingual ASR Corpus 数据集 (覆盖 350 种服务欠缺语言) 和 70 亿参数的 Omnilingual wav2vec 2.0 语音表征模型。
https://mp.weixin.qq.com/s/Amj8MmiKcos6dmSqhn0aJg
三、商汤开源 SenseNova-SI 系列空间智能大模型,2B&8B
1. 商汤发布并开源 SenseNova-SI 系列空间智能大模型(2B 和 8B 版本),其中 8B 模型在四个核心空间智能任务上平均成绩 60.99,领先 GPT- 5 和 Gemini-2.5-Pro;
2. 该系列模型首次在空间智能领域验证了 "尺度效应",构建了六大核心维度的空间能力分类体系,包括空间测量、空间重构、视角转换等;
3. 模型已接入 "悟能" 具身智能平台,同步开源空间智能测评平台 EASI,将补强具身智能在三维结构认知方面的基础能力。
https://mp.weixin.qq.com/s/lrx8rUjsRsKvzgycWTulvg
四、字节推出编程优化的新代码模型 Doubao-Seed-Code
1. 火山引擎推出 Doubao-Seed-Code 代码模型,调用价格降低,0-32k区间 输入仅 1.20 元 / 百万 Token;
2. 该模型是支持视觉理解能力的编程模型,可参照 UI 设计稿生成代码,原生 256K 长上下文,原生兼容 Anthropic API 实现零成本切换;
3. 同 步推出 Coding Plan 套餐,基于 10 万容器镜像训练库和端到端强化学习。
https://mp.weixin.qq.com/s/LOOVsBHNla4bDb8AorxAsA
前沿科技
五、Nature 子刊:太空数据中心,无限能源与散热证实可行?
1. 浙江大学和新加坡南洋理工大学首次系统性提出在太空构建碳中和数据中心的完整技术框架,利用近乎无限的太阳能和深空散热条件;
2. 研究提出两种方案:在遥感卫星上集成 AI 加速器构建 "轨道边缘数据中心",以及组建计算卫星星座形成 "轨道云数据中心";
3. 创新性提出 "全生命周期碳利用效率" 评估模型,初步建模显示尽管制造和发射有一次性碳排放,但长期碳效率有望超越中等碳强度地面数据中心。
https://mp.weixin.qq.com/s/iwH93ho2Sr5TU7wpt5NnZA
报告观点
六、Anthropic 顶级研究员:AI 见顶是最大错觉,仍在指数加速
1. Anthropic 研究员 Julian Schrittwieser 指出 AI 长任务能力每 7 个月翻一番,预测 2026 年中期模型将能自主工作 8 小时,年底前至少有一个模型在多个行业匹配人类专家;
2. 他强调公众反复误判 AI 发展,忽视指数曲线并以当下错误做永久性判断,前沿实验室数据显示 AI 能力增长极其稳定且呈指数级;
3. 他认为 "预训练 +Transformer+ 强化学习" 范式足以实现 AGI,预测 2027-2028 年 AI 模型将足够聪明能单独完成诺贝尔奖级别的科学突破。
https://mp.weixin.qq.com/s/bf-4hQMMO2XmOxs2A6CSbg
七、月之暗面杨植麟等回应一切:打假 460 万美元、调侃 OpenAI
1. 月之暗面核心团队在 Reddit 举行 AMA 活动,杨植麟打假 Kimi K2 训练成本 460 万美元传言,称训练成本很难量化,已在研究 K2 的 VL 版本;
2. 杨植麟解释 K2 Thinking 现阶段优先考虑绝对性能而非 token 效率,榜单高分与实测脱节会在模型通用能力补齐后改善,KDA 混合线性注意力模块可能出现在 K3 中;
3. 团队调侃 OpenAI 称做出更好模型不需要套新的 Chromium 壳,周昕宇称 OpenAI 烧钱原因 "只有 Sam 才知道,我们有自己的方式和节奏"。
https://mp.weixin.qq.com/s/kCzH9HeCvUqJPiTEWE_rnw
八、《麦肯锡 2025 AI 报告》:用了 AI 之后,大家到底过得怎么样?
1. 麦肯锡调查显示 88% 组织至少在一个业务环节使用 AI,但仅 39% 表示 AI 带来实质性财务回报(EBIT 增长),用上不等于用深更不等于用出钱;
2. 62% 组织已试验 AI Agent 类应用,但真正在任何一个部门推 AI Agent 的公司不到一成,主要集中在 IT 运维、知识管理等流程清晰的标准化部门;
3. 高绩效企业在 AI 变革上野心更高,50% 打算推动 AI 主导的变革性改变(普通企业仅 14%),55% 会从根本上重新设计工作流程(约其他企业的 2.8 倍)。
https://mp.weixin.qq.com/s/7SrCiB6U2UjD2sXkq7IXow
九、李飞飞最新长文刷屏,AI 下个十年最需要的不是大语言模型
1. 李飞飞发表长文强调空间智能是人类智能基石甚至先于语言存在,当前 LLM 虽语言能力强但缺乏对物理世界的真实经验和理解;
2. 她定义世界模型必须具备三种能力:生成性(生成几何物理一致的世界)、多模态性(天生设计为多模态)、交互性(根据动作输出下一世界状态);
3. 李飞飞认为构建世界模型需克服新训练任务、大规模数据和新模型架构三大挑战,空间智能应用将分阶段展开:近期赋能创造力,中期实现机器人学,长期变革科学医疗教育。
https://mp.weixin.qq.com/s/rU0AbePFGGpqyPCRhHflvw
十、上线 40 天,Sora 团队分享了他们对于 AI 社交的关键思考
1. Sora 上线 40 天内实现近 200 万周活跃用户,其中 70% 用户参与创作,远超传统互联网 90-9- 1 规则,核心在于 Cameo 和 Remix 两大社交玩法设计;
2. 团队将 Sora 定位为社交创作平台而非单人工具,推荐算法优先推送 "有二创价值" 内容而非消费时长,强调真实人际关系和共创体验;
3. 采用积分制灵活变现,平衡平台、创作者和版权方三方利益,通过降低创作门槛实现用户民主化创作,模型与产品双线并行发展。