杨植麟GTC最新演讲：AI研究的范式变了！我们要重构Transformer的“地基” ！首次公开KimiK2.5技术路线！-AI Express News

编辑 | 云昭

北京时间 3月18日，月之暗面创始人杨植麟在英伟达GTC 2026现场发表了主题演讲，其中一张 Kimi Scaling 的路线图，引起了业界的注意。

他表示，要推动大模型智能上限的持续突破，必须对优化器、注意力机制及残差连接等底层基石进行重构。

继今年1月底正式发布KimiK2.5以后，杨植麟在演讲中首次系统性地披露了该模型背后的技术路线图。

他将Kimi的进化逻辑归纳为三个维度的共振:Token效率、长上下文以及智能体集群(AgentSwarms)。

前天，月之暗面一篇重磅论文：《𝑨𝒕𝒕𝒆𝒏𝒕𝒊𝒐𝒏 𝑹𝒆𝒔𝒊𝒅𝒖𝒂𝒍𝒔》轰动业界，可以说是给AI底层架构动了一场“关键手术”，这与彼岸的硅谷不少 AI Lab 堆算力的做法形成了鲜明的对比。

在Scaling Law横扫一切的今天，杨植麟在演讲开始部分，冷静地指出：我们不能只靠堆算力。

杨植麟认为，要推动大模型智能上限的持续突破，必须对优化器、注意力机制及残差连接等底层基石进行重构。

他直言不讳地提出，现有的很多技术标准其实是八九年前的“老古董”，已经成了进化的阻碍。

针对那个统治了AI界近十年的Transformer架构，Kimi掏出了手术刀：

这一改动直接惊动了大神 Karpathy 和马斯克。Karpathy 感叹我们对《Attention is All You Need》的理解还不够，马斯克则公开评价：“Kimi这项工作令人印象深刻。”

Kimi的技术进化逻辑，被归纳为三个维度的共振：Token效率、长上下文、智能体集群（Agent Swarms）。

在杨植麟看来，当前的Scaling不再是单纯的资源堆砌，而是要在计算效率、长程记忆和自动化协作上同时寻找规模效应。如果能将这三个维度的技术增益相乘，模型将表现出远超现状的智能水平。

未来的AI不再是孤胆英雄，而是“集团军”。

通过全新的 Orchestrator 机制，Kimi K2.5 可以将复杂任务拆解给几十个子 Agent 并行处理，并通过全新的并行 RL 奖励函数，彻底解决协作中的“串行塌缩”问题。

演讲最后，杨植麟谈到了一个深刻的洞察：AI研究的范式变了。

他提到，十年前的研究往往更看重新想法的发表，但受限于算力资源，很难通过不同规模的实验来验证这些想法。
而现在由于拥有了足够的资源和“缩放阶梯（Scaling Ladder）”，研究者可以进行严谨的规模化实验，从而得出更自信、更可靠的结论。

据悉，目前月之暗面Kimi正以投前估值180亿美元（约合人民币1200亿元），进行新一轮10亿美元融资。

约一个月前，Kimi刚完成逾7亿美元的融资，当时估值为100亿美元；而在去年底一轮5亿美元的融资中，其估值为43亿美元。

从43亿到180亿，Kimi用不到半年的时间，完成了全球AI圈最疯狂的跳跃。

路径：坚持自研+开源

Kimi的野心不止于自研。杨植麟表示，将继续坚持开源路径，将 MuonClip、Kimi Linear 等底层创新贡献给社区。

月之暗面，无疑再一次证明了中国 AI Lab 团队的硬核实力。

期待更多中国 AI Lab 的杰作诞生！

真正的智能突破，往往藏在那些被视为“常识”的基石之下。

<原文链接：https://mp.weixin.qq.com/s/19ZlXSm0DdcNzgekxHCVDQ

文章版权归作者所有，未经允许请勿转载。

THE END

杨植麟GTC最新演讲：AI研究的范式变了！我们要重构Transformer的“地基” ！首次公开KimiK2.5技术路线！