闫俊杰的10个“反直觉”故事：从清华博士到AI巨头创始人，他在GPT爆发前一年看到了什么？-AI Express News

▲ 点击上方“亮子创业笔记”关注公众号

赚钱就是不断卖自己，不断输出价值

这是亮子的第435篇文章

MiniMax，这家被誉为全球AI大模型第一梯队的中国公司，在创始人闫俊杰的带领下，走出了一条充满“反直觉”判断的道路。

这位从河南小县城走出的清华博士，为何能在2021年，大模型热潮爆发前夕，就笃定地辞去商汤副总裁的职位开始创业？

他的故事，不仅是个人奋斗史，更是中国AI崛起的缩影。

以下是串联起MiniMax崛起之路的10个关键时刻和反直觉决策：

故事一：小县城学霸的“超前学习”与老师的“善意谎言”

闫俊杰出生在河南的一个小县城，教育资源相对匮乏，但他的成长之路却充满了自学和激励。由于父亲是初中数学老师，他从小学起就自学初中甚至高中的课程内容。

最神奇的是，他在小学三年级时，甚至能帮着老师辅导那些初中生解答疑问，获得了极大的正向反馈（正向的激励）。

在教育资源匮乏的年代，他没有被“打击”，反而被老师们一路鼓励着长大。小学老师鼓励他上初中会很出色，初中老师鼓励他适合读高中，高中老师又说他适合读大学。

他感叹自己运气非常好，因为在小地方，孩子被不怎么样的老师打击的可能性远大于得到好的鼓励。这份从小建立的自学能力和自信，是他后来在瞬息万变的AI领域持续进步的底层能力。

故事二：在“最痛苦的一年半”中找到Scaling的终极密码

在创立MiniMax之前，闫俊杰曾在商汤科技（SenseTime）担任副总裁。他坦承，人生中最痛苦的时刻，是发现自己带领的团队在技术测试中一直排在倒数几名，而公司却投入了最多的资源支持他。

这段经历持续了一年半，对这位一路走来的学霸而言，是前所未有的压力。

正是这份痛苦，让他做出了关键取舍：他意识到不能再修修补补，而是要选择能够带来根本性变化的长期技术。他将所有资源、数据和迭代集中在一个模型上，找到了“规模化”（Scaling）的路线。

通过这种反常的集中策略，他的团队最终实现技术突破，从倒数第一跃升至行业第一，并保持领先。

故事三：因一场游戏直播，预见AGI大势

2021年，当GPT尚未在全球引发关注时，闫俊杰决定辞职创业，去追逐通用人工智能（AGI）。这个决定的契机，竟然是源于他对OpenAI的持续关注。

他本人是Dota 2游戏爱好者，当时OpenAI在Dota 2上打败了人类冠军，让他对这家公司产生了极大的兴趣。

他开始研究OpenAI发表的论文，并在2019年就看到了GPT-3的论文。他深刻意识到：

GPT-3首次展示了“一个模型可以解决很多问题”的能力，这与传统AI中“一个模型只能解决一个问题”的模式有着本质的区别，预示着技术革命即将来临。

这个基于“娱乐”发现的直觉，让他比绝大多数同行早了一年到一年半开始布局大模型。

故事四：反直觉的“多模态”全栈战略

当大多数AI创业公司都选择专注于最大的市场（文本）或者一两个模态时，MiniMax却采取了多模态（Multimodal）全栈发展的“不聚焦”战略，覆盖了语音、视频、文本和音乐。

在创业初期，这条路“极度艰难，缺乏清晰的技术路线”。但闫俊杰坚信，真正的AI必须是一个多模态输入、多模态输出的系统。

他认为，虽然四大市场（文本、图片/视频、声音、音乐）目前看似分散，但随着模型整合不同模态，它们最终会融合。

MiniMax提前布局，如今在多个模态上取得了国际领先的成绩，并希望在接下来的几个月内，将所有模态整合到下一代模型中，这是全球范围内极少数公司拥有的机会。

故事五：核心团队的“集体失语”——坚持两年烧钱的语言模型

MiniMax在创业初期定下了“技术驱动”的原则。然而，这个原则导致了一个“反直觉”的内部冲突：

公司的语言模型项目烧掉了最多的算力和人才，却有两年时间对公司业务发展没有任何直接的作用。

在最艰难的时刻，公司里至少有一半人认为应该放弃语言模型。但闫俊杰坚持了下来，因为他坚信语言模型是最根本的，它代表着技术的根本性进步，并最终能带来收入的巨大飞跃。

他通过第一性原理拆解问题，用理性逻辑说服团队，坚信高上限的投入终将得到回报。

故事六：中国AI的“降维打击”——以极低的成本追赶

在与全球头部AI公司的竞争中，中国公司在资金和算力上与美国存在巨大差距。闫俊杰估计，美国头部公司在AI上的投入可能是中国追随者的50到100倍，而技术差距可能只领先5%（且差距在缩小）。

他将中国公司能以极低成本做出高效模型的原因，归结于中国优秀的人才储备。

更重要的是，算力资源的限制，倒逼中国企业必须采取更具创新性的方式，而非简单复制美国同行的做法。这种“本土创新”存在于每一个技术模块中，让中国企业能更高效地利用资源。

故事七：产品的重新定义——模型本身即是产品

在AI大模型时代，MiniMax对产品有了全新的认知。闫俊杰指出，传统应用（如App）更像是模型的分发渠道，而真正的产品是模型本身。

大模型的本质是提供智能，而智能是通过模型算出来的。

这一认知也意味着，未来的竞争核心将是想象力和坚持。AI极大地降低了创意和生产力的门槛，产品经理现在可以直接做出原型（Demo），而不是仅仅写需求文档。他认为，算法、开发和产品人员的边界将越来越模糊。

故事八：克隆声音的“无心插柳”与情感价值

MiniMax在语音技术上取得了全球领先的成绩，包括声音克隆功能。令人震惊的是，这项技术做得如此逼真，以至于用户用几十秒的声音就能克隆出连本人都毛骨悚然的效果。

闫俊杰透露，克隆声音本身只是一个副产品。MiniMax的初衷是提供高品质的音色，用做语言模型的技术做了一个纯粹的Transformer声音模型。

这项技术最大的价值在于内容创作，例如，现在中国可能有一半的有声书是用MiniMax的模型做出来的。

它带来的情绪价值和生产力提升，远超少数人担心的负面滥用。

故事九：创业初期的“不讨喜”与坚持

MiniMax在创业之初就定下了三个原则：

直接服务用户（To C/To B），不做项目（“一旦接项目公司就没出息了”）；
必须国际化；
必须技术驱动。

在起步阶段，闫俊杰的团队“比较草根”，没有“豪门背景”或“明星光环”。当时投资人看重的是背景和履历，但MiniMax的成功恰恰依靠自己土壤里长出来的年轻技术人才，而非空降的大牛。

他们用逻辑和承诺兑现，一步步建立起投资人的信任。他指出，正是因为中国AI公司一开始的艰难，使得他们天然倾向于开源、低成本、快速迭代，这反而让技术不易被垄断，更容易实现普惠。

故事十：下一代里程碑：全球市场份额与模态融合

如今，MiniMax将目光投向了更宏大的目标。闫俊杰定下了下一阶段的两个核心里程碑：

1. 在最具价值的语言模型场景中占据全球市场份额：目前在那些“必须用最好的模型”的场景中，基本由海外公司占据，虽然技术差距仅5%，但商业价值却相差100倍。他希望通过全行业努力，让中国公司在全球主流语言模型市场中，至少占据个位数的百分比。

2. 实现模态间的深度融合：MiniMax积累的文本、语音、视频等技术，现在要推动它们进行融合，创造出新的产品形态，就像“冰箱发明后，赚最多钱的是卖可乐的”一样，实现新的商业价值。

闫俊杰相信，这场AI革命将赋予所有人两个基本能力：编程能力和创作能力。

他总结道，能够投身于这场正在发生的巨大技术变革，并且有机会发挥作用，是人生中极其幸运的事。

都看到这里了，请帮我

点赞+在看

感谢！

=全文完=

原文链接：https://mp.weixin.qq.com/s/X4ZTGQi6otq1KYGEqOsbfw

文章版权归作者所有，未经允许请勿转载。

THE END

AI 资讯

闫俊杰的10个“反直觉”故事：从清华博士到AI巨头创始人，他在GPT爆发前一年看到了什么？