闫俊杰的10个“反直觉”故事:从清华博士到AI巨头创始人,他在GPT爆发前一年看到了什么?

 点击上方“亮子创业笔记”关注公众号
赚钱就是不断卖自己,不断输出价值
这是亮子的第435篇文章

图片[1]-闫俊杰的10个“反直觉”故事:从清华博士到AI巨头创始人,他在GPT爆发前一年看到了什么?-AI Express News

MiniMax,这家被誉为全球AI大模型第一梯队的中国公司,在创始人闫俊杰的带领下,走出了一条充满“反直觉”判断的道路。

这位从河南小县城走出的清华博士,为何能在2021年,大模型热潮爆发前夕,就笃定地辞去商汤副总裁的职位开始创业?

他的故事,不仅是个人奋斗史,更是中国AI崛起的缩影。

以下是串联起MiniMax崛起之路的10个关键时刻和反直觉决策


故事一:小县城学霸的“超前学习”与老师的“善意谎言”

闫俊杰出生在河南的一个小县城,教育资源相对匮乏,但他的成长之路却充满了自学和激励。由于父亲是初中数学老师,他从小学起就自学初中甚至高中的课程内容。

最神奇的是,他在小学三年级时,甚至能帮着老师辅导那些初中生解答疑问,获得了极大的正向反馈(正向的激励)。

在教育资源匮乏的年代,他没有被“打击”,反而被老师们一路鼓励着长大。小学老师鼓励他上初中会很出色,初中老师鼓励他适合读高中,高中老师又说他适合读大学。

他感叹自己运气非常好,因为在小地方,孩子被不怎么样的老师打击的可能性远大于得到好的鼓励。这份从小建立的自学能力和自信,是他后来在瞬息万变的AI领域持续进步的底层能力。


故事二:在“最痛苦的一年半”中找到Scaling的终极密码

在创立MiniMax之前,闫俊杰曾在商汤科技(SenseTime)担任副总裁。他坦承,人生中最痛苦的时刻,是发现自己带领的团队在技术测试中一直排在倒数几名,而公司却投入了最多的资源支持他。

这段经历持续了一年半,对这位一路走来的学霸而言,是前所未有的压力。

正是这份痛苦,让他做出了关键取舍:他意识到不能再修修补补,而是要选择能够带来根本性变化的长期技术。他将所有资源、数据和迭代集中在一个模型上,找到了“规模化”(Scaling)的路线。

通过这种反常的集中策略,他的团队最终实现技术突破,从倒数第一跃升至行业第一,并保持领先。


故事三:因一场游戏直播,预见AGI大势

2021年,当GPT尚未在全球引发关注时,闫俊杰决定辞职创业,去追逐通用人工智能(AGI)。这个决定的契机,竟然是源于他对OpenAI的持续关注。

他本人是Dota 2游戏爱好者,当时OpenAI在Dota 2上打败了人类冠军,让他对这家公司产生了极大的兴趣。

他开始研究OpenAI发表的论文,并在2019年就看到了GPT-3的论文。他深刻意识到:

GPT-3首次展示了“一个模型可以解决很多问题”的能力,这与传统AI中“一个模型只能解决一个问题”的模式有着本质的区别,预示着技术革命即将来临。

这个基于“娱乐”发现的直觉,让他比绝大多数同行早了一年到一年半开始布局大模型。


故事四:反直觉的“多模态”全栈战略

当大多数AI创业公司都选择专注于最大的市场(文本)或者一两个模态时,MiniMax却采取了多模态(Multimodal)全栈发展的“不聚焦”战略,覆盖了语音、视频、文本和音乐。

在创业初期,这条路“极度艰难,缺乏清晰的技术路线”。但闫俊杰坚信,真正的AI必须是一个多模态输入、多模态输出的系统。

他认为,虽然四大市场(文本、图片/视频、声音、音乐)目前看似分散,但随着模型整合不同模态,它们最终会融合。

MiniMax提前布局,如今在多个模态上取得了国际领先的成绩,并希望在接下来的几个月内,将所有模态整合到下一代模型中,这是全球范围内极少数公司拥有的机会。


故事五:核心团队的“集体失语”——坚持两年烧钱的语言模型

MiniMax在创业初期定下了“技术驱动”的原则。然而,这个原则导致了一个“反直觉”的内部冲突:

公司的语言模型项目烧掉了最多的算力和人才,却有两年时间对公司业务发展没有任何直接的作用。

在最艰难的时刻,公司里至少有一半人认为应该放弃语言模型。但闫俊杰坚持了下来,因为他坚信语言模型是最根本的,它代表着技术的根本性进步,并最终能带来收入的巨大飞跃。

他通过第一性原理拆解问题,用理性逻辑说服团队,坚信高上限的投入终将得到回报。


故事六:中国AI的“降维打击”——以极低的成本追赶

在与全球头部AI公司的竞争中,中国公司在资金和算力上与美国存在巨大差距。闫俊杰估计,美国头部公司在AI上的投入可能是中国追随者的50到100倍,而技术差距可能只领先5%(且差距在缩小)。

他将中国公司能以极低成本做出高效模型的原因,归结于中国优秀的人才储备。

更重要的是,算力资源的限制,倒逼中国企业必须采取更具创新性的方式,而非简单复制美国同行的做法。这种“本土创新”存在于每一个技术模块中,让中国企业能更高效地利用资源。


故事七:产品的重新定义——模型本身即是产品

在AI大模型时代,MiniMax对产品有了全新的认知。闫俊杰指出,传统应用(如App)更像是模型的分发渠道,而真正的产品是模型本身。

大模型的本质是提供智能,而智能是通过模型算出来的。

这一认知也意味着,未来的竞争核心将是想象力和坚持。AI极大地降低了创意和生产力的门槛,产品经理现在可以直接做出原型(Demo),而不是仅仅写需求文档。他认为,算法、开发和产品人员的边界将越来越模糊。


故事八:克隆声音的“无心插柳”与情感价值

MiniMax在语音技术上取得了全球领先的成绩,包括声音克隆功能。令人震惊的是,这项技术做得如此逼真,以至于用户用几十秒的声音就能克隆出连本人都毛骨悚然的效果。

闫俊杰透露,克隆声音本身只是一个副产品。MiniMax的初衷是提供高品质的音色,用做语言模型的技术做了一个纯粹的Transformer声音模型。

这项技术最大的价值在于内容创作,例如,现在中国可能有一半的有声书是用MiniMax的模型做出来的。

它带来的情绪价值和生产力提升,远超少数人担心的负面滥用。


故事九:创业初期的“不讨喜”与坚持

MiniMax在创业之初就定下了三个原则:

  1. 直接服务用户(To C/To B),不做项目(“一旦接项目公司就没出息了”);
  2. 必须国际化;
  3. 必须技术驱动。

在起步阶段,闫俊杰的团队“比较草根”,没有“豪门背景”或“明星光环”。当时投资人看重的是背景和履历,但MiniMax的成功恰恰依靠自己土壤里长出来的年轻技术人才,而非空降的大牛。

他们用逻辑和承诺兑现,一步步建立起投资人的信任。他指出,正是因为中国AI公司一开始的艰难,使得他们天然倾向于开源、低成本、快速迭代,这反而让技术不易被垄断,更容易实现普惠。


故事十:下一代里程碑:全球市场份额与模态融合

如今,MiniMax将目光投向了更宏大的目标。闫俊杰定下了下一阶段的两个核心里程碑:

1. 在最具价值的语言模型场景中占据全球市场份额:目前在那些“必须用最好的模型”的场景中,基本由海外公司占据,虽然技术差距仅5%,但商业价值却相差100倍。他希望通过全行业努力,让中国公司在全球主流语言模型市场中,至少占据个位数的百分比。

2. 实现模态间的深度融合:MiniMax积累的文本、语音、视频等技术,现在要推动它们进行融合,创造出新的产品形态,就像“冰箱发明后,赚最多钱的是卖可乐的”一样,实现新的商业价值。


闫俊杰相信,这场AI革命将赋予所有人两个基本能力:编程能力和创作能力。

他总结道,能够投身于这场正在发生的巨大技术变革,并且有机会发挥作用,是人生中极其幸运的事。


都看到这里了,请帮我
点赞+在看
感谢!
=全文完=

原文链接:https://mp.weixin.qq.com/s/X4ZTGQi6otq1KYGEqOsbfw

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容