用女娲.skill蒸馏出乔布斯之后,我问了他一个他活着的时候不可能被问到的问题:Apple现在的AI能力怎么样?
我以为他会说「Apple会找到自己的路」之类的场面话。他没有。

这段回答不是从乔布斯的语录里摘出来的。乔布斯2011年就去世了,他从没评价过Siri以后的Apple AI。但他的「品味不可外包」「端到端控制」「insanely great标准」这些心智模型,可以推理出他对这个问题的判断。
这就是蒸馏和角色扮演的区别。等一下细说。
先说说上篇文章推了女娲.skill之后发生了什么。

GitHub star破了1000。评论和私信里最多的两类反馈:一类是「太酷了,我要蒸馏我老板/导师/偶像」,另一类是「这跟让ChatGPT扮演马斯克有什么区别?」
第一类人已经开始玩了。第二类问题今天认真回答一下。
女娲现在造出了8个skill
7个人物 + 1个领域。

先接着说乔布斯。
蒸馏了30多个一手来源,包括艾萨克森授权传记、斯坦福演讲、遗失的访谈、D大会系列。6个心智模型,最核心的是现实扭曲力场背后的认知机制。不是「忽悠」,是真的相信一件不可能的事可以变成可能,然后用这个信念改变周围人的行为。
除了Apple AI那段之外,问他「OpenAI和Anthropic谁的方向是对的」也很有意思:
问他「如果要做AI硬件产品,你会选什么」:
追问到最后,问他「所以你没有答案?」他说:
「真正revolutionary的产品不是从对话里出来的,是从一个人盯着原型盯了三个月、摔了五次、骂了团队十次之后出来的。正确的问题不是做什么产品,是什么东西让你晚上睡不着。不是焦虑那种睡不着,是兴奋那种。Go find your sleepless night.」

马斯克。传记、播客、法庭证词。法庭证词是蒸馏的宝藏素材,因为在法庭上你不敢乱讲,所以反而最接近真实想法。最有价值的心智模型是「渐近极限法」:面对任何成本,先算物理极限是多少,然后问「现在离极限差几倍,中间哪些步骤可以砍掉」。
芒格。穷查理宝典、几十年股东会、USC和哈佛演讲。5个心智模型里最常用的是逆向思维。「我只想知道我会死在哪里,这样我就不会去那里」。听起来像老头在讲段子,但你试着用这个思路去审视一下自己上个月做的最大决策,会发现确实管用。
费曼。物理讲义、BBC访谈、自传、Cornell讲座。他的核心不是「用简单的话解释复杂的事」,而是更深一层:如果你不能简单地解释,说明你没有真正理解。这个判断标准本身就是一个可以反复使用的心智模型。
Naval。推文、播客、《纳瓦尔宝典》、决策记录。他把人生选择变成了一套公式化的判断系统。「杠杆」「特定知识」「复利」这三个概念组合在一起,几乎可以分析任何职业决策。
塔勒布。五卷本「不确定性」系列、推文、与Kahneman的对话。最实用的心智模型是「凸性策略」:在不确定性中,找到上行空间无限但下行风险有限的策略。
张雪峰。5本书、15篇权威媒体采访、30多条一手语录。蒸馏他的价值不在于教育观点本身,在于他把「信息不对称」这个抽象概念,用最接地气的方式讲清楚了。
主题skill(1个):
X导师。这是女娲的第一个「非人类」作品。之前蒸馏的都是人,这次蒸馏的是一个领域,X运营。输入不是一个名字,而是Nicolas Cole、Sahil Bloom、Alex Hormozi、Justin Welsh、Dan Koe、Dickie Bush这六位顶级X创作者的全部方法论,外加X开源算法的精确权重数据。
产出的不是某个人的视角,而是一套操作手册:帮你选题、写推文、审阅Hook、诊断涨粉瓶颈。
人物skill和主题skill的区别很大。人物skill模拟一个人的思维方式,用他的视角回答你的问题。主题skill不模拟任何人,直接给你可执行的步骤。一个是镜子,一个是地图。

这和直接让GPT「扮演马斯克」有什么不同?
这是被问得最多的问题。短回答:区别在于「回放录像带」还是「运行操作系统」。
你对ChatGPT说「你是马斯克,回答我的问题」,它干的事就是从训练数据里翻跟马斯克相关的文本,拼出一个听起来像的回答。马斯克高频说过的话,它模仿得挺像;马斯克从没聊过的问题,它就开始编。你问它「马斯克怎么看拼多多」,它大概率给你一段听起来很马斯克但马斯克绝对不会说的话。
女娲蒸馏出来的skill不干这个。它提取的是马斯克怎么想,不是马斯克说过什么。
区别在三个地方:
第一,有筛选标准。 女娲不会把马斯克说过的每句话都当真。上篇文章详细讲过三重验证(跨域复现、有生成力、有排他性),三个都过才算心智模型。马斯克在某个播客里随口说的一句话,和他在多个场合反复强调的核心理念,权重完全不同。
第二,有结构。 角色扮演是一团模糊的「像马斯克的感觉」。skill是一个清晰的结构:5个心智模型、8条决策启发式、表达DNA、价值观排序、明确的反模式。问一个新问题时,不是在猜「马斯克可能说什么」,而是在用他的「渐近极限法」这个具体框架去分析你的具体问题。
第三,有边界。 角色扮演不会告诉你它在编。skill的每个模型都标注了局限,什么情况下这个框架会失效。而且有一整个「诚实边界」section,明确列出做不到什么。一个承认自己局限的工具,比一个假装万能的角色扮演靠谱得多。
可以叫「蒸馏」吗?
严格来说,AI领域的「蒸馏」指的是把大模型的能力迁移到小模型。女娲做的事叫「蒸馏」是一种类比。把一个人散落在几十万字材料里的思维方式,浓缩提炼成一个几千字的可运行框架。
这个类比配不配得上?我觉得看两件事:
一是有没有信息损失。蒸馏一定有损失。女娲蒸馏不了直觉、蒸馏不了创造力、蒸馏不了一个人面对全新情境时那种无法言说的判断力。但能蒸馏的部分(分析框架、决策规则、思维惯性)已经够有用了。
二是蒸馏后的产物能不能独立运行。能。你拿蒸馏出来的芒格skill去问一个芒格从没公开讨论过的问题,比如「我该不该辞职去做AI自媒体」,它不会说「芒格没讨论过这个」,而是会用逆向思维框架来分析「做AI自媒体最容易死在哪几个地方」。
框架在处理新输入。不是在回放旧输出。叫蒸馏,我觉得配得上。
你可以拿女娲造什么
说几个我觉得特别有价值的方向:
你的行业导师。每个行业都有几个公认的顶级从业者,他们通常有书、有访谈、有演讲。投资领域蒸馏芒格/Dalio/Buffett,产品领域蒸馏张小龙/俞军,营销领域蒸馏Ogilvy/Seth Godin。蒸馏完之后,做决策前快速过一遍他们的框架。
你正在研究的课题专家。在写一本关于注意力的书?蒸馏一个Daniel Kahneman。在做教育产品?蒸馏一个Sal Khan。不是为了引用他们的话,是为了用他们的镜片看你的问题。
你的竞争对手。如果你的竞品创始人经常公开分享想法(在X上、播客里、采访中),蒸馏他。不是为了复制,是为了理解他的决策逻辑。知道对手怎么想,比知道对手在做什么更有价值。当然,如果你的竞争对手从不公开说话,那他可能比你更聪明。
主题导师。这是X导师.skill开辟的新方向。不蒸馏一个人,蒸馏一个领域。输入不是名字,而是一个主题加上这个领域最好的几个人。产出的是一套可操作的方法论。你可以蒸馏「写作」「演讲」「管理」「融资」,任何有足够公开方法论的领域都可以。
历史人物对谈。蒸馏两个不同立场的人,让他们对同一个问题做分析。比如用芒格和塔勒布看同一个投资机会。芒格会用逆向思维找风险,塔勒布会用反脆弱框架评估不对称性。两个框架打出来的结论如果一致,你可以更有信心;如果冲突,冲突本身就是最有价值的信息。
安装
GitHub: https://github.com/alchaincyf/nuwa-skill
装完在Claude Code里说「蒸馏一个XXX」就行。人名、主题都可以。
已蒸馏的8个skill也可以单独安装,不需要女娲:
1000个star之后
1000个star对开源项目来说不算多。但它验证了一个判断:把理解他人变成工程问题,是有人需要的。
上篇文章结尾我说,女娲造的不是人,是镜子。
这两天看了很多人的使用反馈,我想把这个说法修正一下。女娲造的不只是镜子。它是一个让你的思维空间变大的工具。
你的思维习惯是固定的。你有偏好的分析方式、偏好的表达风格、偏好的决策路径。这些偏好帮你高效运转,但同时也是盲区。
蒸馏另一个人的思维方式,本质上是在你的认知空间里开一扇新的窗户。你不需要永远用芒格的方式思考,但在做关键决策时,能切换到他的视角看一遍,看到你自己看不到的东西。
这不是AI替你思考。是AI帮你用更多的方式思考。
彩蛋:AI能写笑话吗?
都说AI写不了笑话。我之前也这么觉得。直到我用女娲的框架蒸馏了Carlin、Seinfeld、李诞、呼兰等18位comedian的喜剧技巧,造了个脱口秀.skill。
然后我给它出了一道难题:写一段吐槽Anthropic封禁中国用户的段子。就是吐槽写这篇文章用的那个Anthropic。
以下是完整的5分钟逐字稿:
22个笑点。预期粉碎、荒谬升级、自嘲释放、callback,这些笑点结构全是从18位comedian的方法论里蒸馏出来的。
对了,这篇文章本身也是Claude帮我写的。
<原文链接:https://mp.weixin.qq.com/s/UyKL2crMDdeGnQFQYmVbPg


















暂无评论内容