深度|OpenAI API华人工程负责人:模型会把你的脚手架当早餐吃掉,为模型的未来而构建,而非为模型的当下而构建

图片[1]-深度|OpenAI API华人工程负责人:模型会把你的脚手架当早餐吃掉,为模型的未来而构建,而非为模型的当下而构建-AI Express News
图片[2]-深度|OpenAI API华人工程负责人:模型会把你的脚手架当早餐吃掉,为模型的未来而构建,而非为模型的当下而构建-AI Express News

图片来源:Lenny's Podcast

Z Highlights

  • 目前OpenAI内部95%的工程师都在使用Codex,且我们100%的代码合并请求都由它审核。工程师正在演变成技术负责人,管理着成群的智能体;这感觉就像是我们变成了巫师,通过施展咒语来让软件为我们完成所有工作。

  • AI开发中有一个苦涩的教训模型会把你的脚手架当早餐吃掉。很多为了弥补模型缺陷而构建的复杂框架(如向量存储、智能体框架)最终都会被更智能的模型取代。因此,确保你是在为模型的未来发展方向构建产品,而不是基于它们今天的状态。

  • 如果单个人能拥有极高的杠杆,未来很可能会出现一人十亿美元的初创公司。但为了赋能这一个人,可能会有一百个其他小型初创公司在为此开发定制化软件,这意味着我们可能会进入一个B2B SaaS的黄金时代,迎来软件和创业公司的整体繁荣。

  • 目前的AI产品主要针对几分钟的任务进行了优化,但在接下来的1218个月里,我们将看到能连贯执行多小时任务的模型。到某个时刻,你可以把一个长达六小时的任务派发给模型,让它自己去完成,围绕这种能力构建的产品形态将与现在截然不同。

Sherwin WuOpenAI API和开发者平台的工程负责人。身处AI革命的风暴眼,他掌管着几乎每一家AI初创公司赖以生存的基础设施。曾任职于Opendoor的他,如今对行业趋势拥有独特的上帝视角,正带领团队见证并推动软件工程师从代码编写者向施展咒语的巫师转变。本次访谈来自Lenny's Podcast,深入探讨了OpenAI内部如何利用Codex重塑开发流程,以及开发者应如何应对模型终将吃掉脚手架的残酷现实。

OpenAI内部数据:Codex的使用率与效率差距

Lenny今天,我的嘉宾是Sherwin WuOpenAI API和开发者平台的工程负责人。鉴于几乎每一家AI初创公司都在与OpenAIAPI进行集成,Sherwin对正在发生的事情以及未来的方向有着极其独特且广阔的视角。Sherwin,非常感谢你来到这里,欢迎来到播客。

Sherwin Wu谢谢你邀请我。

Lenny我想从一种感觉像是AI进展晴雨表的东西开始,尤其是在工程领域。现在你们的代码中有多少百分比——如果你还自己写代码的话——或者说你们团队的代码,在这个时间点是由AI编写的?

Sherwin Wu我偶尔还是会写代码。实际上,对于像我这样的管理者来说,现在使用这些AI工具比手动编写代码要容易得多。我知道对于我自己和OpenAI的其他一些工程经理(EMs)来说,我们所有的代码目前都是由Codex编写的。

但从更广泛的角度来看,内部有一种非常强烈的能量感。这种有形的能量围绕着这些工具已经走了多远,以及Codex作为一个工具对我们来说变得多么好。其实很难精确测量有多少代码是AI写的,因为绝大多数代码——我想说接近100%——通常都是首先由AI生成的。

不过我们确实追踪的是,在这个时间点,绝大多数工程师每天都在使用Codex95%的工程师使用Codex同样,我们100%PR每天都由Codex进行审核。所以基本上,任何进入生产环境并被合并的代码,Codex都在某种程度上盯着它,并在PR中提出改进建议和修改建议。这就是我们在内部看到的情况。但总的来说,最令人兴奋的还是那种能量感。我们观察到的另一个现象是,倾向于更多使用Codex的工程师,提交的PR数量要多得多。实际上,他们提交的PR比那些不怎么使用Codex的工程师要多出70%。而且这个差距正在扩大。

所以我感觉,那些提交更多PR的人开始越来越学会如何使用这个工具,变得更高效。那个70%的差距随着时间的推移不断增长。自从我上次看这个数字以来,它可能实际上已经增加了。

Lenny好的。为了确保我们听懂了你的意思,你是说OpenAI95%的工程师的所有代码都是由AI编写的。AI写好,然后他们进行审核。

Sherwin Wu是的。是的。

Lenny这很疯狂,但这几乎已经不再让人感到疯狂了,我们只是正在习惯这种方式。

Sherwin Wu我想确实还有一些适应过程,要说清楚的话。我想还有一些工程师对Codex的信任度稍低一点。但基本上每天我都会和某个人交谈,他们会被Codex能做的事情所震撼,他们对模型独立完成任务的信任门槛或信任度都在随着时间一遍又一遍地提高。

而且我们这里的科学副总裁Kevin Weil有一句名言。他喜欢说,这是模型表现最差的时候。对于软件工程来说,这也是模型表现最差的时候。所以随着时间的推移,我们只会看到人们越来越信任它,然后我们将看到模型也变得越来越好。

Lenny是的。Peter,也就是那个MoltBot/OpenClaw(现在叫这个名字),这位开发者最近分享说他在工作中使用Codex。他感觉每当它做事情时,他就是信任它已经完成了正确的工作。他几乎确定他可以直接提交到主分支,而且结果会很好。

Sherwin Wu是的,他是Codex的一位出色用户。我知道他与团队保持着密切联系,给了我们很好的反馈。我不惊讶他使用它。我是说,抱歉,现在它叫OpenClaw了。

LennyOpenClaw,对。

Sherwin WuOpenClaw是个很棒的产品。然后我今天早上看到,这非常近期的事,今天早上,我想MoltBook好像也被分享了。看到所有的AI智能体互相交谈真是太超现实了。

工程师职业演变:从“SICP”魔法师的学徒

Lenny我听到的意思是,《Her》(电影《她》)里的情节基本上正在现实生活中发生。所以回到我们正生活在其中的这个疯狂时刻,特别是对于工程师来说,我们已经从你编写每一行代码变成了现在AI为你编写所有代码。我不知道过去几年有什么工作的变化比这更大,这是我们没预料到会发生如此大变化的工作,工程师的工作在整个职业生涯中变得如此不同。就像在过去几年里,它现在已经转变为我不再写任何代码了。你如何想象未来几年工程师的角色和软件工程师的工作?就像,那份工作会是什么样的?

Sherwin Wu老实说,看到这一切真的很酷。这也是兴奋感的一部分来源,因为这份工作在未来一两年内可能会发生相当显著的变化。虽然感觉我们还在摸索中。所以我知道有一种兴奋感,特别是来自一些软件工程师,就像是:我们正处于这个罕见的时刻,也许在接下来的1224个月里,我们将有点像是自己去弄清楚事情,并为自己设定标准。

至于我认为这会如何发展,我觉得大家都在说一件共同的事情,那就是:工程师正在成为技术负责人。他们现在基本上就像是管理者。他们在管理成群结队的智能体。我知道我团队里的许多工程师基本上同时有1020个线程在运行,显然不是在活跃地运行Codex任务,而是很多并行的线程。他们在检查智能体正在做什么。他们在引导智能体和Codex,并给予反馈。所以他们的工作真的已经从仅仅编写代码本身,转变为几乎像是一个管理者。

关于我认为从现在起一两年后这会走向何方。我总是回想起的一个比喻其实来自我在大学时读过的一本编程教科书,叫“SICP”。我不知道你是否听说过它。《计算机程序的构造与解释》。所以是SICP。在麻省理工学院,它非常受欢迎,实际上它曾被用作入门教材。很长一段时间它都是编程入门课程的教科书。它有点像是有某种邪典追随者。它教你编程。它教你一种叫SchemeLisp方言。它向你介绍了函数式编程。在这方面它非常让人脑洞大开。但关于那本书,让我记忆犹新的是。

我在大学时读了它。它的开头部分将编程描述为一种学科,并将其比喻为巫术。它说软件工程师就像巫师,而编程语言就像咒语。你发布这些咒语,这些咒语有点像是出去为你做事情。而挑战在于,你要念什么咒语才能让程序做你想做的事?这本书写于1980年。所以那是很久以前了。我认为这个比喻实际上随着时间的推移一直存在。我认为当我们进入这个“Vibe Coding”(氛围编程)的新时代,或者说软件工程未来的样子时,这个比喻正在成为现实。因为编程语言基本上就是这些咒语。它们随着时间而改变。挑战总是存在的,趋势一直是,通过编程让计算机做你想做的事变得越来越容易。

我认为当前的AI浪潮可能是进化的下一阶段。它现在真的是咒语了,因为你可以确切地告诉Codex,你可以告诉Cursor你想做什么。然后它就会去为你做这件事。

我特别喜欢巫师和巫术这个比喻,因为我认为我们目前的状态正开始走向有点像《幻想曲》里的魔法师的学徒。你知道,米奇老鼠发现了巫师的帽子,他试图做所有这些事情。我认为这是一个非常贴切的比喻,因为第一,它现在真的很强大。你能念的这些咒语具有极高的杠杆作用,但你必须知道你在做什么,对吧?就像在《魔法师的学徒》里,整个情节就是米奇失控了,扫帚疯了,到处都在发大水。我想他字面上是给扫帚设定了一个任务,然后就去睡觉了。所以,这就是“Vibe Coding”的极致。然后最终老巫师回来了,清理了一切。而且,当我看到工程师们同时处理这20个不同的Codex线程时,确实需要一些技能,需要一些资历,以及大量的思考,因为你要确保模型不会脱轨。你绝对不想完全走开,然后忽略这件事。

但这确实也是极高杠杆的。比如,一位非常精通这些工具的资深工程师现在可以通过他们的操作做更多的事情。我认为这也是让它变得有趣的原因。感觉我们现在真的就像巫师一样,感觉我们更接近于让它感觉像这种魔法般的体验,我们在施展所有这些咒语,让软件为你做所有这些事情。

极端实验:没有逃生通道的开发环境

Lenny我在听你描述的时候,脑子里想的正是魔法师的学徒这个比喻。所以我很高兴你提到了这个。之前的一位播客嘉宾将其描述为:你有一个能实现你愿望的精灵。这是一个有用的框架,因为你必须非常清楚你想要的愿望。比如如果你想变大,具体要多大?

Sherwin Wu是的,或者它可能像是猴爪类型的东西,你称之为你想做的事,但副作用是什么?是的。我认为这个比喻很棒。对我来说,疯狂的是那本书的持久力。它可能被称为巫师书。人们叫它巫师书,因为那是他们在整本书中编织的比喻。我们现在基本上达到了那个点,这真的很酷。

Lenny这里我想跟进两条线索。一条是我听到越来越多的人感到这种压力,当他们的智能体不工作时。你会发射出所有这些Codex智能体,然后你必须一直盯着它们吗?该死,有一个不工作了。我在浪费时间。你有这种感觉吗?你在你的整个团队中感觉到这一点了吗?

Sherwin Wu是的,是的。我是说,这总是发生。实际上我认为这就是目前这一切有趣的地方所在,因为这些模型并不完美。这些工具并不完美。我们还在试图弄清楚如何最好地与Codex或这些AI智能体互动来完成工作。我们一直看到这种情况出现。

我们内部有一个特别有趣的团队。有一个团队实际上正在用OpenAI做一个实验,他们基本上在维护一个100%Codex编写的代码库。所以,你会让AI写代码,但你显然最终会重写很多。你可能需要仔细检查并更改东西。但这个团队完全被Codex填满,并且完全投入其中。他们遇到了你所描述的确切问题,即他们的挑战是,我想构建这个功能,但我没法让智能体去做到它。

通常有一个逃生通道,你会说,好吧,我要卷起袖子自己搞定。然后你可以不用Codex,改用Tab Complete(自动补全)和Cursor之类的东西。但为了实验,这个团队没有那个逃生通道。所以挑战就变成了我该如何让智能体做这件事?实际上我认为我们将发布一篇博客文章,分享我们这里的一些经验。但很多迷人的范式和最佳实践正从中涌现。

我们要指出的一个有趣的事情,我不知道你是否有这种感觉,但我们在这是绝对感觉到了:很多时候当编码智能体没有做你想做的事时,通常是上下文的问题,就像是你给它的信息不够。这要么是说明不足,要么就是没有足够的信息关于如何做某事可供智能体、可供Codex使用。

所以当你必须通过那个途径解决问题时,挑战就变成了添加文档,实际上是绕过这个限制,基本上通过某种方式将你脑海中的部落知识(指团队内部不成文的知识)编码进代码库,要么通过代码注释本身,或代码结构本身,要么通过文本文件,如.md文件、技能文件,仓库内的任何类型的额外资源,以便模型能更好地完成任务。

从这个小组中还有一大堆其他的学习,我认为这非常值得探索。但是是的,移除不再使用AI的那个逃生通道,让他们开始拼凑出如果我们真的想依赖智能体就必须解决的许多问题。

代码审查的自动化与管理者的杠杆

Lenny人们遇到的另一个问题,你谈到了人们如果与AI一起工作,会像疯了一样发布PRPR数量多得多。显然,代码审查正成为一个更大的挑战。你们团队有没有想出什么办法来帮助加速这一过程,使其规模化,而不仅仅是创造出一种可怕的工作,让人们整天坐在那里审查PR

Sherwin Wu有一点是Codex目前审核我们所有的PR所以我实际上认为,发生的一件非常有趣的事情是,我们倾向于立即交给模型去做的事情,往往是那些让我们烦恼或者是软件工程中最无聊的部分。这也是为什么现在更有趣了,因为我们可以做更多有趣的事情。

对我来说,更多是代表我自己说,我真的讨厌代码审查。这对我来说是最糟糕的事情之一。我记得我大学毕业后的第一份工作是在Quora。我在做Newsfeed(信息流)。所以我拥有Newsfeed的代码。所以我也是Newsfeed的审查员。那就像是每个人都会触及的核心代码块。所以我过去每天早上登录,大概有2030个代码审查。我就像,天哪,我得搞定所有这些。我会拖延,然后它就长到了50个。所以就是有大量的代码审查。Codex真的很擅长审查代码。

所以实际上我们注意到的一件事是,特别是5.2版本在审查代码方面变得极其、非常熟练。尤其是当你把它引向正确的方向时。所以对于代码审查,是的,我们创建了很多PR,但Codex审查所有的PR。它让代码审查从一个1015分钟的任务,变成只有两三分钟的任务,因为你已经有一堆建议烘焙在里面了。很多时候对于小的PR,你实际上甚至不需要人来审查。我们在这方面有点信任Codex

编写代码的人大概是这样看待Codex的:代码审查的好处就在于能有第二双眼睛帮你把关,确保你没干蠢事。而在这一点上,Codex就是一双相当聪明的第二双眼睛所以这是我们非常依赖的一点。通用的CI(持续集成)流程和推送及部署后的流程在内部也已经通过Codex实现了高度自动化。如果你和很多工程师交谈,最让他们恼火的事情是在你写完漂亮的代码后,如何把它弄进生产环境?你得跑完所有这些测试。你得处理Lint错误。你得做所有的代码审查。

Codex可以做很多自动化的事情。所以我们实际上在内部建立了一些工具来帮助自动化这个过程,自动化Lint。如果有Lint错误,这即使对Codex来说也是个很容易的修复。然后你可以直接打补丁,然后有点像是重启CI流程。所以所有这一切都是我们试图尽可能压缩工程师的工作,其副产品就是他们现在可以合并并推出更多的PR

LennyCodex写代码,Codex审查它自己的代码。我很好奇你们是否持开放态度使用其他模型来审查你们模型的工作。这是条路子吗?还是说它已经够好了,我们不需要别的?

Sherwin Wu所以我会说这里肯定有一个循环的东西。就像回到《魔法师的学徒》,你要确保不要让扫帚在这里发疯。所以我想说,我们在哪些PR完全由Codex审查这方面是非常深思熟虑的。

大多数人显然还是会看一眼他们的PR。所以并不是说它变成了零关注。它更像是从100%的注意力变成了30%的注意力,这只是帮助事情推进。

至于多个模型,我们显然在内部测试很多模型。所以我们有很多那样的模型。我们较少使用外部模型。我们认为吃自己的狗粮(指使用自己的产品)并且在那里获得反馈是很重要的。但你也可以,有很多内部变体的模型你可以用来给你不同的视角。我们发现这也很有效。

Lenny好的,所以只是为了确保我们获得了OpenAI当今在AI和代码方面的世界晴雨表,只是为了让我理解,然后我想转移到一个不同的话题。OpenAI目前100%的代码都是由Codex编写的。

Sherwin Wu我不会做出这样的声明,说今天在生产环境中运行的100%的代码都是由AI编写的。而且在那里很难做归因。但几乎每一位工程师在这一点上都在他们的所有任务中重度使用Codex。所以我如果我要猜测的话,就像目前绝大多数的代码,可能都是由AI撰写的。

Lenny难以置信。好的,谈了很多关于IC角色,IC工程师的工作。关于管理者角色的变化谈得较少,特别是工程经理。作为一名管理者,你的生活随着AI的兴起发生了怎样的变化?你认为管理者,未来管理者的角色是什么?

Sherwin Wu这种变化肯定比工程师要小。目前还没有针对管理者的“Codex”。然而,我确实相当多地使用Codex来处理我做的一些更偏向管理者的任务。我想说有几件事正在改变。有一些趋势。我不认为目前变化有那么大,但我看到了趋势。我想如果你推演下去,你可以稍微看到这一切将走向何方。越来越清晰的一点是,Codex确实赋能了顶尖表现者去获得更多,比如变得更加多产。所以它真的像,我认为这对更广泛的AI来说可能也是真的,就像全社会一样,那些真正投入的人,或者那些拥有高度能动性或者真正会去擅长这些工具的人,将会某种程度上超级充能自己。

所以我现在也稍微注意到了这一点,就是顶尖表现者最终变得更加、更加多产。所以你会看到团队生产力以这种方式出现了更宽的分布。所以我一直以来作为管理哲学做的一件事就是实际上把我的大部分时间花在顶尖表现者身上,就像确保他们没有阻碍,确保他们快乐,确保他们感到多产并且感到被倾听。

我认为在AI世界里这更加真实,你的顶尖表现者将真的利用这些工具遥遥领先。我认为一个例子就是那个正在维护100%Codex生成代码库的团队,只是让他们放手去干,看看那里发生了什么,这是带来了红利的事情。所以我认为这是我看到的一个趋势,管理者花更多时间在顶尖表现者身上,我认为可能会继续下去。

另一件事是,所以这更多是一个观察,但我的感觉是随着很多这些AI工具可供管理者使用,比如不那么像写代码,而是像用ChatGPT结合组织知识,比如能够做研究并更好地理解组织背景。另一个好例子是我们现在正在做绩效评估。实际上真的很容易使用连接了GitHub和我们Notion文档及Google文档等内部知识的ChatGPT,来真正很好地了解这个人过去12个月做了什么,并为此写一份小小的、深度的研究报告。

我的感觉是,我认为管理者将能够在这个世界里管理大得多的团队,有点像软件工程师管理2030Codex实例。我对这些工具的感觉是,它将允许管理者、人员管理者拥有更高的杠杆,它将允许他们管理比当前最佳实践(我想软件工程是68人)多得多的团队。你稍微能看到这适用于非工程领域,比如支持或运营,以前支持团队的规模可能受到限制,但当你能把更多事情交给智能体时,你实际上可以做更多工作,也可以通过这种方式管理更多人。我认为同样的事情也可能发生在管理层人员身上,尤其是在科技公司。

而且我们已经看到了这一点。有些团队的工程经理(EM)管理着相当多的人,他们做得非常熟练,因为有些这样的工具让他们能获得更高的杠杆,更好地理解他们的团队在做什么,更好地理解组织背景,并以这种方式运作。

Lenny喜欢这个建议,你描述的方式是你总是倾向于顶尖表现者,花更多时间在他们身上,为他们解除阻碍,确保他们快乐。Marc Andreessen在播客中使用这句话的方式,他的措辞是,AI让好人变得更好,让优秀的人变得卓越

Sherwin Wu是的。

Lenny你在这里说的是,做得越来越多可能就是正确的举动,花更多时间在你团队中最优秀的人身上,为他们解除阻碍,确保他们拥有所需的一切。

Sherwin Wu是的,现在一个很好的例子是,我想说,内部有一群工程师真的充满了Codex,正在思考与这个模型互动的最佳实践是什么。这对他们来说就是一件极高杠杆的事情。所以就像作为一个管理者,去探索这个。无论从中产生什么最佳实践,我们都必须与组织分享。我们会做所有这些知识分享会。我们会到处分享文档和最佳实践。所以像那样的事情只是提升了每个人。我把这看作是我们看到的这种趋势的另一个例子,顶尖表现者真的变得卓越。人们就是有一种感觉。

一人十亿美元公司:二阶效应与创业生态

LennyAI正在改变如此多的东西。世界正在改变。这将是一件大事。你认为人们还没有计入考量、关于未来走向会发生什么变化的事情是什么?就像你认为有什么例子是,好吧,我们还没意识到这一点。

Sherwin Wu这波整个AI浪潮中产生的一个我最喜欢的短语或事物是一人十亿美元初创公司的想法。我想Sam可能定下了调子,或者Sam可能是第一个说出它的人。但思考这个很迷人,对吧?

你知道,如果人们在某个点拥有如此高的杠杆,很可能会有一个一人十亿美元的初创公司。虽然我认为这真的、真的很酷,但我认为人们并没有真正对这件事的二阶或三阶效应进行定价(计入考量)。因为一人十亿美元初创公司意味着,一个人可以拥有多得多的能动性和多得多的杠杆,使用这些工具之一,以至于他们非常容易完成他们业务所需的一切,最终创造出价值十亿美元的东西。

但我认为这还有几个其他的含义。其中之一是,如果一个人创建一个一人公司变得容易,或者如果一个人创建一个一人十亿美元初创公司成为可能,这也意味着人们创建初创公司总体上变得更容易了。比如,我实际上认为这就像是这个的二阶效应之一,我认为将会有一个巨大的初创公司繁荣,像小型的SMB风格的繁荣,任何人都可以为任何事情构建软件。

对。就像其一,你开始看到这在初创公司场景中上演,软件变得更加垂直导向,像这些垂直领域,为某个垂直领域创建某种工具往往效果很好,因为,你真的深入那个特定领域。你真的很理解它的用例。

所以如果你推演AI,没有理由你不能拥有像100倍那样多的这类初创公司。所以我认为我们最终可能看到的一个世界是,为了赋能一个一人十亿美元初创公司,可能会有像100个其他小型初创公司在构建定制软件,以此极好地支持其他类型的小型一人十亿美元初创公司。所以我认为我们可能实际上进入一个B2B SaaS的黄金时代,就像软件和初创公司的总体繁荣。

我认为这是一个非常有趣的趋势,因为随着构建软件变得越来越容易,随着运营一家公司变得越来越容易,你可能实际上最终会看到更多这样的初创公司。所以我思考它的方式是,是的,可能会有一个一人十亿美元初创公司,或者可能会有像100个一亿美元的初创公司。可能会有成千上万个一千万美元的初创公司。作为个人,拥有一个一千万美元的生意实际上已经很棒了。那就像是足够你一辈子的东西了。所以,我们可能真的会看到那方面的大爆炸。

而且我觉得人们并没有真的把这点强调进去。这还有另一个像是三阶效应,所有这些你得做出越来越远的预测,我认为有很多不确定性。我认为如果我们最终走向这个世界,最终会有这些像是微型公司,构建供拥有公司并在那里工作的一两个人使用的软件,我认为初创生态系统将会改变。我认为风险投资生态系统将会改变。我们可能最终进入一个世界,那里只有少数几个大玩家提供平台并支持所有这些初创公司。

但是,那种能够真正让你的投资获得100倍或1000倍回报的风险投资规模的初创公司类型可能实际上最终会缩水。如果你最终有一堆这样的、较小的1000万到5000万美元的公司,它们对于风险投资风格的回报来说并不好,但对于个人来说很棒,那些现在真正依靠AI为自己建立这些企业的高度能动性的个人。

Lenny我喜欢我们已经经历了多少阶效应。当我听到现在的四阶效应时,当然,我只是在开玩笑。

Sherwin Wu我不能,这太……四阶太过了,对我来说脑洞太大了。我不能想那么远。

Lenny就像《盗梦空间》,每当你深入一层,一切都会变慢。好的,关于十亿美元初创公司,我经常思考这个问题,因为我不会成为一个十亿美元初创公司,因为我做的事情没有任何风险投资规模,也不是超级高杠杆,但仅仅能看到我从最荒谬的事情中收到多少支持工单。

这对我来说很难想象一个人十亿美元初创公司。我只是想分享这个想法,除非你的ACV(年度合同价值)非常高且客户非常少,否则仅仅是处理支持,人们就像他们可以解决自己的问题,他们就像我会发邮件给支持,我会问这个事情。仅仅处理那个就是很难规模化的,以我的经验来看。所以除非你有一群承包商,我不知道那算不算单人公司?我觉得很难在没有人帮助你处理至少支持工作的情况下扩展一个十亿美元的初创公司。而我认为AI只能带你走这么远。

Sherwin Wu所以我认为那是真的。实际上,我认为我对它的看法略有不同,那就是我认为你,Lenny的播客可能最终成为一个十亿美元初创公司。但我认为可能发生的是,不是你有点像是那唯一一个必须派遣AI去解决和修复那些支持工单的人,我认为最终可能发生的是,可能会有一大堆其他的初创公司在构建软件,并且像是超级针对你可能需要的东西进行定制。

所以,可能会有像1020个初创公司为播客和时事通讯构建支持软件。那可能是一个单人初创公司,就像它不需要是一个大公司。而且,他们可能能够非常、非常容易地编写出这个产品。他们能够有点像是构建他们自己的东西。而且因为它如此定制和独特,并且希望,对你有用,它可能是你作为那个一人十亿美元初创公司购买的东西。

Lenny我会买那个。

Sherwin Wu这就像是一个关于你在内部做什么和你喜欢外包什么的问题。我认为可能发生的是,因为编写软件和构建产品的成本正在如此大幅度地崩溃,你可能最终会外包很多这类的东西。而在这样做的过程中,缩小了你公司的规模。所以那有点像是我认为最终可能发生的世界。再一次,这里可能发生的事情有很高的不确定性。但最终结果仍可能是像一个人驾驶着这个巨大的杠杆化的公司,实际上可能达到十亿美元。

Lenny我能看到这点。我也想到了OpenClawPeter。我就像是在想他现在是如何被所有这些请求、邮件、Ping、私信和PR轰炸的。我很好奇想看看。而且他甚至没从这东西上赚到任何钱。

Sherwin Wu是的,我无法想象现在当他是什么感觉。肯定像是绝对疯了。可能就像是我们在推出ChatGPT之后的几个月,那作为一个人的疯狂。

Lenny是的。也许四阶效应:信息分发变得越来越重要。因为有太多该死的东西试图获取你的注意力。所以拥有受众和平台的人,我认为,变得越来越有价值,这是好事。

管理哲学新范式:赋能核心人才与外科医生式” 支撑

Lenny我想回到管理理念这个话题。你提到在高绩效员工身上投入更多时间的策略非常成功,这一点我很认同。要知道,你带领的团队打造的平台,堪称整个AI经济的基石,几乎所有AI初创企业都基于你们的API进行开发,显然你做得极为出色。除此之外,你还学到了哪些核心的管理经验?在你看来,作为技术工程师和团队成员的管理者,哪些能力和原则至关重要?

Sherwin Wu我在OpenAI学到的很多管理经验,其实并不完全局限于API业务或企业产品领域。我的管理理念虽随时间有所演变,但核心内核始终未变。其中最关键的一点,就是我之前提到的——花大量时间深耕高绩效员工,具体来说,我会把超50%的精力放在团队前10%的核心人才身上,竭尽所能为他们赋能。

我对这一理念的理解,源于《人月神话》中一个经典类比:将软件工程师比作外科医生。这本书写于上世纪70年代,作者当时就预言,软件工程未来会走向类似外科手术的工作模式——手术室里,主刀医生负责核心操作,其余医护人员全为其提供支撑。医生说需要手术刀,立刻就有人递上;医生需要特定仪器,马上就会有人准备到位,所有人的核心目标,都是协助主刀医生完成工作。

当然,这个预言并未完全成真,如今的软件工程更强调协作,并非单一个体的独角戏,但我始终偏爱这个类比,也一直努力将其融入自己的管理实践。我从不认为软件工程真的和外科手术一样,但我会以这样的思路对待团队成员:让每个人都感觉自己是主刀医生,而我作为管理者,核心职责就是为他们保驾护航,确保他们拥有开展工作所需的一切资源,让他们感受到背后有整个团队的支撑。

从组织层面来看,这种保驾护航的思维尤为重要,在AI时代更是如此。现在的工程师们能快速提交一个又一个代码合并请求(PR),而项目推进和产品落地的最大瓶颈,往往不是技术本身,而是组织流程层面的阻碍。作为管理者,若能提前预判问题、为团队扫清障碍——就像外科医生需要手术刀时,我早已提前准备好递到他手中,这就是最理想的管理状态。

这就是我处理管理工作,尤其是工程管理的核心思路,多年来一直深植于心。即便软件工程的实际工作模式和外科手术不同,这个类比也始终指引着我的职业发展。

Lenny这个理念太精彩了。我突然想到,这或许正是AI能发挥作用的地方——提前预判问题,比如预测某位工程师可能会因某个决策陷入瓶颈,进而提前解决问题。

Sherwin Wu你说得太对了,这是个绝佳的想法。我还没尝试过,但试想一下,如果让接入了公司知识库的ChatGPT去梳理:目前团队存在哪些实际阻碍?翻遍所有Notion文档、Slack聊天记录,找出那些潜在问题,再给出解决建议,这会是多大的帮助。这个思路太有意思了,我之前从未想过,今天算是有了新的洞察。

Lenny更有意思的是,还能让AI预判,这位工程师或这个团队在未来几个月可能会遇到哪些阻碍。

Sherwin Wu没错,让AI去做这种二阶、三阶的预判,不仅分析当下的问题,还能预测下个月可能出现的瓶颈,这会带来巨大的价值。

企业 AI 部署困局:负 ROI 陷阱与 虎队” 破局策略

Lenny接下来我们聊聊你们打造的API和平台。你们与众多落地OpenAI API的企业合作,也见证了他们基于你们的工具搭建自身平台。你曾和我说,很多企业的AI部署项目实际是负投资回报率的,这也是很多人切身感受到的现状,这一现象背后究竟是什么原因?企业们到底哪里做错了?AI部署与ROI之间的矛盾,核心问题出在哪?

Sherwin Wu首先要说明的是,我并没有具体的量化数据来佐证这一点,毕竟这类指标本身就很难精准衡量。但从观察众多尝试落地AI的企业来看,我毫不惊讶很多AI项目的ROI为负。这一现象背后,还有一个普遍的行业情绪:科技圈之外的很多从业者,都觉得AI是被强行推到自己面前的。而这一情绪,很大程度上就是企业AI部署负ROI的外在表现。我总结了几个核心观察:

第一,硅谷的从业者其实生活在信息泡沫里,我们总忘了这一点。不管是X平台、硅谷本身,还是软件工程领域,都是一个个相对封闭的泡沫。世界上大多数人,甚至美国的多数从业者,都不是软件工程师,也并非狂热的AI爱好者,不会时刻关注每一个模型的发布。这就导致他们在AI技术的实际应用上,与硅谷存在巨大的认知脱节。

我们在OpenAI内部,总在探讨Codex的各类最佳实践,团队里也都是精通AI工具的高手;X平台上的博主,也大多是AI工具的资深用户,他们深谙各类技能框架、agents.mdMCPs等工具的用法。但当我和传统企业的一线员工交流时发现,他们还在尝试最基础的AI操作,对这项技术的底层逻辑几乎一无所知。他们只是在简单地使用AI,远未到深度挖掘其潜力的阶段。

这也引出了一个关键问题:什么样的AI部署才是理想的?这也是我们OpenAI内部的运作逻辑——成功的AI部署,必须兼顾自上而下的战略支持和自下而上的员工认同。自上而下,指的是企业管理层要有明确的战略规划,立志打造“AI优先的组织,愿意投入资源采购工具,给予AI项目高管层面的支持;而自下而上,则是指一线执行的员工,要真正对AI技术感到兴奋,愿意主动学习、分享经验,在组织内部打造AI应用的最佳实践,完成知识传递。

OpenAIAI落地就是最好的例子:我们一直秉持AI驱动的理念,但真正让AI在公司内部普及的,是Codex这类工具的推出——它让每位员工都能将AI直接应用到日常工作中。这一点至关重要,因为归根结底,不同岗位的工作内容千差万别,软件工程、财务、运营、市场销售的工作逻辑完全不同,AI落地的最后一公里,必须由一线员工结合实际工作完成,这是自上而下的指令无法替代的。

而很多企业的AI部署之所以失败,就是因为只有自上而下的强制推动,没有自下而上的主动接纳。管理层一纸命令要求全员做AI,却与员工的实际工作完全脱节,最终导致员工对AI技术一知半解,只知道必须用,甚至将AI应用纳入绩效考核,却根本不知道该怎么用。环顾四周,没人能给出示范,也没有学习交流的氛围,这样的AI部署注定失败。

所以我给这类企业的建议是:在内部组建一支全职的AI“虎队。这支团队的核心职责,是深度探索AI技术的全部能力,将其落地到具体的业务流程中,开展内部知识分享,在组织内点燃员工对AI的使用热情。如果没有这样的团队,企业的AI落地之路只会步履维艰。

Lenny那这支虎队应该由哪些人组成?是由工程师主导吗?还是说,你的经验里,这是一支跨职能团队?

Sherwin Wu这个问题很有意思。要知道,很多企业根本没有软件工程师岗位,而我观察到的规律是,最适合组建虎队的,是那些与软件工程相关、具备技术思维但并非专业软件工程师的人。

比如,客服团队的运营主管,他们不会写代码,但擅长使用各类工具,甚至是Excel高手,这类人往往对AI技术充满好奇和热情。他们是技术相关领域的从业者,具备一定的技术素养,是企业内部最容易被AI点燃的群体,围绕他们组建虎队,往往能事半功倍。

当然,软件工程师肯定能理解AI技术,但并非所有企业都有软件工程师,这类人才不仅稀缺,成本也很高。所以,上述这类技术相邻型人才,才是企业AI落地的核心力量。

Lenny也就是说,企业AI部署的最大反模式,就是单纯的自上而下推动——CEO和管理层一拍脑袋,喊出“AI优先的口号,要求全员使用AI,甚至将AI使用情况与绩效挂钩,却不组建自下而上的AI布道团队,这样的做法注定行不通。而正确的做法,是找到企业内部对AI最热情的人,将他们集中起来组建AI布道团队,探索AI的实际应用场景,再将经验推广到整个组织。

Sherwin Wu没错,你总结得很到位。这一点也和我的管理理念相通——找到AI落地中的高绩效者,全力为他们赋能。让他们牵头举办黑客马拉松、开展技术研讨会、做内部知识分享,在组织内播撒AI应用的火种,这才是最有效的方式。

开发者的核心启示:模型演进下的脚手架消亡” 与前瞻构建

Lenny接下来想听听你的几个独到观点,我之前看到你分享过,在AI领域,倾听客户需求并非总是正确的策略,甚至可能会让企业走入误区,为什么这么说?

Sherwin Wu其实这算不上什么激进的观点。首先必须明确:倾听客户需求是有价值的,企业当然要和客户沟通。但问题在于,AI领域的发展速度实在太快了,尤其是过去三年,我深耕API业务,亲眼见证了整个行业的演变——AI技术本身,包括模型在内,都在以极快的速度自我迭代、自我颠覆,尤其是在工具和底层架构领域。

这周我在X上看到FinTool初创公司创始人Nicholas的一篇文章,他分享了为金融服务领域构建AI智能体的最佳实践,其中有一句话我特别认同:模型会把你的脚手架当早餐吃掉。

回到2022ChatGPT刚发布时,当时的模型还很粗糙,为了让模型实现预期功能,开发者们在开发者领域搭建了大量的底层架构和产品框架,比如各类智能体框架、红极一时的向量存储,还有一大堆配套工具,这些都是为了引导模型、弥补模型能力的不足。

但随着AI技术的发展,模型能力突飞猛进,那些曾经不可或缺的架构,很多都被模型本身的能力所替代——这就是模型吃掉脚手架。即便到了今天,这个趋势依然在延续。Nicholas在文章中提到,现在主流的架构是技能框架、基于文件的上下文管理,但我敢断言,未来这些架构也可能失去价值:模型或许能自主完成上下文管理,甚至会出现全新的技术范式,让这些现有架构变得可有可无。

这样的例子比比皆是:曾经的智能体框架,如今实用性已大不如前;2023年,我们都以为向量存储是将企业内部信息融入AI模型的唯一方式,为此投入大量精力做向量化、嵌入、优化向量搜索,可这些工作本质上都是脚手架,只因当时的模型能力不足。而随着模型的进步,我们发现更好的方式是简化这些逻辑,相信模型本身的能力,只需为其配备通用的搜索工具即可——不一定是向量存储,甚至可以是文件系统中的普通文件,比如skillsAgents MD,就能实现对模型的引导。当然,向量存储如今仍有其应用场景,很多企业还在使用,但围绕它搭建的整套生态和架构,早已不是唯一选择,这就是最直观的变化。

回到是否要倾听客户需求的问题:正因为AI行业发展太快,任何一个时间点,客户的认知都处于局部最优解阶段。如果企业盲目听从客户,客户说想要更好的向量存储、更完善的智能体框架,企业就一味在这条路上深耕,最终只会困在局部最优解中,被技术迭代淘汰。

随着模型能力的提升,我们必须不断重新思考:该为模型搭建怎样的抽象层、工具和框架?这个过程充满未知,是一个不断移动的目标,这也是AI领域的魅力所在,但同时也要求企业:与客户沟通时,要平衡客户的即时需求和对模型未来发展的判断,着眼于未来1-2年的技术趋势。

Lenny这让我想到了AI和机器学习领域的苦涩教训”——越不要过度复杂化,越少给模型添加人为逻辑,模型的扩展性和成长性就越好。最好的方式,就是剥离多余的设计,让模型依靠自身的算力自主进化。

Sherwin Wu没错,AI落地领域也存在这样的苦涩教训:我们费尽心思为模型搭建各类架构,最终却发现,这些架构都会被不断进化的模型所替代。说实话,OpenAIAPI团队也犯过这样的错,在技术探索中走了不少弯路,但好在模型一直在进步,我们也在日复一日的实践中,不断领悟这个苦涩教训

Lenny那对于那些正在基于OpenAI API构建产品、开发智能体,现阶段不得不搭建一些底层架构的开发者,你有什么核心建议?

Sherwin Wu我的建议其实很简单,而且我已经和很多人说过,如今依然适用:为模型的未来而构建,而非为模型的当下而构建。AI模型的能力一直在变,这是一个移动的目标。我见过很多做得非常成功的初创企业,他们的策略是:瞄准模型未来的理想能力——哪怕当下这个能力只实现了80%,基于这个目标打造产品。这样的产品,当下可能勉强能用,看似差一点意思,但随着模型能力的提升,产品会突然迎来爆发——比如模型从5.1升级到5.2,就能彻底解锁产品的全部功能。

因为他们在产品设计之初,就把模型的未来进化考虑在内,这样打造的产品体验,远胜于假设模型能力一成不变的产品。当然,瞄准未来可能需要一点耐心,但AI模型的进化速度超乎想象,这份等待往往不会太久。

Lenny那顺着这个思路,未来6-12个月,OpenAIAPI、平台以及模型,会向哪个方向发展?你可以分享一些你最期待的方向,或是认为开发者应该提前准备的领域。

Sherwin Wu最明确的一个方向,是模型的长任务处理能力。目前有个Meter基准测试,专门追踪软件工程领域中,模型能连贯完成多长时间的任务——比如50%的成功率下,模型能完成数小时的软件工程任务;80%的成功率下,能完成不到一小时的任务。而这份测试图表最令人震撼的是,它纳入了历代模型的测试数据,能清晰看到模型长任务处理能力的飞速提升。

现在的产品,大多只针对模型的短任务处理能力做了优化,比如Codex这类编码工具,最多能高效处理10分钟左右的任务,虽然有人能将其推到数小时的极限,但这只是特例。而按照当前的发展趋势,未来12-18个月,模型将能非常连贯地处理数小时的长任务,甚至可能实现6小时、一整天的自主任务处理。

围绕这样的模型能力,产品形态也会发生巨大变化:开发者需要为模型设计反馈机制,不能让模型完全放任自流,但模型能完成的任务范围,会得到极大拓展,这是我最期待的方向。

第二个方向,是多模态模型的升级,尤其是音频领域。目前模型的音频处理能力已经不错,未来6-12个月还会有质的提升,尤其是原生多模态模型、语音到语音模型。同时,音频领域的新模型、新架构也在不断探索,潜力巨大。

而音频领域,尤其是企业和商业场景的音频应用,目前被严重低估了。大家总在谈论编码、文本,却忽略了我们日常的沟通大多是通过音频完成的,商业世界的很多业务、服务和运营,也都依赖音频交流。未来12-18个月,音频领域的AI应用会迎来爆发,这会是又一个重要的技术解锁点。

Lenny总结一下,就是未来智能体和AI工具的任务处理时长会持续提升,而音频和语音会成为AI应用的核心领域,迎来原生、深度的升级,对吗?我还看到你分享过另一个观点:你非常看好商业流程自动化在AI时代的机会,想听听你的看法。

Sherwin Wu这还是回到我之前说的——硅谷的从业者活在泡沫里。我们熟悉的软件工程、产品管理、产品打造,这些工作模式,和支撑整个经济运行的传统行业工作模式,有着天壤之别。我和传统企业客户交流时,最深的感受就是:非科技企业中,存在大量的标准化商业流程,这正是AI的巨大机会所在。

我可以做一个清晰的划分:软件工程属于开放式知识工作,没有固定的流程,充满探索性,这也是Codex这类工具能发挥巨大作用的原因——它能应对开放式的需求。但软件工程的核心特点是不可重复,比如开发一个功能,不会一遍又一遍地做完全相同的事,科技领域的很多工作,比如数据科学、战略财务,都属于这类。

而远离核心科技领域的传统行业,大多数工作都是标准化的商业流程——是可重复的操作,企业管理者会不断优化这些流程,形成标准作业程序(SOP),员工只需严格遵循,无需过多创新。比如拨打客服热线,客服人员会按照固定流程解答问题;联系公用事业公司,对方的服务也有明确的流程和边界。

这类工作正是我极度看好的AI应用领域,却因为和硅谷的工作模式差异太大,一直被低估。我一直在思考:如何将AI技术和现有工具框架,应用到商业流程自动化中——AI实现高确定性的重复流程自动化,并且与企业的业务数据、决策体系、内部系统深度融合,优化整个商业流程。

这个领域有巨大的潜力和工作要做,只是因为不在硅谷的舒适区,才被大家忽视了。

Lenny也就是说,你认为AI对企业生产力的提升,以及对从业者工作模式的改变,更大的机会不在工程领域,而在那些以重复性、可自动化任务为主的传统领域,对吗?

Sherwin Wu是的,AI不仅会改变这些领域的工作模式,更会重构整个工作流程。我和很多大型企业客户交流时,他们都会问:AI将如何改变我的公司?20年后的企业,会如何在AI时代运作?

软件工程当然是其中的一部分,但商业流程层面的变化会更加巨大,甚至超出想象。这个领域的市场规模非常可观,虽然我无法用具体的百分比来衡量它和软件工程的大小,但可以肯定的是,它的规模远比人们在X平台上讨论的要大得多——毕竟软件行业本身已经非常庞大,而商业流程自动化覆盖的行业,比软件行业还要广泛。

OpenAI 平台战略:生态开放与创业者的共赢机遇

Lenny聊一个创业者最关心的问题:如今大家都在基于OpenAIAPI构建产品,最担心的就是自己的创意被OpenAI看中,进而被OpenAI亲自打造的产品挤压,最终摧毁自己的市场。OpenAI在这方面的政策是什么?初创企业该如何判断,哪些领域是OpenAI大概率不会涉足的?

Sherwin Wu我的答案很简单:市场足够大,初创企业不必过度纠结OpenAI或其他大厂的布局。

我接触过很多初创企业,有失败的,也有极其成功的。我发现,所有失败的初创企业,都不是因为被OpenAI、谷歌这类大厂挤压,而是因为他们打造的产品,根本无法打动客户,无法与市场产生共鸣。而那些成功的企业,即便在编码这样的红海领域,也能脱颖而出——比如Cursor,如今已经成为行业巨头,核心原因就是它打造了用户真正喜爱的产品。所以我的建议是:不要过度焦虑大厂的竞争,专注打造用户真正需要、真正喜爱的产品,自然能在市场中占据一席之地。

我无法夸大当前AI领域的机会——AI打造产品的赛道无比广阔,甚至改变了风险投资的奥伯顿之窗(可接受的投资范围),VC们甚至会同时投资同赛道的多家竞争企业,这在以前是不可想象的。究其原因,就是AI领域的机会前所未有,市场空间足够容纳众多玩家。对初创企业来说,这是最具赋能性的时代:哪怕你的产品只打动了一小部分核心用户,也能打造出极具价值的企业,这就是我让大家不要过度思考大厂竞争的原因。

另外,从OpenAI的角度来说,有一点需要大家明确:我们从根本上把自己定位为生态系统平台公司,这是SamGreg从高层就一直强调的核心理念,我们无比珍视这一定位。APIOpenAI的第一款产品,我们始终认为,培育健康的AI生态、支持初创企业发展,而非挤压他们,才是核心目标。这一点,体现在我们的每一个决策中:我们在自有产品中发布的每一个模型,都会同步上线到API中;即便是针对Codex场景优化的专属模型,最终也会开放给所有API用户;我们不会保留任何核心能力,始终坚持平台中立,不屏蔽任何竞争对手,让所有开发者都能平等访问我们的模型。

我们最近还在测试ChatGPT登录这类产品,核心目的也是为了完善生态。我们坚信水涨船高”——OpenAI或许是AI生态中的航空母舰,但只有整个生态繁荣发展,所有玩家都能受益,OpenAI也会随之成长。事实上,正是因为我们坚持开放平台的理念,OpenAI API才实现了爆发式的增长。

所以我想鼓励所有开发者:不要把OpenAI视为竞争对手,不必担心被我们推开,专注打造有价值的产品就好。OpenAI会始终坚守初心,为大家提供开放的生态系统。

Lenny为什么打造开放平台、支持创业者,对OpenAI如此重要?这是从创立之初就定下的愿景吗?

Sherwin Wu这一切都源于OpenAI的核心使命和宪章:我们的使命有两个,一是构建AGI,二是让AGI的福祉惠及全人类。而惠及全人类,是其中的核心。

ChatGPT的推出,正是为了让更多人接触到AI,但我们深知,仅凭OpenAI一家公司,无法触达世界的每一个角落,无法覆盖所有的应用场景。这也是我们早在2020年就推出API的原因——我们需要打造一个平台,赋能全球的开发者和企业,让他们去打造更细分、更垂直的产品,比如为播客主打造的客服机器人、为时事通讯作者打造的辅助工具,这些都是OpenAI无法亲自完成的。

API的发展,也印证了这一愿景的正确性:我们通过和无数客户交流,看到了基于OpenAI API打造的千奇百怪的产品,覆盖了各个领域,这正是惠及全人类的最佳方式。所以,打造开放平台,从第一天起就是OpenAI的核心战略,是我们使命的具体体现。

Lenny你还没提到OpenAI即将推出的ChatGPT应用商店,这个项目是归你团队负责,还是由其他团队运营?

Sherwin Wu这是由ChatGPT团队负责的,不过我们两个团队的合作非常紧密。比如ChatGPT应用商店的Apps SDK,就是我们团队深度参与联合打造的。

但这一项目,本质上还是OpenAI开放生态理念的延续:ChatGPT目前拥有8亿周活跃用户,这是一笔巨大的资产,但如果能让更多企业和开发者参与进来,为这8亿用户打造专属产品,不仅能让用户获得更好的体验,还能进一步扩大ChatGPT的用户群体,最终实现生态的共赢。这一切,都回归到OpenAI的核心使命,而开放平台的理念,始终是我们的核心抓手。

Lenny我原本以为8亿是月活用户,没想到是周活,这个数字太惊人了,堪称前所未闻。

Sherwin Wu是的,从规模来看,这意味着全球约10%的人口,每周都会使用ChatGPT,而且这个数字还在快速增长,这一点真的让人难以置信。

Lenny我想再强调一下你刚才的观点:OpenAI的使命是让AI惠及全人类,有些人对此不以为然,觉得“AI都是要花钱的,但他们忽略了,ChatGPT有免费版本,任何人都可以使用,而免费版的能力,和付费的顶级AI模型相差无几,完全没有使用门槛。哪怕是亿万富翁,能从AI中获得的价值,和非洲村庄里的普通人相比,也并没有太大差距。这一点,OpenAI一直做得非常好。

Sherwin Wu没错,这也是我们深耕医疗、教育等公益领域的原因——这些领域是AI惠及全人类的重要载体。

还有一个令人振奋的趋势:ChatGPT免费版的能力,一直在飞速提升。2022年的免费版,在当时已经很不错,但和如今的GPT-5免费版相比,能力早已不可同日而语。我们一直在做的,就是不断提高AI技术的底线,让全世界的人都能享受到AI发展的红利,这是我们使命的核心。

另一方面,AI也实现了消费平等:就像普通人用的iPhone,和扎克伯格这样的亿万富翁用的没有区别;AI也是如此——每月20美元,就能使用和亿万富翁同款的AI模型;每月200美元的Pro版,更是能解锁顶级能力,而事实上,亿万富翁日常使用的,也只是普通的Plus版。

这种技术的民主化,让AI的福祉跨越阶层、跨越地域,惠及全世界,这对我们来说意义重大,也是驱动我们所有工作的核心动力。

Lenny最后一个问题,对于那些想基于OpenAI API打造产品,或是想尝试用OpenAI模型和API做创新的开发者,你能介绍一下,OpenAIAPI和平台,具体能为他们提供哪些能力吗?我知道可以构建智能体,还有其他的核心能力吗?

Sherwin Wu从本质上来说,OpenAI API的核心是提供一系列开发者端点,让开发者能调用我们的模型能力,其中目前最受欢迎的,是Responses API。这个端点是专为长时间运行的智能体打造的,开发者只需向模型输入文本指令,模型会持续处理任务,开发者可以实时获取模型的处理进度,最终得到完整的响应结果。这是我们为开发者提供的最底层的核心原语,也是目前最主流的开发方式——它足够灵活,不设任何使用限制,开发者可以基于它实现任何创意。

在这个底层原语之上,我们还搭建了多层抽象架构,为开发者提供更便捷的工具,降低开发门槛:第一层是Agents SDK,现在已经非常受欢迎。它基于Responses API等核心端点构建,能让开发者更轻松地打造传统意义上的AI智能体——比如能无限循环工作的智能体、能将子任务委托给子智能体的智能体,还能为智能体设置护栏、实现多智能体的协同编排,相当于为开发者搭建了智能体开发的基础框架。

第二层是Agent Kit,聚焦于智能体的部署环节。它提供了一系列现成的UI组件,开发者可以用这些组件,快速为基于OpenAI APIAgents SDK打造的智能体,搭建美观、易用的用户界面——毕竟很多智能体的UI需求都是相似的,Agent Kit能大幅节省开发时间。

除此之外,我们还提供了Evals API等测评工具:开发者可以通过这些工具,对智能体或业务流程进行量化测试,验证其有效性,确保产品的稳定性。

总的来说,OpenAI的平台是多层级、可灵活选择的:开发者可以使用整套工具栈,快速搭建一个智能体;也可以深入底层,直接调用核心API,打造完全定制化的产品——底层的开放性,让开发者拥有无限的创新空间。

LennySherwin,还有什么想和听众分享的吗?在进入快问快答环节前,还有哪些我们没聊到,但你认为对开发者和创业者有价值的内容?

Sherwin Wu我只想说一点:未来2-3年,将是科技界和初创领域有史以来最具机遇的黄金时期,希望大家不要辜负这个时代。

2014年进入职场,前几年行业确实充满活力,但之后有5-6年,科技界的发展陷入平缓,缺乏令人兴奋的创新。而过去三年,是我职业生涯中最疯狂、最令人振奋、最充满活力的三年,AI技术的发展,让整个行业重新焕发生机。

而未来2-3年,这种趋势还会持续,甚至会更猛烈。我们将有机会探索更多酷炫的技术,发明更多创新的产品,重构世界的运行方式,改变人类的工作模式。这样的机会,千载难逢,我一直在提醒自己,不要把这一切视为理所当然,也希望所有人都能珍惜。

终有一天,AI的发展会进入平稳期,技术进步会变得循序渐进,但现在,我们正处于技术爆发的核心阶段,尽情探索就好。

Lenny这个观点太有力量了。你说不要辜负这个时代,那对于不想错过这波AI浪潮的人,你有什么具体的建议?比如是亲自打造产品、深入学习AI技术,还是加入一家专注AI的企业?

Sherwin Wu核心就两个字——参与。就像你说的,深入学习AI技术、基于API打造工具,这都是参与的方式;但更重要的是,哪怕不是软件工程师,也能参与其中。AI会改变几乎所有行业的工作模式,普通人只需做两件事:一是主动使用AI工具,二是深入理解AI的能力边界——知道它能做什么、不能做什么,然后观察模型能力的进化趋势,找到AI与自身工作的结合点。说白了,就是主动去熟悉AI技术,适应AI工具,而不是被动观望,让这波浪潮从身边溜走。

Lenny但另一方面,很多人也会感到焦虑:AI行业的发展太快了,每天都有新的技术、新的产品出现,比如这周Claude推出了新的Bot功能,大家会担心自己跟不上节奏,被行业淘汰。你身处AI行业的核心,是如何应对这种焦虑,避免被海量的信息淹没的?

Sherwin Wu说实话,我自己可能不是一个好榜样——我几乎时刻泡在X平台和公司的Slack里,会主动吸收海量的行业信息。但我观察到一个规律:行业里的大部分信息,其实都是噪音,根本无需全部吸收。很多人感到焦虑,就是因为想抓住每一个新消息、每一项新技术,这完全没有必要。事实上,只需深耕1-2AI工具,从简单的应用开始,就足以抓住AI浪潮的核心。现在的行业焦虑,很大程度上是由行业的狂热节奏和X平台的信息轰炸造成的,看似每天都有新动态,实则大部分都是无关紧要的噪音。不必追求掌握所有AI技术,哪怕只是安装Codex客户端尝试一下,或是让ChatGPT接入你的NotionSlackGitHub等内部数据源,看看它能为你的工作带来哪些改变,这就已经是很好的开始了。

快问快答

Lenny接下来进入快问快答环节,我准备了5个问题,你准备好了吗?第一个问题:你最常推荐给别人的两三本书是什么?

Sherwin Wu我推荐一本虚构类、两本非虚构类。虚构类是我刚读完的《There Is No Anti-memetics Division》,作者是QNTM,是一位网络作家,我在X上看到有人推荐,一读就停不下来,两天就看完了。这是一本科幻小说,讲述了一个政府机构对抗能让人遗忘其存在的事物的故事,文笔极佳,创意十足,视角非常新颖,而且无意间还带着一丝幽默——明明是科幻悬疑风格,却让我笑了好几次,非常推荐。

非虚构类我推荐两本,都是过去一年读的,让我对中美关系有了全新的认识:第一本是王丹的《Breakneck》,书中将美国比作律师型社会,将中国比作工程型社会,分析了两种社会模式的优劣,读完后我深有感触,确实觉得美国的社会运行逻辑,更多是由律师主导的;第二本是Patrick McGee写的关于苹果与中国的书,我本身是资深苹果粉,桌上全是苹果产品,这本书不仅揭秘了苹果与中国的深层合作关系,还曝光了很多苹果内部的运营细节,情节紧凑,非常值得一读,而且也贴合当下的时代背景。

Lenny这本科幻小说听起来太精彩了,我现在就去买。

Sherwin Wu有几百页,篇幅不长,很容易读进去。

Lenny第二个问题:你最近喜欢的电影或电视剧是什么?

Sherwin Wu这个问题有点难,因为我有两个孩子,工作也很忙,几乎没什么时间追剧。不过最近几周,看了几集《咒术回战》第三季,我本身是个动漫迷,这部作品真的很棒。我一直很喜欢日本动漫,因为它的剧情和世界观设定,远比西方媒体更独特、更新颖,敢于尝试各种天马行空的创意,这是我最欣赏的地方。不过平时真的没太多时间看,也就偶尔看几集《咒术回战》解解馋。

Lenny作为OpenAI的高管,这完全可以理解。第三个问题:你最近发现的、特别喜欢的产品是什么?

Sherwin Wu最近家里需要搭建Wi-Fi和家庭网络,我接触到了Ubiquiti的路由器和安防摄像头,之前从未听说过这个品牌,一直用的是基础款设备,这次体验后彻底被圈粉了。Ubiquiti堪称家庭网络领域的苹果,产品设计非常精致,而真正让我惊艳的,是它的软件体验——配套的移动应用,能轻松管理整个家庭网络,操作非常便捷。它的路由器需要家里布置以太网线路,门槛稍高,但安防摄像头是真的好用:接入Ubiquiti生态后,通过移动应用、Apple TViPad,都能实时查看摄像头画面,体验极佳。虽然价格稍高,但性价比非常高,是我近期体验最好的产品。

Lenny我用的是Eero,看来是选错了。

Sherwin WuEero也不错,但我现在已经彻底换成Ubiquiti了。

Lenny第四个问题:有没有一句人生座右铭,在工作和生活中,一直指引着你?

Sherwin Wu有,我一直告诉自己:永远不要为自己感到难过。工作和生活中,总会遇到各种各样的挫折和困难,但越是这样,越要提醒自己:不要沉溺于负面情绪,每个人都有掌控自己人生的主观能动性,只要愿意,总能重新站起来。这句话我不仅常对自己说,也会分享给身边的人。

Lenny最后一个问题:你之前在Opendoor工作,带领团队打造了房屋定价模型,决定公司为每套房子开出的价格。在这个过程中,有没有哪些房屋定价的影响因素,是你当初完全没预料到,但实际却非常关键的?

Sherwin Wu有很多,我挑几个最有意思的:第一个是高压输电线,它对房价的影响远超我的想象。直到我去达拉斯考察,看到紧邻高压输电线的房子,能听到持续的嗡嗡声,才明白其中的原因——有孩子的家庭,会非常在意居住环境的安全性,不愿让孩子靠近高压输电线,这直接导致了这类房子的价格下跌。

第二个是户型图,这是我们最难量化的一个因素。户型的好坏对房价的影响很大,但如何定义好户型,却没有统一的标准——比如厨房的宽度、布局,主卧的位置,这些细节都影响着居住体验。我们曾遇到过很多卖不出去的房子,运营团队现场考察后,给出的结论都是户型有问题,这种问题无法用数据量化,只能靠直观感受——走进房子,就能感觉到户型的别扭。

第三个是房屋的外立面颜值和前门设计,我低估了它的重要性。Zillow有本书里提到,更换前门是房屋改造中投资回报率最高的项目,原因很简单:购房者第一眼看到的,就是房屋的外立面和前门,第一印象直接影响购房决策,这一点在实际定价中,起到了意想不到的作用。

Lenny太有意思了,你们竟然需要用代码,去量化这些看似主观的因素。

Sherwin Wu没错,尤其是户型图,当时遇到了很多困难——很多房子的户型图都没有数字化,只有凤凰城、达拉斯等少数城市,有一些人手里保留着纸质户型图,那段时间发生了很多有趣的故事,都是Opendoor时期的珍贵回忆。

LennySherwin,非常感谢你今天的分享,内容太精彩了。最后想问问,大家可以在哪里在网上关注你?听众们又能为你做些什么?

Sherwin Wu大家可以在X平台上关注我,我的账号是@SherwinWu,平时会分享一些OpenAI的最新动态、API的使用技巧,以及我们新推出的产品。至于听众能为我做些什么:我非常喜欢听大家分享自己的创业项目和创新想法,如果有人正在做AI初创项目,或是有一些有趣的AI创意,欢迎在X上私信我,我很乐意了解大家的作品,也会尽我所能,为大家提供OpenAI的技术支持。

Lenny再次感谢Sherwin来到节目,今天的分享让我们受益匪浅。

Sherwin Wu谢谢你,Lenny,也谢谢各位听众,再见。

原视频:AI is eating engineering | Sherwin Wu (OpenAI) on the next 12-24 months of AI

https://www.youtube.com/watch?v=B26CwKm5C1k

编译:Qihan Huang

请注意,本文编译自文末载明的原始链接,不代表Z Potentials立场。如果您对本文有任何想法或见解,欢迎在评论区留言互动探讨。

Z Potentials将继续提供更多关于人工智能、机器人、全球化等领域的优质内容。我们诚邀对未来充满憧憬的您加入我们的社群,与我们共同分享、学习、成长。

图片[3]-深度|OpenAI API华人工程负责人:模型会把你的脚手架当早餐吃掉,为模型的未来而构建,而非为模型的当下而构建-AI Express News
图片[4]-深度|OpenAI API华人工程负责人:模型会把你的脚手架当早餐吃掉,为模型的未来而构建,而非为模型的当下而构建-AI Express News
图片[5]-深度|OpenAI API华人工程负责人:模型会把你的脚手架当早餐吃掉,为模型的未来而构建,而非为模型的当下而构建-AI Express News
图片[6]-深度|OpenAI API华人工程负责人:模型会把你的脚手架当早餐吃掉,为模型的未来而构建,而非为模型的当下而构建-AI Express News
图片[7]-深度|OpenAI API华人工程负责人:模型会把你的脚手架当早餐吃掉,为模型的未来而构建,而非为模型的当下而构建-AI Express News
图片[8]-深度|OpenAI API华人工程负责人:模型会把你的脚手架当早餐吃掉,为模型的未来而构建,而非为模型的当下而构建-AI Express News

 

<原文链接:https://mp.weixin.qq.com/s/sJeKJd1WrXdKclPTrAh__w

© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容