炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
文:Web3天空之城| 未经许可不得转载
【城主说】最新AI编程界动静不少,除了之前Windsurf被Antrhopic背刺不允许其使用自家API,最近更有AI编程一哥Cursor融资的消息。
根据截至2025年6月的报道,Anysphere在最新一轮融资中筹集了高达9亿美元的资金。这轮融资由Thrive Capital领投,Andreessen Horowitz (a16z)、Accel和DST Global等知名投资机构也参与其中。
这次大规模融资使Anysphere(Cursor)的估值达到了惊人的99亿美元。这距离其在2024年12月完成B轮融资时的26亿美元估值有了近四倍的增长,凸显了投资者对其发展轨迹的强烈信心。此次融资是Anysphere在不到一年时间里的第三次主要融资活动,使其总融资额超过了10亿美元。
截至2025年6月初,Cursor的年度经常性收入(ARR)已经超过了5亿美元。这一数字的增长速度非常惊人,据报道,其ARR大约每两个月就翻一番。作为对比,该公司在2025年4月中旬的ARR据报道为3亿美元(本文所整理的5月Lenny访谈视频的标题就是ARR 3亿美元的AI工具,而在2024年底才刚刚达到1亿美元。
凭借其惊人的增长速度,Cursor被认为是历史上从100万美元增长到1亿美元ARR最快的SaaS公司之一,仅用了大约12个月的时间。
这些数据表明,由前OpenAI和特斯拉工程师创立的Anysphere,凭借其创新的AI编程工具Cursor,已经成为AI开发者工具领域估值最高、增长最快的初创公司之一。
Cursor不仅在改变工程师构建软件的方式,更在预示着一个全新时代的到来。其背后的掌舵人,联合创始人兼CEO Michael Truell,是一位深入研究AI长达十年、并对技术和商业史有深刻洞见的思考者。
在五月最新的深度访谈中,Michael Truell分享了他对“后代码时代”的构想,并揭示了Cursor历史性增长背后的产品哲学与反直觉的技术策略。这篇访谈的核心洞见,将帮助我们理解软件开发的未来将走向何方。
(注:5月访谈当时标题还是ARR 3亿)
一 | “后代码时代”的来临:工程师将成为“逻辑设计师”
Michael Truell提出了一个颠覆性的概念:“后代码时代”。他认为,未来软件的构建将超越我们今天所熟知的、由形式化编程语言(如TypeScript, Go)主导的模式。它既不会是简单的文本编辑,也不会是完全交给一个聊天机器人去执行的模糊指令。
他构想的未来是一种更高层次的编程范式,工程师的角色将从具体的代码实现者,演变为“逻辑设计师”。他们的核心工作将是清晰地表达软件应该如何运作的意图,而底层的复杂实现将由AI处理。
这种范式旨在解决当前两种极端愿景的弊端:纯聊天机器人模式缺乏精确控制,而维持现状的模式又低估了技术进步的潜力。在“后代码时代”,人类将始终掌握主导权,以一种更直观、更接近自然语言的方式,精准地控制软件的每一个细节。
二 | 品味将是核心技能,比精通语法更重要
当AI越来越多地接管“如何实现”的底层工作后,什么将成为工程师最有价值的技能?Michael的答案是:品味(Taste)。
这里的“品味”不仅指视觉设计或流畅交互的美学判断,更深刻地指向一种对软件逻辑的品味——即对“应该构建什么”以及“它应该如何运作”的正确直觉和深刻理解。随着AI将工程师从繁琐的语法和细节中解放出来,决定产品成败的关键,将更多地取决于这种高层次的构想和设计能力。
他进一步指出,这意味着工程师的核心关注点将从“小心谨慎地避免犯错”逐渐转向“富有品味地进行创造”。这种转变将赋予那些对产品有深刻见解的“品味引领者”前所未有的能力,让他们能够毫不费力地将愿景转化为现实。
三 | Cursor的秘密武器:反直觉的混合模型技术栈
许多人将AI应用简单地视为大型语言模型(如GPT-4)的“封装”,但Michael揭示了Cursor成功的关键技术策略,这恰恰是一种反直觉的路径——混合模型开发。最初,他们也认为自己不需要自研模型,但实践证明,这是产品成功的核心。
Cursor并非简单地调用外部API,而是构建了一个复杂的、将大型基础模型与自研定制模型深度结合的技术栈。
这个混合技术栈的运作方式是:
这种“大型模型负责思考,自研模型负责执行和优化”的策略,不仅极大地提升了产品质量和响应速度,也构成了Cursor难以被轻易复制的核心技术护城河。
四 | 超越巨头:AI时代的跨越式发展机遇
Cursor的惊人增长几乎完全依赖于产品本身的口碑,而非销售或市场营销。这种产品驱动的模式背后,是Michael对当前市场机遇的深刻判断。他认为,AI领域的天花板极高,为初创公司提供了通过持续创新超越现有市场领导者的机会,这与早期搜索引擎和个人电脑市场的历史极为相似。
他观察到,即使是像微软这样拥有Copilot和巨大分销渠道的巨头,也未必能锁定胜局。因为在这个领域,用户可以轻松切换工具,最终的选择标准是哪个产品最具创新性、体验最好。这为像Cursor这样专注、偏执于打磨产品的团队创造了巨大的空间。
一个漫长而混乱的、属于“无畏者”的时代
在访谈的最后,Michael强调,我们正处在一场比互联网影响更深远的技术变革中,但这将是一个长达数十年的漫长而混乱的演进过程。它不会一蹴而就,也不会像某些人想象的那样,是一个毫无希望的虚假繁荣。
对于那些希望在这场变革中有所作为的人,无论是工程师、研究者还是创业者,他给出的唯一建议是:无所畏惧。因为最大的机会,恰恰蕴藏在那些看似疯狂、需要巨大勇气去探索的未知领域之中。而Cursor的使命,正是在这个漫长的过渡期中,为那些“逻辑设计师”们,打造出通往“后代码时代”的最佳工具。
天空之城访谈全文整理版
Lenny: 今天,我的嘉宾是 Michael Truell。 Michael 是 AnySphere 的联合创始人兼首席执行官,AnySphere 是 Cursor 背后的公司。如果你一直与世隔绝,没有听说过 Cursor,那么它是一款领先的 AI 代码编辑器,并且正处于改变工程师和产品团队构建软件方式的最前沿。它也是有史以来增长最快的产品之一,在推出仅 20 个月后就达到了 1 亿美元 ARR,并在推出两年后达到了 3 亿美元 ARR。Michael从事人工智能研究已经有10年了。他在麻省理工学院学习了计算机科学和数学,曾在麻省理工学院和谷歌从事人工智能研究,并且是一名技术和商业史的研究者。很快你就会发现,Michael对事物的发展方向以及未来软件构建的形态有着深刻的思考。我们探讨了Cursor的起源故事,他对代码之后会发生什么的预测,他从构建Cursor中获得的最大反直觉的经验教训,他认为软件工程师的发展方向,以及更多其他内容。米迦勒很少参加播客节目。他唯一做过的其他播客节目是莱克斯·弗里德曼的节目。因此,能邀请到米迦勒参加我们的节目,真是莫大的荣幸。
迈克尔,非常感谢您能来到这里。欢迎来到播客节目。
Michael: 谢谢。很高兴能来到这里。谢谢邀请我。
洞见未来:代码之后的世界
Lenny: 早些时候我们聊天时,您提到了一个非常有趣的短语,即代码之后会是什么。请谈谈这个,就像您对未来走向的设想,即从代码转向其他某种东西。
Michael: 我们使用Cursor的目标是发明一种新型的编程方式。一种截然不同的软件构建方式。所以在我看来,这是一个某种程度上代码之后的世界,越来越多的工程师会开始觉得自己像是逻辑设计师。实际上,这将是关于明确你对于一切如何运作的意图。我们创建Cursor的目标是发明一种新型的编程方式,一种非常不同的软件构建方式,它被精简为你以最简洁的方式向计算机描述你想要的意图,真正地精简到你只需定义你认为软件应该如何工作以及应该如何呈现。是的,凭借我们今天拥有的技术以及技术的不断成熟,我们认为您可以达到这样一个境地:您可以发明一种软件构建方法,它在层级上更高,效率更高,在某些情况下也更易于访问。这个过程将是一个逐渐远离当今软件构建方式的过程。
而且我想将它与未来软件形态的可能愿景进行对比,我认为大众意识中存在一些我们至少有些不认同的愿景。一种观点认为,未来软件构建的方式将与今天非常相似,主要意味着文本编辑,以及像TypeScript、Go、C和Rust这样的形式化编程语言。还有另一种观点认为,你只需向一个机器人输入指令,要求它为你构建某些东西,然后要求它更改你正在构建的东西。这有点像这种,你知道的,聊天机器人或Slack机器人风格,你在和你的工程部门对话。我们认为这两种愿景都存在问题。我认为在,你知道,聊天机器人风格的末端,而且我们认为它看起来会比两者都更奇怪。聊天机器人风格末端的问题在于缺乏足够的精确性。如果你希望人类完全掌控软件的外观和工作方式,你需要让他们能够,你知道,手势表达他们想要进行的更改,你知道,以一种比仅仅在文本框中输入“更改我的应用程序的这个部分”更精确的形式,移除整个东西。然后,你知道,那种什么都没有改变的世界版本,我们认为那是错误的,因为我们认为技术将会变得越来越好。
所以一个世界,你知道,在某种程度上,在代码之后,我认为它看起来像一个你拥有软件逻辑的表达的世界,这个表达更像英语,对吧?你已经写下来了,你可以想象成文档形式,你可以想象成编程语言朝着伪代码演进,你已经写下来了,你知道,软件的逻辑,你可以在一个高层次上编辑它,并且你可以指向它。它不会是那种无法理解的数百万行代码。相反,它会是更真实、更容易理解和更容易浏览的东西。但是,那种难以理解的符号开始朝着更容易被人阅读和编辑的方向演变的世界,正是我们努力的方向。
Lenny: 这是一个深刻的观点。我认为我想确保人们不要错过你在这里所说的,也就是说,你在明年设想的是,基本上,当事情开始转变时,人们会远离甚至看到代码,不必用代码,比如JavaScript和Python来思考。并且会出现这种抽象,本质上是用更像英语句子的伪代码来描述代码应该做什么。
Michael: 我们认为最终会变成那样。我们非常坚定地认为,这条道路必须经过现有的专业工程师。而且它看起来像是从代码进化而来。而且它绝对看起来像是人类仍然在驾驶座上,对吧?而且人类对软件的各个方面都拥有大量的控制权,并且不会放弃这些控制权。而且人类还能够非常快速地进行更改,比如拥有一个快速的迭代周期,而不是像,你知道的,在后台运行一些非常慢的东西,并且需要几周的时间。去为你做所有的工作。
重新定义工程师:品味与逻辑设计
Lenny: 这就引出了一个问题,对于那些目前是工程师或正在考虑成为工程师、设计师或产品经理的人来说,你认为在后代码时代,哪些技能会变得越来越有价值?
Michael: 我认为品味将变得越来越有价值。而且我认为人们通常会在软件领域中思考品味。他们会想到,你知道的,视觉效果,或者对流畅动画的品味,以及着色、用户界面、用户体验等等,关于事物的视觉设计。我认为越来越,你知道,事物的视觉方面是定义一款软件的重要组成部分。但是,正如之前提到的,我认为定义一款软件的另一半是它的逻辑以及事物如何运作。我们有很棒的工具来详细描述事物的视觉效果。但是,当你深入研究一款软件的逻辑时,目前我们拥有的最佳表示方式实际上是代码。你可以用 Figma 来大致表示,也可以用笔记来大致表示。但是,你知道,当你有一个实际可用的原型时。因此,我认为越来越,成为一名工程师会开始感觉像是成为一名逻辑设计师。而且实际上它将是关于详细说明你希望一切如何运作的意-图。它将较少关于...它将更多关于“是什么”,而较少关于你将如何在底层具体地“如何”做事情。
所以,是的,我认为品味将变得越来越重要。我认为软件工程的一个方面,而我们现在距离这个目标还很遥远,互联网上有很多有趣的梗,是关于人们在工程方面,围绕构建存在明显缺陷、问题和功能问题的应用程序时,如果过于信任人工智能,可能会遇到的种种考验和磨难。但我认为我们会达到一个阶段,在那里,作为一名软件工程师,你可以不必那么小心谨慎,而现在小心谨慎是一种极其重要的技能。是的,我们会从小心谨慎稍微转向品味。
Lenny: 这让我想到了“氛围编码”。当你谈到不必过多考虑细节,只需顺其自然时,你描述的是不是类似的东西?
Michael: 我认为这有关联。我认为现在的“氛围编码”恰恰描述了这样一种颇具争议的创作状态:你生成了大量代码,但实际上并不理解其中的细节。这是一种会导致很多问题的创作状态。如果现在不理解底层的细节,你很快就会陷入某种境地,在某个时刻受到限制,你创造出的东西足够大,以至于无法改变。因此,我认为我们感兴趣的一些想法是,当人们并不真正理解代码时,如何让他们持续控制所有的细节?我认为那里的解决方案与现在进行氛围编码的人们非常相关。我认为目前我们缺乏让品味引领者真正完全掌控软件的能力。因此,氛围编码以及让人们的品味真正闪耀的问题之一是,你可以创造东西,但很多时候是由人工智能做出笨拙的决定,而你无法控制。
Lenny: 沿着这些思路再问一个问题。你抛出了“品味”这个词。当你说品味时,你在想什么?
Michael: 我认为是对应该构建什么有正确的想法。然后,这将变得越来越像是毫不费力地翻译——这里是你想要构建的东西。这是你希望一切如何运作。这是你希望它看起来的样子。然后你就能在电脑上实现这个目标。届时,将不再是这样一种翻译层面的问题,例如,你和你的团队已经构想出想要构建的东西。而是你必须非常费力地,以劳动密集型的方式将其布局成电脑可以执行和解释的格式。所以,是的,我认为,你知道的,在用户界面方面投入精力要少一些。或许品味用词不太准确,但指的是对应该构建什么有一个正确的想法。
Cursor 的诞生:从迷茫到专注
Lenny: 太棒了。好的。我稍后会回到这些话题,但我想先把我们拉回到 Cursor 的最初。我从未听过它的起源故事。我认为很多人都不知道整个事情是如何开始的。基本上,你们正在打造世界上增长最快的产品之一。它正在改变人们构建产品的方式。它正在改变职业和行业。它改变了很多。这一切是如何开始的?在早期阶段的旅程中,有哪些令人难忘的时刻?
Michael: Cursor的启动有点像是在寻找问题的解决方案。在某种程度上,它很大程度上来自于对人工智能在未来10年内将如何变得更好的反思。有两个关键的决定性时刻。其中一个是在使用GitHub Copilot的第一个beta版本时感到非常兴奋。这是我们第一次使用真正、真正、真正有用的AI产品。而且确实是有用的。而不仅仅是空有其表的演示产品。除了是第一个有用的AI产品之外,GitHub Copilot也是我们所采用的最有用的,如果不是最有用的,开发工具之一。这让我们非常兴奋。另一个让我们非常兴奋的时刻是OpenAI和其他机构发表的一系列关于扩展规模的论文,这些论文表明,即使我们没有新的想法,仅仅通过拉动简单的杠杆,比如扩大模型规模,以及扩大输入模型的数据规模,人工智能也会变得越来越好。
因此,在2021年底、2022年初,这让我们对AI产品成为可能感到兴奋。这项技术将在未来走向成熟。而且当我们环顾四周时,感觉很多人都在谈论制作模型。感觉人们并没有真正选择某个知识领域的工作,并思考着随着人工智能变得越来越好,它会变成什么样。这使我们走上了构思生成的道路。随着这项技术的日益成熟,这些知识工作领域在未来将如何变化?最终的工作状态会是什么样的?我们用来完成这项工作的工具将如何改变?为了支持工作的变化,模型需要如何改进?一旦规模化和预训练耗尽,我们将如何继续推进技术能力?
第一年开始时的失误是我们实际上致力于...我们做了这个宏大的练习。我们决定研究一个我们认为相对没有竞争力、沉闷且乏味的知识工作领域。并且没有人会关注它。因为我们当时想,哦,编程太棒了。编程完全可以与人工智能互换。但人们已经在这样做了。因此,最初有四个月的时间,我们实际上是在研究一个非常不同的想法,即帮助自动化和增强机械工程,并为机械工程师构建工具。你知道,从一开始就存在一些问题。我们,你知道,我和我的联合创始人,我们都不是机械工程师。你知道,我们有一些朋友是机械工程师,但我们对这个领域非常不熟悉。所以从一开始就有点像盲人摸象的问题。你知道,存在一些问题,比如,你如何真正地利用现有的模型,并使它们对机械工程有用?我们的最终结论是,你需要从一开始就开发自己的模型。我们做这件事的方式很棘手。而且,你知道,互联网上没有太多关于不同工具和零件的3D模型的数据,以及构建这些3D模型所采取的步骤的数据。而且,从拥有这些数据的来源获取它们也是一个棘手的过程。但最终发生的事情是,你知道,我们醒悟过来了。我们意识到我们对机械工程并不是特别感兴趣。这不是我们想要奉献一生的事情。我们环顾四周,在编程领域,感觉就像,你知道,尽管已经过去了相当长的时间,但并没有发生太大的变化。而且感觉在这个领域工作的人可能与我们存在脱节,感觉他们对未来一切的发展方向不够有雄心壮志,以及所有软件的创建将如何通过这些模型进行。这就是促使我们走上构建Cursa之路的原因。
Lenny: 好的,很有意思。好的,首先,你经常会听到这样的建议:进入枯燥的行业,因为那里不会有很多人,而且存在机会。而且,你知道,有时候它会奏效。但我喜欢在这个旅程中,就像,不,实际上去追求最热门、最受欢迎的领域,人工智能、编程、应用开发。而且它成功了。刚才你表达的方式是,你可能觉得野心不够,但你认为还有更多事情可以做。所以感觉这是一个有趣的教训。即使某件事情看起来,好吧,已经太晚了,已经有GitHub,或其他一些产品存在。如果你注意到他们的野心不够,或者不如你,或者你看到了他们方法上的缺陷,那么仍然存在很大的机会。这能引起共鸣吗?
Michael: 完全能引起共鸣。而且我认为,其中一部分是你需要有能够发生的跨越式发展。你需要有你能做的事情。我认为人工智能令人兴奋之处在于它应用广泛,而且我认为这在我们所处的领域仍然非常适用。你可以谈论我们如何思考这个问题,以及我们如何处理这个问题。但我认为仅仅是(发展的)上限就非常之高。是的,如果你环顾四周,即使你拿出任何这些领域中最好的工具,未来几年也应该还有很多事情要做。因此,拥有这样的空间,拥有如此高的上限,我认为在软件领域是独一无二的,至少人工智能的高度是如此。
产品战略:为什么选择自建 IDE
Lenny: 让我们回到ID(身份识别)问题上来。你可以采取几种不同的途径,其他公司正在采取不同的途径。其中一种是构建一个ID(集成开发环境),供工程师在其中工作,并为其添加人工智能的魔力。还有另一种途径,就是完全的人工智能代理型Devon之类的产品。然后还有一种模型,非常擅长编码,专注于构建尽可能最好的编码模型。是什么让你决定并认为ID路径是最佳路线?
Michael: 从一开始就致力于单一模型或端到端自动化编程的人们,我认为他们试图构建的东西与我们截然不同,我们关心的是让人类能够控制他们正在构建的最终工具中的所有决策。而且我认为这些人非常看好这样一个未来,即端到端的一切都由人工智能完成。也许人工智能也会做出所有的决定。所以,第一,这里面有一种个人兴趣的成分。第二,我认为我们一直都在努力以强烈的现实主义态度看待当今的技术水平。当然,我们对人工智能在未来几十年里的发展成熟感到非常非常兴奋。但是,你知道,我认为有时候人们,有一种本能会看到人工智能在一个领域里做着神奇的事情,然后就把这些模型拟人化,认为它比这里的一个聪明人还要好。所以它一定比那里的一个聪明人更好。但这些东西存在着巨大的问题。而我们,从一开始,我们的产品开发流程就真的是关于内部测试,并且每天都在高强度地使用这个工具。我们从不想发布对我们自己没有用的任何东西。而且,你知道,我们能够这样做,是因为我们是自己产品的最终用户。而且我认为,这让你对当前的技术现状有了一种现实感。
因此,这绝对让我们认为,需要人类来掌握主导权。人工智能无法完成所有事情。出于个人原因,我们也有兴趣赋予人类这种控制权。因此,这使你不再仅仅是一家模型公司,也使你不再仅仅关注那种没有人为控制的端到端的东西。然后,你选择集成开发环境(IDE)而不是现有编码环境的插件的方式,是因为你相信编程将会流经这些模型。编程行为在未来几年内将会发生很大的变化。而且现有编码环境的可扩展性非常、非常、非常有限。所以,如果您认为用户界面可能会发生很大的变化,如果您认为编程的形式因素将会发生很大的变化,那么您就必须掌控整个应用程序。
Lenny: 我知道你们今天有集成开发环境(IDE),这可能就是你们对未来的发展方向的偏见。但我很好奇,您是否认为未来的一个重要组成部分也将是人工智能工程师,他们只是坐在Slack里,为你做事情?这是否有一天会融入到Cursor中?
Michael: 我认为您会希望能够在所有这些事物之间相当轻松地切换。有时我认为您会希望让某些东西在一段时间内自行运行。然后我认为您会希望能够引入人工智能的工作成果,然后非常、非常、非常迅速地处理它,对吗?然后也许让它再次自行运行。因此,这些诸如背景与前景的形式因素,我认为你们希望所有这些都能在一个地方良好地协同工作。而且我认为,对于背景性的东西,有一部分编程特别有用,即那些很容易明确指定你想要什么,并且不用过多描述,也很容易明确正确性是什么样子的编程任务,也不用过多描述。通常来说,bug修复是这类任务的一个很好的例子,但它肯定不是编程的全部。
所以我认为,IDE(集成开发环境)将会发生彻底的改变。并且,我们自己开发编辑器的做法是基于,它必须随着时间推移而不断演进。而且我认为,这既包括你可以从不同的表面领域,比如Slack或你的问题追踪器或其他什么地方,分离出一些东西。我也认为,这还包括你正在盯着的那块“玻璃面板”将会发生很大的变化。而且,你知道,我们基本上将IDE视为你构建软件的地方。
Lenny: 我认为人们在谈论代理和所有这些人工智能工程师将为你做所有事情时,没有充分谈论的一件事是:基本上,我们都会变成工程经理,拥有很多下属,而这些下属并不那么聪明。你需要做大量的审查、批准和指定工作。我想知道你对此有什么想法。你能做些什么来让这件事更容易吗?因为听起来真的很难。就像任何拥有大型团队的人都经历过,我的天,所有这些初级人员都在和我核对,一遍又一遍地做着质量不高的事情。这简直就是生活的常态。这会很糟糕。
Michael: 也许最终要和所有人进行一对一会谈。这么多的单独会谈。是的。因此,我们所见的在使用人工智能方面最成功的客户,我认为他们在运用这些技术的方式上仍然相当保守。所以我的确认为,如今最成功的客户确实倾向于使用诸如我们的下一编辑预测之类的事情,即您正常的编码,而我们预测您接下来要执行的操作实例。然后他们也非常倾向于缩小您要交给机器人的范围。而且,您知道,对于花费在审查代码的固定百分比的时间,您可以从代理或从总体人工智能的角度来看,您知道,有两种模式。一种是您可以预先花费大量时间来详细说明事情,人工智能去工作,然后您再去审查人工智能的工作,然后就完成了。这是一个完整的任务。或者您可以真正地把事情分解开,对吧?所以您可以详细说明一点,人工智能编写一些东西,审查,详细说明一点,人工智能编写一些东西,审查。这有点像,您知道,自动完成处于该频谱的所有方式中。并且我们仍然经常看到,现在使用这些工具最成功的人正在分解事情,并保持事情相当小。
Lenny: 听起来没那么糟糕了。我很高兴这里有一个解决方案。
历史性增长的背后
Lenny: 我想回到你们最初构建Cursor的时候。你们在哪个节点意识到它已经准备好了?在哪个时刻,你们觉得,好吧,是时候把它发布出去,看看会发生什么了?
Michael: 因此,当我们开始构建Cursor时,我们非常担心在没有发布到世界的情况下空转一段时间。而且一开始,实际上,Cursor的第一个版本是手工打造的。现在我们使用VSCode作为基础,就像许多浏览器使用Chromium作为基础一样,并在此基础上进行开发。最初,我们没有这样做,而是从头开始构建了Cursor的原型。那涉及到大量的工作。我们不得不自己构建,你知道,一个现代代码编辑器需要考虑很多因素,包括支持多种不同的语言,以及在语言之间移动的导航支持,还有错误检查支持等等。还有,你知道,诸如集成命令行,以及使用远程服务器的能力,或者说是连接到远程服务器来查看和运行代码的能力。所以我们就像进入了一种闪电战模式,以惊人的速度构建各种东西,从头开始构建我们自己的编辑器,以及AI组件。大概过了几个月,也许是五个星期之后,我们就完全依赖这个编辑器了。而且,你知道,我们已经抛弃了之前的编辑器,开始使用新的编辑器。之后,当它变得稍微有用的时候,我们就把它交给了其他人,并进行了一个非常短的beta测试阶段。然后在编写第一行代码后的几个月内,我们就向全世界发布了。我想大概是三个月。这绝对是一个,你知道,让我们尽快把它发布给人们,并在公共场合快速构建的过程。
让我们感到惊讶的是,我们原本以为我们会为几百人构建很长一段时间。而且,你知道,从一开始,就有一种立刻涌现的兴趣,以及大量的反馈。而且,你知道,那非常有帮助。我们从中学习。而且,你知道,这实际上就是我们为什么转为基于VS Code,而不是仅仅依靠自己手工打造的东西。很大程度上,这都是由最初的用户反馈所驱动的。而且,你知道,从那以后,我们一直在公开地迭代。
Lenny: 我喜欢你如何轻描淡写地描述你获得的吸引力。我认为你们在大约一年、一年半的时间里,从零美元发展到年经常性收入1亿美元,这具有历史意义。你们在一年半的时间里从 0 美元增长到 1 亿 ARR,这堪称历史性时刻。你认为这种成功的关键是什么?你谈到“吃自己的狗粮”(dogfooding)是其中一个重要因素。就像,你们三个月就把它做出来了。太疯狂了。你认为成功的秘诀是什么?
Michael: 第一个版本并不怎么样,你知道,三个月完成的版本并不好。所以,我认为关键在于,你知道,持续不断的偏执,总是觉得有很多方法可以让它变得更好。你知道,最终目标实际上是发明一种全新的编程形式,其中涉及自动化大量我们今天所知的编码工作。而且无论Cursor现在的进展如何,总感觉我们离最终目标还很遥远。并且总是有很多事情要做。但我认为,很多时候,并没有过度关注最初的推动。相反,它更像是工具的持续演进,并且持续地改进这个工具。我认为这在于……
Lenny: 在那三个月之后,是否出现了一个转折点,事情开始真正起飞?是否存在一个转折点,让一切开始真正腾飞?
Michael: 老实说,一开始感觉相当缓慢。而且,你知道,也许这源于我们自身的一些不耐烦。但是,第一,我认为,你知道,增长的总体速度,仍然让我们感到惊讶。我认为最令人惊讶的事情之一是,增长一直相当稳定,呈现指数级增长,即每月持续增长,有时因我们的发布和其他因素而加速。这种增长基本上一直以指数形式持续进行。但是,你知道,指数级增长在数字非常低的时候,一开始会感觉相当缓慢。一开始的指数增长,当数字非常低时,感觉相当缓慢。所以一开始并没有真正感觉像进入了竞赛状态。而且一开始并没有真正感觉像是进入了赛跑状态。
Lenny: 对我来说,这听起来像是“建造它,他们就会来”真正奏效了。你们只是构建了一个很棒的产品,作为工程师的你们自己也喜欢它。你们把它发布出去,人们就喜欢它,并告诉了所有人。
Michael: 本质上,所有的一切都只是我们,你知道,团队致力于产品,努力把产品做好,而不是,你知道,把时间花在其他事情上。你知道,我们当然也花了很多时间在其他事情上。例如,建设团队就非常重要。而且,你知道,做一些事情,比如,安排客服轮值就非常重要。但是,早期建立公司时人们通常会考虑的一些事情,我们真的让它们搁置了很长时间,尤其是在销售和市场营销方面。所以,仅仅是致力于产品,打造一个你喜欢、你的团队喜欢的产品,然后,你知道,再根据一些用户进行调整,这听起来可能很简单,但是,你知道,要做好这一点很难。而且有很多不同的方向可以选择,很多不同的产品发展方向。我认为,你知道,困难之一是,我认为专注并有策略地选择正确的事情来做,以及有效地确定优先级,是很难的。
我认为这个领域另一个棘手之处在于,它是一种新型的产品构建方式,具有高度的跨学科性,我们介于一家普通的软件公司和一家基础模型公司之间,因为,你知道,我们想要开发一个,你知道,我们正在为数百万人开发产品,而这一方面的表现必须非常出色。另外,产品质量的一个重要维度是在科学方面做得越来越多,在模型方面也做得越来越多,在有意义的地方。所以,把这方面的要素也做好一直很棘手。但是,你知道,总体的感觉是,你知道,也许,你知道,这些事情听起来很容易说清楚,但是做好它们很难,而且总是很难运行。
反直觉的教训:拥抱自研模型
Lenny: 到目前为止,在构建光标构建AI产品方面,你学到的最违反直觉的事情是什么?到目前为止,在构建Cursor的过程中,你学到的最违反直觉的事情是什么?
Michael: 我认为对我们来说一件违反直觉的事情是,之前已经稍微暗示过,但我们绝对没想到在刚开始的时候会做任何我们自己的模型开发。我们的确没预料到会进行任何我们自己的模型开发。如前所述,你知道,当我们进入这个领域时,有些公司从一开始就直接专注于从头开始训练模型。我们已经计算过训练GP4所需的成本,并且知道那不是我们能够做到的事情。而且也感觉有点像把注意力集中在错误的领域,因为市面上已经有很多很棒的模型了。并且为什么要花费所有精力来复制其他参与者已经做过的事情,尤其是在预训练方面,比如采用一个一无所知的神经网络,然后教它整个互联网。所以我们当时认为我们根本不会做那些事情。而且从一开始我们就很清楚,现有的模型有很多可以为我们做的事情,但它们并没有做到,因为没有为它们构建合适的工具。
但事实上,我们确实做了大量的模型开发工作。在内部,这对于我们的招聘工作来说是一个很大的重点,并且我们已经组建了一个非常棒的团队。而且这对我们来说,在产品质量方面也是一个巨大的胜利。并且在目前,Cursor中的每一个精彩瞬间都以某种方式涉及到一个定制模型。而在现在,Cursor中的每一个神奇时刻都以某种方式涉及到定制模型。所以这绝对是违反直觉且令人惊讶的。并且这是一个渐进的过程,在最初,有一个训练我们自己的模型的用例,在其中使用任何最大的基础模型都没有意义。那非常成功,有点像转向了另一个效果很好的用例,然后就一直发展至今。而且,你知道,进行这种模型开发的一个有益之处是仔细选择你的目标,不要试图重新发明轮子,不要试图关注那些或许最佳的基础模型已经非常擅长的领域,而是关注它们的弱点以及你如何能够补充它们。
揭秘技术栈:大型模型与自研模型的协同
Lenny: 我想很多人听到你们有自己的模型会感到惊讶。当人们谈论Cursor和这个领域的所有人时,他们会称他们为GPT的封装器。他们只是建立在ChatGPT或Sonnet之上。而你所说的是,你们拥有自己的,能谈谈幕后的技术堆栈吗?
Michael: 是的,当然。所以,我们肯定会以各种不同的方式使用最大的基础模型。这是将Cursor体验带给人们的真正重要的组成部分。在某些地方,我们使用我们自己的模型。因此,有时它是为了满足某些基础模型由于成本或速度原因根本无法满足的用例。因此,其中一个例子是自动完成方面的事情。因此,这对于不编码的人来说可能有点难以理解。但是代码是一种很奇怪的工作形式,有时你接下来5、10、20、30分钟的工作完全可以通过回顾你已经写过的代码来创造。我想将此与写作进行对比。写作,你知道,每个人或者很多人都熟悉Gmail的自动完成功能,以及当你尝试发布短信、电子邮件或类似内容时出现的各种自动完成形式。它们的帮助可能很有限,因为通常仅仅通过查看你之前写的内容,真的不清楚你接下来要写什么。但是在代码中,有时当你编辑代码库的一部分时,你需要在代码库的其他部分进行更改。而且非常清楚你需要如何进行更改。因此,Cursor的一个核心部分是这种真正增强的自动完成体验,它可以预测你接下来将在多个文件、一个文件内的多个位置执行的一系列操作。
而且,你知道,让模型擅长那种用例。首先,这些模型需要非常快速,并且需要在300毫秒内完成。其次,存在成本因素,我们需要运行大量分子,你知道,每次击键都需要,你知道,改变我们对你下一步操作的预测。还有一个非常特殊的用例,你需要模型非常擅长自动补全一系列差异,而不是仅仅补全下一个token,就像通用的文本序列一样,而是非常擅长查看代码库中发生的变化,然后预测下一组将要发生的变化,你知道,包括删除和添加以及所有这些。我们发现专门为此任务训练模型取得了巨大的成功。所以,在那个地方,你知道,没有涉及到任何基础模型。这有点像是我们自己的东西。我们在应用程序中没有对此进行大量的标记或品牌宣传,但是,你知道,它为Cursor的核心部分提供动力。
然后,你知道,另一组使用我们模型的地方是帮助像Sonnet、Gemini或GPT这样的东西。它们既位于这些大型模型的输入端,也位于输出端。在输入方面,这些模型会在整个代码库中搜索,试图找出代码库的哪些部分应该呈现给这些大型模型。你可以将其想象成一个微型的谷歌搜索,专门用于查找代码库中相关的部分,以便呈现给这些大型模型。然后,在输出方面,我们会获取这些模型建议你对代码库进行的更改草图。接着,我们有模型来填充细节,比如这些最智能的模型完成的是高层次的思考。它们会花费一些token来完成这些。然后,这些较小的、专业的、速度极快的模型,结合一些推理技巧,会将这些高层次的更改实际转化为完整的代码差异。因此,这对于提高需要专业任务的领域的质量非常有帮助。而且,这对于提高速度也非常有帮助,速度对我们来说也是产品质量的一个重要维度。
Lenny: 这太有趣了。我刚请了OpenAI的首席产品官凯文·惠尔(Kevin Wheel)做客播客,他称之为模型集成。这就是他们运作的方式,利用每个模型的最佳特性。就像您所说的,使用更廉价的模型具有成本优势。这些其他的模型,它们是基于像LLAMA这样的模型吗?只是你们接入并在其基础上构建的开源模型?
Michael: 是的。所以,再次强调,我们试图以非常务实的态度对待我们将要开展这项工作的地方,而且我们不想重复发明轮子。因此,从现有的最好的预训练模型开始,通常是开源模型,有时也会与那些不向外界分享其权重的模型大型供应商合作。因为我们不太关心的是,逐行读取权重矩阵的能力,这些权重矩阵随后会给出特定的输出。我们只关心训练这些东西、对它们进行后训练的能力。所以,总的来说,是的,是开源模型,有时也会与闭源供应商合作进行调整。
AI 时代的护城河与防御力
Lenny: 这引出一个很多人工智能创始人以及投资者一直在思考的讨论,那就是人工智能领域的护城河和防御能力。因此,感觉定制模型是该领域的一种护城河。考虑到正如你所说,不断有人推出产品,试图超越你,试图抢夺你的市场,你如何看待该领域的长期防御能力?
Michael: 我认为,你知道,有一些方法可以建立惯性和传统的护城河。但是,你知道,总的来说,我们所处的领域要求我们不断努力构建最好的产品。行业内的每个人都应该如此。而且,你知道,我真的认为上限非常高,无论你建立什么样的巩固地位,你都可能被超越。我认为这类似于可能与过去一般的软件市场、一般的企业市场略有不同的市场。你知道,我认为其中一个想到的是1999年底,或者说90年代末和2000年代初的搜索引擎市场。我认为另一个想到的,在很多方面与这个市场相似的市场,实际上就像70年代、80年代、90年代的个人电脑和小型计算机的发展。而且我认为,是的,你知道,在每一个市场中,天花板都非常高。你知道,转换是有可能的。你可以持续地从一个聪明人每增加一小时的时间、每增加一美元的研发投入中获得价值,而且能持续很长时间。你不会耗尽可供构建的有用事物。然后,你知道,尤其是在搜索领域,而不是在计算机机箱方面,拥有分发渠道对于改进产品也很有帮助,因为你可以调整算法,你可以根据从用户那里获得的数据和反馈来调整学习。而且我认为,你知道,所有这些动态也存在于我们的市场中。
所以我认为,你知道,或许这对像我们这样的人来说是个令人沮-丧的事实,但对于世界来说却是个惊人的事实,我认为存在很多可以实现跨越式发展的机会。有很多,你知道,更多有用的东西可以被创造出来。我们距离达到5到10年后可能达到的水平还很遥远。而且保持这个引擎运转下去是我们的责任。
Lenny: 那么我听到的,这听起来更像是一种消费者护城河,即持续提供最好的产品,以便人们继续使用你,而不是像Salesforce那样,通过与整个公司签订合同来制造锁定效应,从而迫使你必须使用他们的产品。
Michael: 是的。我认为需要注意的是,如果你身处的领域很快就会让你无事可做,那么这就不是一个理想的状况。但是,如果你身处的领域,大量的投资,以及让越来越多优秀的人才沿着正确的方向努力,能够不断地为你创造价值,那么你就可以获得研发方面的规模经济效益,并且可以在正确的方向上深入研究技术,最终达到一个具有防御性的地位。但是,是的,我认为这里存在一种类似于消费品的倾向。而且我真的认为这仅仅是关于打造尽可能最好的产品。
Lenny: 你认为未来这个领域会只有一个赢家,还是会像现在这样,由多个类似的产品共存?
Michael: 我认为市场实在太大了。这也是我想说的,你之前问到关于IDE的事情。我认为一些思考这个领域的人犯的一个错误是,他们回顾了过去10年的IDE市场,然后说,谁在编辑器上赚钱了?就像,你知道,所有这些,这是一个非常碎片化的空间,每个人都有自己的东西和自己的配置。而且,你知道,有一家公司在商业上,像是,你知道的,实际上通过制作优秀、卓越的编辑器来赚钱,但这家公司也只能做到这么大。而且,你知道,当时的结论是未来也会是那样。我认为人们错失的一点是,你知道,在2010年代为程序员构建编辑器能做的事情是有限的。而且,你知道,那家靠编辑器赚钱的公司正在做的事情,比如使代码库的导航变得容易,而且,你知道,为某些事情做一些错误检查和类型检查,而且,你知道,拥有良好的调试工具,但这些都非常有用。但我认为你可以为程序员构建的东西的集合,我认为你可以为许多不同领域的知识工作者构建的东西的集合,将会非常广泛和深入。
我认为摆在我们所有人面前的真正问题是,大量繁琐的工作和知识工作的自动化,以及真正地改变摆在我们面前的所有知识工作领域,使其更易于控制,更具生产力。所以,你知道,这都是一种冗长的方式来说明,我认为我们所在的市场真的非常非常大。我认为它比人们意识到的要大得多,比过去为开发者构建工具的市场要大得多。而且我认为将会出现许多不同的解决方案。我认为会有一家公司,至于是否会是我们公司还有待确定,但我确实认为会有一家公司构建出通用的工具,用于构建几乎世界上所有的软件。那将会是影响一代人的非常、非常大的生意。但我认为也会存在一些细分市场,你可以通过为特定市场领域或为软件开发生命周期中非常特定的部分做一些事情来占据这些细分市场。但是,总体来说,编程将从仅仅编写正式编程语言转变为更高层次的东西。这就是你购买和用于完成此操作的应用程序。我认为在那方面总体上会有一个赢家,而且这将是一项非常大的生意。
Lenny: 有意思。沿着这些思路,有趣的是,微软实际上就在这个领域的最前沿,凭借一个惊人的产品和惊人的分销渠道——Copilot。你说它让你克服了最初的怀疑,让你意识到这里可能存在真正巨大的商机。并且感觉他们并没有获胜。感觉他们正在落后。你怎么看?你认为那里发生了什么?
Michael: 我认为有一些特定的历史原因可以解释为什么Co-pilot可能没有达到,或者说目前为止并没有达到某些人对它的期望。然后我认为存在一些结构性原因。我认为结构性原因是,需要明确的是,微软在Co-pilot这个案例中,显然对我们的工作有很大的启发。总的来说,我认为他们做了很多了不起的事情,我们也是许多微软产品的用户。但我认为这是一个对现有企业不太友好的市场。对现有企业友好的市场可能是那种只有那么多事情可做,很快就会变得商品化,然后你可以将其与其他产品捆绑销售的市场。并且不同产品之间的投资回报率非常接近。在这种情况下,购买创新型解决方案可能没有意义。购买那种与其他东西捆绑在一起的产品更有意义。另一种可能对现有企业特别有利的市场是,从一开始,你的东西就放在一个地方,而且切换起来极其困难。不管是好是坏,我认为在我们的例子中,你可以尝试不同的工具,然后决定你认为哪个产品更好。因此,这对现有企业不是特别友好,而对你认为将拥有最具创新性产品的人更友好。然后,据我所知,具体的历史原因是,参与初代Copilot版本开发的那群人,基本上都去了其他地方做其他事情。我认为,协调所有可能参与此类产品制作的不同部门和团体一直有点困难。
成功使用 Cursor 的秘诀
Lenny: 我想回到Cursor上来。我喜欢问每个开发此类工具的人一个问题。如果你能坐在每个第一次使用Cursor的新用户旁边,只是在他们耳边悄悄说几个技巧,让他们在使用Cursor时更成功,最成功。那会是怎样的一两个技巧呢?
Michael: 我认为目前,我们希望在产品层面解决这个问题,成功使用Cursor很大程度上取决于你对模型能力的了解,包括它们能处理的任务的复杂程度,以及你需要向模型具体说明多少细节。而是要了解模型的质量,以及它的缺陷在哪里,它能做什么,不能做什么。目前,我们在产品中在这方面做得不好,比如,没有在这方面教育用户,也许没有给用户提供一些明确的指引,给用户一些指导方针。
但是为了培养这种了解,我会给出两个建议。所以,第一个是,正如之前提到的,不要过于倾向于让模型,比如说,试图一次性地告诉模型,嘿,这就是我想要你做的。然后看到输出结果,要么感到失望,要么接受整个大型任务的全部内容。相反,我会把事情分解成小块。你可以花费基本相同的时间来总体上指定事情,但要分解得更细。因此,你在进行一些细化,获得一些工作成果,进行一些细化,获得一些工作成果,并且,你知道,不像以前那样做大量的、巨细靡遗地指示模型该做什么的事情。我认为现在这样做可能会导致灾难。
因此,通过提倡将任务分解,与此同时,在业余项目而非你的专业工作中这样做可能更有意义。你知道,我鼓励人们,特别是那些习惯于现有软件开发工作流程的开发者,我鼓励他们明确地去尝试失败,尝试去发现这些模型的能力极限,方法是,你知道,在一个安全的环境中,比如业余项目,抱有雄心壮志,并尽可能地充分利用人工智能。因为,你知道,有时我们确实会遇到,或者说很多时候,我们都会遇到一些人,他们还没有给予人工智能充分的尝试,并且有点低估了它的能力。所以,总的来说,倾向于分解任务,使其更小,但为了发现你能在其中做到什么程度,不妨在一个安全的环境中明确地尝试放手一搏,并且,你知道,体验一下。你可能会惊讶于模型在某些地方竟然没有崩溃。
Lenny: 我基本上听到的,是一种直觉,关于模型能做什么,以及它能将一个想法推进到什么程度,而不是仅仅引导它。我敢肯定,每次有新的模型发布,比如4.0发布时,你都需要重建这种直觉,你必须重新来过。大体上是这样吗?
Michael: 是的。过去几年,它不像人们第一次体验这些大型模型那样影响巨大。但是,是的,这也是我们希望为用户更好地解决,并减轻他们负担的一个问题。但是,是的,这些东西都有稍微不同的怪癖和不同的个性。
Lenny: 沿着这个思路,人们一直在争论,像Cursor这样的工具,对初级工程师更有帮助,还是对高级工程师更有帮助?它们能让高级工程师的能力提高10倍吗?它们能让初级工程师更像高级工程师吗?你认为今天谁从 Cursor 中获益最多?
Michael: 我认为总体而言,这两个群体都从各个方面受益匪浅。要说相对排名,这有点难。我要说的是,他们会陷入不同的反模式。所以,我们看到初级工程师们有点过于全盘接受,凡事都依赖人工智能。而我们尚未达到可以在专业的工具上进行端到端操作的程度,毕竟你是在一个长期存在的代码库中与几十人甚至数百人协同工作。然后对于高级工程师来说,对很多人而言都是如此,但并非全部。而且我们实际上……通常,你知道,这些工具被采纳的方式之一是公司内部有开发者体验团队,这些团队通常由非常资深的人员组成,因为他们通常是构建工具以提高组织内其他工程师生产力的人。而且我们已经看到了一些非常、非常、你知道的,突破界限的……是的,就像我们已经看到有些人,你知道的,真的在最前线努力尽可能多地采用这项技术。但总的来说,我想说,平均而言,作为一个群体,资深工程师们低估了人工智能能为他们做的事情,并且坚持他们现有的工作流程。所以相对排名有点难。我认为他们两者都有……他们陷入不同的反模式。但总的来说,他们都从这些工具中获得了巨大的好处。
Lenny: 这完全有道理。我喜欢这就像光谱的两端,比如期望过高,期望不足。这就像三只小熊的故事。这是寓言吗?是的。
Michael: 好的,可以。是的,或许是那种资深但非正式员工,你知道的,正好处在中间位置。
反直觉的招聘哲学
Lenny: 有意思。好的,再问最后几个问题。如果让你能回到担任这个角色之前,你希望自己能提前知道些什么?在你进入这个角色之前,你希望知道些什么?如果你可以回到刚开始做Cursor的迈克尔身边,那并不是很久之前,你可以给他一些建议,你会告诉他什么?
Michael: 困难之处在于,感觉很多通过艰苦努力获得的知识都是隐性的,而且很难用语言表达出来。令人遗憾的事实是,在人类努力的某些领域,你似乎确实需要摔跟头才能...要么需要摔跟头才能学到正确的东西,要么你需要待在某个人的身边,这个人是该领域卓越的典范。我们在这个方面感受很深的一个领域是招聘。我认为我们实际上是……所以我们在招聘方面非常谨慎。对我们来说,这非常重要,你知道,无论是出于个人原因,还是为了,我认为实际上是为了公司的战略,拥有一支世界一流的工程师和研究人员团队与我们一起开发Cursor,这一点至关重要。还要找到那些具备,你知道,某种混合气质的人,你知道,既有求知欲又有实验精神,因为我们需要构建的新事物实在太多了。还有那种智识上的诚实以及也许是略带悲观和直率,因为,你知道,伴随着所有的噪音,你知道,特别是随着公司和业务的增长,保持头脑清醒,我认为也极其重要。
但是,将合适的人员招进公司,你知道,这件事也许比其他任何事情都重要,除了打造产品之外,我们真的、真的,你知道,为此煞费苦心。而且,你知道,为此,我们实际上等待了很长时间才扩大团队。而且我认为,大多数,你知道,你听到的很多人都是被雇佣得太快了。我认为我们一开始实际上招聘得太慢了。我认为这是可以补救的。我认为我们可以做得更好。而且,你知道,我们最终采用并非常有效的招聘方法,其实也没什么新意,就是去寻找我们认为真正世界一流的人才,然后在某些情况下,经过多年的招募,最终为我们所用,但我觉得我们一开始做得并不好。所以我认为,关于“谁是合适的候选人画像”以及“谁真正适合团队”,以及“卓越是什么样子”等方面,我们都获得了来之不易的经验教训。然后是如何与某人谈论这个机会,以及如果他们真的没有在寻找工作,如何让他们感到兴奋。在如何做好这些方面,我们有很多经验教训。这花了我们一些时间。
Lenny: 对于那些正在招聘的人来说,有哪些经验教训可以分享?你错过了什么或者学到了什么?
Michael: 我认为,一开始,我们可能确实有点过于倾向于寻找符合以下原型的人:名校毕业、非常年轻、做过那些在名校环境中属于高资历的事情。实际上,我觉得我们很幸运能在早期找到很多,找到愿意和我们一起做这件事的杰出人才,他们是后来转行的。所以,是的,我认为我们一开始可能花了很多时间在有点不太合适的候选人画像上。其中一部分是资历的原因。还有一部分是,你知道的,兴趣和经验的原因。我们也聘用过非常、非常、非常优秀,而且非常年轻的人,但他们在某些情况下可能看起来与,你知道的,从中央选角直接出来的人略有不同。
你知道,另一个教训是,我们极大地改进了我们的面试流程。所以,现在我们,你知道,我们有一套定制的面试问题。还有,你知道,我们面试的核心,核心在于,实际上我们会让应聘者在公司待两天,并与我们一起做一个项目,一个工作测试项目。这种方式效果非常好,但你越来越发现这一点。然后,是的,我认为如何了解人们对什么感兴趣,并,你知道,尽我们最大的努力,让他们了解机会,即使他们实际上没有在寻找任何东西,并进行这些对话。随着时间的推移,我们在这方面肯定做得更好了。
Lenny: 你有没有一个你喜欢问的最喜欢的面试问题?
Michael: 我认为这个为期两天的测试工作,我们原以为它无法推广到少数人之外,但它却拥有了出人意料的持久力。它最棒的地方在于,它能让某人像完成一个真实项目一样,完整地经历整个流程。这不是,你知道,我们使用的工作,它有点像一个练手项目,但它能让你在两天内看到像样的实际工作成果。而且它不必花费团队大量的时间。你知道,你可以把你原本花在现场半天或一天的时间分散到这两天里,给某人充足的时间来做他们的项目。因此,这实际上可以帮助它扩大规模。然后它真的可以帮助你,帮助你强化,你知道,你是否愿意和这个人一起共事类型的测试,因为你确实要和这个人相处,你知道,两天时间。还有,一起吃了很多顿饭。所以,我们当初没料到这个会保留下来,但它对我们的价值流程来说真的非常非常重要。并且,在公司非常早期的阶段,对激发人们的兴趣也很重要,因为在此之前,人们还没有使用过产品,也不了解它。而且,你知道,当产品相对来说不是很好时,你唯一能依靠的实际上就是,你知道的,一个团队,一些人觉得这个团队很特别,并且想和他们在一起。而且,你知道,这两天会给我们一个机会,就像,你知道的,让这个人见见我们,并且在某些情况下,希望能说服他们加入我们。所以,是的,那件事出乎意料。不完全算是一个面试问题,但有点像,你知道的,一种面试形式。
Lenny: 终极面试问题。所以,为了非常清楚地说明你所描述的事情,就是你给他们一个任务,比如在我们实际的代码库中构建这个功能,与团队合作编写代码并发布它。大概是这样吗?
Michael: 是的。所以,我们不使用这个知识产权。不是端到端地发布。但,是的,这就像一个模拟,你知道的,在我们的代码库中经常有,这是一个真正的迷你两天项目,你将会端到端地完成它,基本上是被单独留下。你知道,也会有合作。而且,你知道,我们是一家相当注重面对面交流的公司。所以,在几乎所有情况下,是的,实际上就是在办公室和我们一起工作。
Len-ny: 而你一直在说,这种方式甚至已经扩展到了今天。你们现在规模有多大?
Michael: 所以,我们即将达到60人。
Lenny: 对于这个规模和影响力来说,人数不多。我还以为规模会比这大得多。我猜想工程师占了最大的比例。
Michael: 最重要的事情是,并且要明确的是,我们未来工作的一个重要部分是建立一个更大、更优秀的团队,能够持续改进产品,提升我们为客户提供的服务。因此,你们不打算长期保持这么小的规模。我们希望如此。但是,是的,这个数字之所以小,部分原因是工程、研究和设计人员在公司中所占的比例非常高。因此,许多软件公司,当他们拥有大约40名工程师时,总人数会超过100人,因为存在大量的运营工作。而且通常,他们从一开始就非常依赖销售。这需要大量的人力投入。而且,你知道,我们是从一个极其精益和产品驱动的起点开始的。现在我们服务于许多优质客户,并且已经扩展了业务。但是,你知道,还有很多事情要做。
在 AI 浪潮中保持专注
Lenny: 我想问你一个问题。人工智能领域正在发生太多的事情。不断有新的东西发布。有大量的时事通讯,很多时事通讯,其全部功能就是每天告诉你人工智能领域正在发生什么。运营一家处于中心位置,可以说是这个领域最炙手可热的中心的公司,你是如何保持专注的?你又是如何帮助你的团队保持专注、埋头苦干,仅仅是构建,而不被所有这些闪光的东西分心的?
Michael: 你知道,我认为招聘是其中很重要的一部分。如果你找到了态度正确的人,而且,你知道,所有这些都应该是抽象的。而且,你知道,我认为我们在这方面做得不错。我认为,你知道,我们可能在这方面做得更好。而且,你知道,这是我们作为一家公司应该更多谈论的事情。但我认为,你知道,聘用具有正确性情的人,你知道,那些不太注重外部认可,更注重构建真正伟大的事物,更注重完成真正高质量的工作,以及那些通常比较冷静的人。也许,就像,高峰不是很高,低谷也不是很低。我认为招聘可以在很多方面帮助你度过难关。
而且我认为这实际上是,你知道,整个公司都在学习的一点是,你知道,对于任何……你需要流程,你需要层级,你需要很多东西。但是对于你引入公司中的任何一种组织工具,你知道,你希望从该工具中获得的结果,而且,你知道,你也可以通过聘用具有你想要的正确行为的人来实现,就像,你知道,通过该组织工具产生的结果。而且,你知道,我脑海中浮现的具体例子是,我们能够在工程方面尚未进行大量的流程。而且我认为我们需要更多一点的流程。但是对于我们的规模来说,通过聘用我认为非常优秀的人,流程并不算多。你知道,其中之一就是,你知道,聘用冷静的人。我认为第二点只是经常谈论它。我认为第三点是希望能够以身作则。
是的,就我们个人而言,自从2021年、2022年以来,我们一直在专业地从事这项工作,并致力于人工智能的研究。而且我们已经看到了各种技术和理念的巨大变化,例如,如果你把自己带回到2021年末、2022年初,那时只有GPT-3,InstructGPT 尚不存在。没有DALL-E,也没有Stable Diffusion。然后,你知道,我们经历了所有这些图像技术的出现,以及ChatGPT的出现和崛起。而且,GPT-4,所有这些新的模型,所有这些不同的模态,所有的视频内容。而且只有极少数的这些东西真正地对业务产生影响。所以我认为我们已经建立起了一点免疫系统,并且知道当一个事件发生时,它实际上对我们来说非常重要。而且这种动态也体现在,存在大量大量的讨论,但可能只有少数事情真正重要,我认为这反映了过去十年人工智能领域的情况,学术界有大量关于深度学习的论文,学术界有大量关于人工智能的论文。那么令人惊讶的是,人工智能的很多进展,我的意思是,很多进展中,绝大多数提出的想法并没有持久性,也没有产生重大的影响。因此,这种动态在某种程度上反映了深度学习作为一个领域的整体演变。
最终展望与结语
Lenny: 最后一个问题。您认为人们对于人工智能的发展方向以及世界将因此发生的变化,仍然最不理解或可能尚未完全掌握的是什么?
Michael: 人们仍然有点过于关注某个光谱的两端,要么认为一切都会发生得非常快。要么认为这一切都是虚张声势、夸夸其谈和江湖骗术。而且,我认为我们正处于一场技术变革之中,这场变革将产生极其重要的影响。我认为它将比互联网的影响更为深远。我认为它将比自计算机问世以来我们所见过的任何技术变革的影响都更为深远。而且我认为这需要一段时间。我认为这将是一个长达数十年的过程。我认为许多不同的团体将在推动其前进方面发挥重要作用。而且,你知道,要达到计算机能够越来越多地为我们做更多事情的世界,需要克服所有这些独立的问题,并且需要在这些问题上取得进展。其中一些是在科学方面,比如让这些模型理解不同类型的数据,变得更快、更便宜、更智能,你知道,符合我们关心的模式,你知道,在现实世界中采取行动。然后,还有一些是关于我们将如何与它们协同工作。而且,你知道,一个人应该在计算机上实际看到、控制并与这些东西一起工作的体验是什么。
但我认为这将需要数十年。我认为将会有很多令人惊叹的工作要做。我也认为,你知道,一个我认为特别重要的群体模式,你知道,不是为了谈论或记录,但我认为,你知道,就是那家致力于自动化和增强特定领域知识工作的公司,既构建了表面之下的技术,整合了来自供应商的最佳部分,有时也在内部进行,然后也构建了相关的产品体验。我认为那些做这件事的人,而且,你知道,我们正在做这件事,并试图在软件领域做到这一点,其他人也在其他领域做这件事。我认为这些人将会非常、非常、非常重要,不仅仅是因为最终用户所看到的最终价值。但我认为,当他们达到一定规模时,他们对于推动技术发展将非常重要,因为我认为他们能够建立,你知道,他们中最成功的那些人将能够建立非常、非常大的企业。是的,所以很高兴看到在其他领域涌现出更多类似的公司。
Lenny: 我知道你们正在招聘对“嘿,我想来这里工作,构建这类东西”感兴趣的人。你们现在正在寻找哪些类型的职位?具体来说,你们最希望尽快填补哪些职位?如果人们对此感到好奇,他们应该了解些什么?
Michael: 这个团队需要做的事情太多了,以至于我们还没有做好充分的准备。所以,你知道,首先,这是总体上普遍存在的。如果您认为我们目前没有适合您的职位,或许您可以主动联系我们,情况可能并非如此。而且也许我们可以向您学习,并因此决定我们需要某些我们尚未意识到的东西。但是,总的来说,我认为今年对我们来说最重要的两件事是在该领域拥有最好的产品并使其增长。我们正处于一种抢占市场的模式,世界上几乎每个人要么没有使用像我们这样的工具,要么正在使用一个可能发展速度较慢的工具。因此,增长,增长,对我们至关重要的是一个宏伟的目标。我想说,是的,特别是我们一直在寻找优秀的工程师、设计师、研究人员,同时也关注业务方面的各个领域。
Lenny: 既然您谈到工程师,我不禁想问这个问题。现在存在这样一种疑问,比如,代码会编写我们所有的代码。人工智能将会编写我们所有的代码。但每个人仍然在疯狂地招聘工程师。
Michael: 所有这些基础模型,真是太多了…… 我们不是在市场上直接处理,你知道的,人们的内心。所以,是的。
Lenny: 您认为会出现一个拐点,比如工程方面的作用开始减缓吗?我知道这是一个很大的问题,但只是,您是否认为所有这些公司都越来越需要工程师?或者您认为在某个时候,会有各种游标代理程序运行,为我们构建?
Michael: 再次,我们大概的观点是,存在这样一个漫长而混乱的中间阶段,不会直接跳到那种你退后一步,要求完成所有事情,你有一个工程部门的状态。而且,你知道,很像你希望从现在存在的编程方式演变。我们希望人类掌握主导权。而且,你知道,我们认为即使在最终状态,给予人们对一切的控制权也非常重要。而且你需要专业人士来做到这一点,并决定软件应该是什么样子。所以,我觉得两者都,是的,就像,你知道,工程师绝对是需要的。我认为工程师们将会能够做更多的事情。我认为对软件的需求是非常持久的,这,你知道,并不是什么新鲜事,但我认为考虑一下构建那些相当简单且容易明确的事物是多么昂贵和劳动密集,或者说在外行看来是这样,这有点疯狂。而且,你知道,现在要做好这些事情是多么困难。因此,如果你能,你知道,现在存在的所有东西,这些东西,你知道,是由我们现在的成本和需求来证明其合理性的,如果你能将成本降低几个数量级,我认为我们将会有更多更多的东西可以在计算机上完成,更多更多的工具。
而且,你知道,我曾经有过这样的感受,我最早的一份工作实际上是在一家生物技术公司工作,是为他们构建内部工具。而当时现成的工具非常糟糕,根本不符合他们的使用场景。然后我正在构建的内部工具,对于可以构建的东西肯定存在大量的需求。而且,你知道,这远远超过了我在和他们在一起的时间里可以构建的东西。但是,是的,我认为它仍然是这样,你知道,在计算机上工作的物理特性太棒了。你应该能够基本上移动所有东西,做你想做的任何事情。仍然存在太多的阻力。我认为对软件的需求远远超过了我们今天所能构建的,要知道,制作一个简单的生产力软件就像制作一部轰动一时的电影一样昂贵。所以我认为在很长的未来,是的,实际上对工程师的需求会更大。
Lenny: 有没有什么我们没有涉及,而你又想提及的内容?有什么最后的智慧箴言你想留给听众吗?你也可以说没有,因为我们已经做了很多。
Michael: 我们一直在思考如何组建一个团队,使其能够在不断改进现有产品的同时,还能创造新的东西。而且我认为,如果我们想要成功,你的想法将会发生巨大的改变,它未来的形态也将会发生巨大的改变。而且,你知道,如果你环顾四周,看看我们尊重的那些公司,肯定有一些公司能够不断地真正地驾驭多次飞跃的浪潮,并持续地推动前沿发展。但你知道,它们也很稀有。就像,这是一件很难做到的事情。所以,你知道,一部分原因在于思考这件事,并尝试反思它,你知道,在我们的80天内,以及,你知道,关于第一性原理的方面。还有一部分原因在于,你知道,尝试深入研究以往伟大的例子。而且,你知道,这也是我们经常思考的事情。
Lenny: 是的,你刚才告诉我们的,在我们开始录音之前,你身后摆满了书。我当时想,那是什么?就像是一家古老的计算机公司的历史,这家公司在很多方面都很有影响力,而我却从未听说过。我认为这说明了很多关于你的事情,即很多创新都来自于研究过去,研究历史,以及什么行之有效,什么行不通。好的,如果人们想联系你或者申请职位,可以在哪里找到你?你提到可能存在一些他们甚至没有意识到的角色。他们应该去哪里找到这些角色?听众又如何能对你有所帮助呢?
Michael: 是的,你知道,如果有人对从事这方面的工作感兴趣,我很乐意与他们交流。如果他们访问 curse.com,他们既可以找到产品,也可以找到联系我们的方式。太容易了。
Lenny: Michael,非常感谢你今天能来。这真是太棒了。
Michael: 非常精彩。谢谢你。