微软:经济增长新公式从未如此清晰——更多电力、更高效电网和更强大算力
微软 CEO 纳德拉表示,经济增长的新公式是更多电力、更高效电网和更强大的算力。微软每年投入 500 到 600 亿美元的资本性投资,进入超大规模计算中心市场的门槛。他强调了微软的核心竞争力在于构建平台,为他人提供发展业务和产品的基础。纳德拉认为,AI 是十年一遇的机遇,未来五年世界最需要的是无处不在的超大规模算力。他还提到了对系统创新的深刻理解,并将主要精力放在优化整个系统软件堆栈和利用新型数据格式上。
核心观点
-
微软的核心理念是架构的一致性,即将所有产品整合到一个统一的架构中,我们在整合与每一层堆栈的竞争力之间找到了最佳平衡。 -
微软的核心竞争力在于构建平台,这构成了微软的 DNA,为他人提供发展业务和产品的基础。 -
这(AI)是我们的机会,这样的机会十年一遇,甚至一代人一遇。 -
如果你问未来五年世界最需要什么,我会说是无处不在的超大规模算力。 -
经济增长的新公式从未如此清晰:更多由可再生能源驱动的电力、更高效的电网和更强大的算力。 -
每年投入500 到 600 亿美元的 CapEx是进入超大规模计算中心市场的基本门槛。 -
对于任何科技公司而言,具备 “完整思考”(complete thought)的能力至关重要。这始于对 “系统创新” 的深刻理解。 -
人人都说他们理解指数级增长,但当指数增长真正发生时,事情就变得完全不同了。 -
随着各种平台的兴起,抽象层会逐渐叠加。抽象堆栈的底部是大型基础模型,之上依次是数据集和检索机制,再往上是各种编排工具。随着模型功能的增强,抽象层也会不断增高。 -
我们将主要精力聚焦于优化整个系统软件堆栈和利用新型数据格式,(而非硬件)因为对硬件性能在不断提升。 -
从长远来看,我更相信“横向” 专业化的模式。 -
“我们将从整体上重新创造它”。——电影《点球成金》(Moneyball)
Source: https://stratechery.com/2024/interviews-with-microsoft-ceo-satya-nadella-and-cto-kevin-scott-about-the-ai-platform-shift/
Ben Thompson
https://stratechery.com/
著名商业、科技和媒体分析师/自媒体人
微软 CEO Satya Nadella
——关于微软的 AI 转型
Satya Nadella
CEO
微软
-
微软的 AI 转型 -
Copilot+PC -
AI 平台 -
与 OpenAI 的合作伙伴关系 -
AI 中的集成与模块化 -
CapEx 与未来展望
微软的 AI 转型
Ben Thompson:我曾经在微软工作过。实际上,2012 年首届 Build 大会时,我就在场,那时活动非常热闹。你可能不记得了,当时它与 Windows 团队在纽约举办的另一场消费者活动有冲突。现在,微软看起来更加团结了。在你担任 CEO 期间,你觉得公司在文化和组织上有哪些变化?
Satya Nadella:我的记忆可以追溯到 1991 年的 PDC(专业开发者大会),那时我们首次谈到了 Win32。事实上,当时我还在 Sun 公司工作,我甚至还没有加入微软,但我对 PC 将如何演变、服务器架构如何发展都有很清晰的预见。这对我在 1991 年就已经非常明确了。
我认为对于任何科技公司来说,具备我所说的 “完整思考”(complete thought)非常重要,而对我而言,这个完整的思考过程始于 “系统创新是什么?”,无论是芯片、操作系统还是应用平台,都要考虑进去。所以,无论是在 Azure 还是在 Windows 方面,我都认为我们需要这样做。甚至在今天早上展示的 Windows Copilot+PC 上,我们很久没有这种全面的思考了——Arm 的加入,这是一个漫长的旅程,但我认为我们已经取得了成功。我们有了应用平台,微软自己也在开发应用,还有第三方也在开发应用。因此,对我而言,能够构建完整产品的文化是我们必须努力追求的。
Ben Thompson:你提到了消费者和开发者,但没有提及 “企业”。你认为这种全面的思考目前在消费者、开发者和企业这三个层面上都有效吗?
Satya Nadella:这是个好问题。我认为,企业也是 “终端用户”。在微软,我们最出色的表现,一直都是作为一个面向知识工作者的公司。
Ben Thompson:对。但我认为,企业的购买者和用户之间的分裂确实使情况有时变得复杂。
Satya Nadella:坦白说,我在 90 年代早期加入的公司并不是这样的。
Ben Thompson:说得没错,因为那时候关注的确实只有开发者。
Satya Nadella:还有最终用户。所以,我总是强调一点,我们真正考虑的是终端用户的需求。对我来说,Excel 就是一个面向消费者或终端用户的产品。
Ben Thompson:在 80 年代确实是这样。
Satya Nadella:在它还没有成为 IT 产品之前就是这样。所以,回到原点,我并不是说我们现在不关注解决 IT 需求的问题。事实上,Paul Maritz 曾经说过:“魔力在于终端用户、开发者和 IT”。这三者之间的协调是必须要做到极致的,才能成为一个伟大的企业公司。也就是说,如果你考虑到开发者和终端用户的结合,你可以成为一个伟大的消费公司,而且在某些领域我们已经做到了。现在的消费者概念非常广泛,可能涉及很多不同的领域。我们不会涉足好莱坞电影或很多其它领域,但在游戏和生产力方面,我希望我们能够做得非常出色。
Ben Thompson:这是合理的看法,我认同。大家忘记了微软在消费者 PC 领域、服务器领域以及使用通用硬件方面都是具有颠覆性的。那么,在消费领域、企业领域和 PC 领域之间,是否有过某种优先级的转变?我认为,有一段时间微软对消费领域有很大的抱负,但 PC 的普及可能最初是因为大家在工作中使用 PC,然后他们也想在家里使用 PC。手机显然在这方面有所不同,但这仍然是微软的一个优势领域吗?
Satya Nadella:是的,我认为这是我们的优势领域。以 Windows 为例,我们希望为那些在工作和家庭之间切换的群体打造出色的 Windows PC,甚至是在设备形态上。我们不需要过于花哨,每年有超过两亿台 PC 销售。我希望我们能打造出最佳的 PC,拥有最好的电池寿命、最佳的性能。如果 AI 浪潮真的来临,那就让我们重新设计操作系统和硬件。这是我希望我们真正能够做好的事情,而今天我们已经在这个方向上迈出了重要的一步。
Copilot+PC
Ben Thompson:是的,在 Windows 硬件发布会后,我们聊了几句,我深受触动。并非仅因坐在你对面,而是这次发布会确实吸引了我,它似乎再次为购买 Windows 提供了真正令人信服的理由,这种感觉自从浏览器出现并将应用程序带离桌面后就消失了。你打算如何利用这一点并继续推进呢?你的市场推广策略会有大的调整吗?是依赖 OEM 厂商,还是你认为产品本身就有足够的市场吸引力?你是否会像过去那样大量投资,还是说一直都在投资?
Satya Nadella:我们一直在投资,但关键在于技术发展的时机,选择合适的时机至关重要。我们一直在研究 Arm,也讨论了很长时间的 NPU。
Ben Thompson:是的,十年前你们发布 Arm PC 时,我也在场。
Satya Nadella:所以,关键点是它正在整合起来。想想刚刚发生了什么。有了所有这些模型,以及我们能够拥有的能力,无论是从隐私的角度,还是从延迟的角度,或者是 COGS(成本)的角度,拥有内置模型,因为当你使用……
Ben Thompson:说实话,你在台上发言时有点像苹果的风格。首先,你提到 “MacBook” 的次数比乔纳森·艾维(Jony Ive)时代的苹果还要多,这明显是在做对比。关于本地隐私的讨论很多,但你提到的这些本地模型很关键——COGS,从你的角度看,如果使用客户的能源,那实际上是免费的。你认为你们在这方面能走多远?比如 AI PC,我一直在等规格参数,你确实提到了,16GB 的内存对 Windows 来说还不错,但对 AI 来说还是偏小。
Satya Nadella:现在有了 45 TOPS,我对这款 Copilot PC 很满意,这是我们在 AI PC 上迈出的第一步,但有了这款 Copilot+PC,我认为我们达到了目标。顺便说一句,我非常相信分布式计算将继续保持其分布式特性,所以它们实际上是协调一致的。比如 Recall 功能,我认为它非常出色,我们已经研究很久了。
Ben Thompson:我一直在 Mac 上使用 Rewind 功能,这确实是一种强大的能力。
Satya Nadella:对,关键是现在有了 Semantic Index,我可以使用自然语言查询 Recall,甚至可以忘记的内容,我们通过视觉记忆、关联记忆,现在能够无需学习搜索,只需输入我的意图就能回忆起来。但 Recall 的有趣之处在于——如果你注意到,它不仅会返回内容,还能因为 Semantic Index 唤起这个时刻,因此这种能力需要大量的本地计算。
另一个让我着迷的功能是,可以玩《使命召唤》,利用所有 45 TOPS 的 NPU,而不会耗尽游戏的电池。这种能够充分利用芯片和系统能力的操作系统,我认为将是我们的一大突破。
Ben Thompson:是的,进行演示很容易,就像你用 Surface PC 上的绘图和增强绘图功能所做的那样,演示非常酷。这是一个永恒的问题,Android 遇到了与 Windows 之前遇到相同的问题——你们为这些 AI PC 定义了规格,但如何确保提供一致的体验呢?
Satya Nadella:这是个好问题。这一直是我们生态系统的挑战之一。坦白说,我们都在学习如何真正做好操作系统——实际上,也包括芯片,比如我们与高通合作,确保他们的芯片达到最佳状态。现在,英特尔、AMD 都在做类似的事情,这非常好——如果我用云中的情况做类比,我很高兴看到一些对芯片非常了解的顶尖人士将他们的精力投入到构建出色的产品中。
Ben Thompson:当你处于挑战者的位置,而不是处于领导地位时,是否会觉得更容易推动各方朝正确的方向前进?
Satya Nadella:我认为是这样的。在竞争中,我们的竞争力会更强,我们会更有纪律,在需要赢得目标时,我们的执行力也会更强。因此,这是好事,我们拥有最好的芯片创新。你有没有注意到 OEM 的创新——
Ben Thompson:等会儿我会去了解一下。
Satya Nadella:你一定要去看看!戴尔全力以赴,惠普全力以赴,三星、宏碁、联想也是如此。再强调一下,对于我们来说,上次我们能够做到这样是什么时候?当然,Surface 引领了潮流,但这并不是 Surface 引领潮流却无人追随的情况,事实上,我们能够让大家团结起来,坦白地说,这实际上证明了整个生态系统的力量,以及领导层的领导力,他们说:“看看吧,这是我们的机会,这样的机会十年一遇,甚至一代人一遇。”
但我认为,即便回溯到 30 年前,我们推出了 Windows 95。你可以说,“哦,那是 Windows 的巅峰”——但你知道吗,即使在 Windows 的巅峰时期,我们也忽略了一件叫做 “互联网” 的东西。实际上,就在那个十二月,我们推出了 SR-1,也就是浏览器。然而,在 AI 时代,我感觉从结构上我们更加完善了,我们有更多的机会可以赢得胜利,整个生态系统也在与我们一同创新。
AI 平台
Ben Thompson:有个问题。你一直将 AI 称作这次的 “平台机遇”(platform opportunity)。我甚至在你做介绍时就准备了这个问题,我想问的是,在多大程度上可以存在一个与硬件无关的平台机遇,它不需要那种范式转变,无论是进入市场的方式还是完全揭示这些功能?在这方面,这次的演示很有意思,因为它非常具体,展示了 “AI 如何让 Windows 变得更好,这是一个你可以买到的设备,能为你带来这些功能”。我曾写过,你的一个巨大胜利是基本上淡化了 Windows 作为微软中心角色的地位。当然,这对微软很重要,但 Windows 不会成为所有事物的中心。那么,你是否能以之前未曾有过的方式实现完整的生态循环?Windows 作为你前进的动力有多重要?它是否对实现这个平台机遇至关重要,还是你在 iOS 或 Android 上也能实现这个机会?
Satya Nadella:是的。我的意思是,我的一个原则就是非常务实地看待当今世界,而不是仅仅依靠天马行空的想象。其次,我还希望我们能够同时将所有产品整合到一个统一的架构中,以服务于开发者和终端用户的利益。
Ben Thompson:“一个 Windows”(One Windows),我记得我离开微软时,有一份关于这个的备忘录,时机恰到好处,我得以撰写相关内容。当时我觉得这个想法很疯狂,但现在看来它更有意义了。
Satya Nadella:因为在某种程度上,我坦率地认为我们必须确保为每年售出的这两亿多台 Windows 设备提供最佳支持。但这并不意味着每年售出的其它十亿台设备不重要。对于这十亿台设备,我们也需要进行伟大的创新,我会提到这一点,但首先,让我们先考虑这两亿 Windows 用户,看看我们能为他们做些什么,使这次平台转变对他们来说充满魔力。这就是为什么从芯片到用户体验到第三方开发者——顺便说一句,Windows 并不是孤立的。
不知道你有没有注意到,今天有一个非常关键的点:以 AI 为例。有两个挑战或是两个我希望实现的目标——我希望确保隐私保护和安全保障。如果没有基于最新对抗攻击不断学习的分类器,就无法在前沿或最新模型上提供安全性,而这需要在云端完成。所以我希望能够调用云服务。这就像 Windows Defender 一样,如果你没有连接到云,如何提供 Windows Defender 的保护?AI 安全也是如此。所以我们需要让云端发挥其专长,同时让客户端也能发挥其作用,我认为这才是关键。
另一个值得关注的点是,我对这个 Copilot 运行时(Copilot Runtime)非常期待。我希望有一个真实的命名空间——顺便说一句,WebNN 的东西非常酷,我可以写一些 JavaScript 代码并使用 WebNN 来调用一个模型,然后让 NPU 在本地运行。我可以访问 GAP.com 或任何网站,然后开始添加 AI 功能并在本地处理 AI 任务。这就是我认为云、网页和边缘计算结合在一起的统一思想。
事实上,这使得我们在为 Android 开发时具有优势。实际上,在明天的 Build 大会上,你会听到我们谈一些事情,其中让我感到兴奋的是,例如 Phi,现在作为开发者,你可以在 Azure AI 云端上使用 Phi 作为托管模型服务,你可以使用现有的芯片技术,基本上是 Project Silica,这在 Windows 上已经存在,或者你可以将其封装到你的应用中,然后在 Android 和 iOS 上使用。这就是我们打算推进的方向。
Ben Thompson:对于这次演示的赞扬,我之前已经告诉微软首席传播官 Frank Shaw 了,我们原本不打算过多谈论 Windows。但我有些更大的想法,不过这次演示确实非常引人注目,足以让人以全新的视角重新思考这个领域。
Satya Nadella:Ben,我们会让你重新关注 Windows 的。
Ben Thompson:我对 Windows 没有任何偏见,我只是不喜欢改变!
与 OpenAI 的合作伙伴关系
Ben Thompson:微软现在看起来像一个更加统一的公司,我之前提到过这一点。当你去拜访大型企业和公司时,他们对背后有统一支持的公司有多么重视?
Satya Nadella:你是指微软内部的整合吗?
Ben Thompson:不,我是指对外部客户,比如大型企业、大公司。
Satya Nadella:我认为客户对我们的期望是这样的:首先,我非常关注的一点是,尽管我们是一家公司,但所有这些部门都要整合在一起,同时每一层也必须能够独立存在。
所以,我认为微软的运作方式是这样的:是的,最终我们不是一个 “集团公司”,我们必须有一个真正的理念,那就是架构的一致性。客户关心我们并看重这种整合的价值,但他们也非常在意每一个部门的竞争力。所以,客户确实关心这一点,而我们内部也必须对此保持高度重视。实际上,我们在整合与每一层堆栈的竞争力之间找到了最佳平衡。
Ben Thompson:那么,当你谈论 “一体化微软”(One Microsoft)的整合时,如何处理与 OpenAI 的合作伙伴关系?是否有越来越多的担忧?例如,‘看,你们在雷德蒙做得很好,大家都朝着正确的方向前进,但似乎这里有一个我们无法控制的依赖关系,这意味着我们无法控制它’,这些对话是如何进行的?
Satya Nadella:对我们来说,OpenAI 的合作伙伴关系与当年我们与英特尔的合作伙伴关系或我们在构建 SQL 时与 SAP 的合作伙伴关系处于同一水平,因为它既定义了行业,也定义了微软,因此我们非常重视这种伙伴关系。这是一个简单的逻辑:“嘿,看,这是关于计算的”,因此——
Ben Thompson:掌握算力者掌握世界?
Satya Nadella:没错。在 2019 年,我们做出了一个非传统的决策:“哇,也许我们应该投入大量的算力”,因为 OpenAI 比任何人,甚至包括微软内部人员,都更加坚信这一点。这就是我们做了这个决策的原因,并且在过去五年里它奏效了。我现在全力确保未来五年和接下来的五年里,这些伙伴关系总是——正如你知道的,Ben——实际上,在双方成功的关键时期,确保长期稳定性,而长期稳定性来自双方持续获胜,这是我的处理方式。
我认为,对于他们来说,我们是基础设施,他们是模型构建者。他们构建应用,我们构建应用,第三方构建应用,事情就是这样进行的。会有竞争,而且会有一些竞争是完全垂直整合的。垂直整合在每一层都有竞争力的时候运作得非常好。如果你想验证,可以看看微软的历史。因此,你必须保持开放的心态,在某些情况下,伙伴关系是前进的唯一途径。
AI 中的整合与模块化
Ben Thompson:你提到 OpenAI 坚信算力的重要性,这也是微软肯定认同的领域。考虑到 Google 在模型和尤其是基础设施方面处于领先地位,是否会或应该出现某种反 Google 的 AI 联盟?不仅仅是微软和 OpenAI,还有潜在的 Apple 等公司?
Satya Nadella:我认为,总会有公司选择垂直整合的模式。我总是回想起 “Gates/Grove 模型”,然后我们可以称之为 Apple 或者新的 Google 模型,即垂直整合模型。我认为这两种模式都有其可行之处。
从长远来看,我更相信横向专业化的模式。举例来说,[Nvidia CEO] Jensen Huang 正在非常积极地执行一些令人难以置信的路线图。今天,他的基础是确保领先的 AI 模型是在 Nvidia 上训练的。但你看,Google 的模型不是在 Nvidia 上训练的,Google 销售 Nvidia 的产品,但他们的模型是在 TPU 上训练的。我认为这点 Jensen Huang 也意识到了。[AMD CEO] Lisa Su 也在创新,我们也在打造自己的芯片。所以,每个人都在说:“好的,让我们带来芯片创新,带来模型创新”,有 OpenAI,有 [Meta CEO] Mark Zuckerberg 的 Llama,还有 Mistral,以及所有这些小型语言模型,这里有很多的创新。
无论如何,举例来说,我们的任何应用,例如 Copilot,是的,我们肯定会使用 GPT-4,并将其与 Phi 和其它模型混合使用。因此,我认为任何企业应用,真正让他们兴奋的是 “模型即服务”(models-as-a-service)。所以,我认为这将是一个更加多样化的市场。至少从我的历史经验来看,赢家通吃的情况非常少见,我们需要非常清楚这一点,并确保你在这种情况下做好准备。但在其它情况下,我们需要采取广泛的平台策略。
Ben Thompson:这当然有道理,你提到模型的 “商品化”(commoditized)。微软从 Inflection AI 招募了很多人才,似乎你们在确保模型供应的多样性。但如果模型将被商品化,为什么云计算的游戏规则会与过去的 12 到 15 年有所不同?这实际上会带来任何新的变化吗?
Satya Nadella:没错,你说的非常到位。我认为超大规模云计算在这方面确实有其固有的结构性优势。在某种程度上,如果你问未来五年世界最需要什么,我会说是无处不在的超大规模算力。仔细思考一下,我认为经济增长的新公式从未如此清晰:你需要更多由可再生能源驱动的电力、更高效的电网和更强大的算力。如果这些条件具备,那么经济的其它各个部门都能真正从中受益。任何国家、任何地区,只要在这两方面达到最高效率,就能在经济增长中占据优势。因此,如果你认同这个高层次的前提,那么答案是肯定的。
Ben Thompson:但竞争态势呢?因为 Amazon 是最早进入云计算领域,他们基本上囊括了所有 SaaS 企业的客户。微软与其企业客户群一起转向云端。而 Google 则在说,“来,我们的云是最棒的,试试我们的服务”,但他们却处于遥远的第三位。竞争态势会按照类似的方式发展吗?数据引力(data gravity)会占据主导地位吗?也许 AI 是新兴事物,但实际的竞争态势是否仍然……
Satya Nadella:我认为我至少还没见过一家企业客户是仅使用单一云计算服务的。我记得当我刚开始接触云计算时,每个人都在说这将是一个 “赢家通吃” 的市场,但我一直觉得,“天哪,我在服务器领域长大”,即使有人说我们赢了,我也不太相信。每个服务器类别,无论是操作系统、数据库,还是 Web 服务器和所有中间层的东西,都有两到三个玩家。
所以从根本上说,我认为超大规模云计算市场至少有两家,如果不是三家的话,并且它们之间存在一定的差距。收入份额,这是 Steve Ballmer 总是告诉我的——收入份额(revenue share)和市场份额(market share)在多玩家市场中是两个不同的概念。
但是,我还是认为三家公司都有发展空间,记得 Amazon 曾有过什么?六年、七年没有竞争对手的时期?现在,竞争对手出现了,我们也来到了这个阶段。我对下一阶段感到非常、非常乐观。我们并非从零开始。事实上,如果有的话,我们有一个起点,并且那改变了一切。以 B2C 客户为例,无论是 Shopify、Spotify,还是其它什么公司。多亏了 OpenAI API,以前这些客户都不是 Azure 的用户。现在,他们不仅是 Azure 的用户,而且是忠实的 Azure 用户,这对我们来说是一个巨大的转折。
CapEx 与未来展望
Ben Thompson:在谈到竞争态势时,你提到了对资本性投资 (CapEx) 的关注。毫无疑问,你需要投资于 AI,但问题是——你的 CapEx 相对于毛利润从过去七年的 13% 增长到 26%,这是一个巨大的增长——是什么让你相信这会有回报,或者这是否不重要,因为竞争态势是无论如何你都必须投资的?
Satya Nadella:我认为从经济规律来看,你正确地指出,我们是一个 CapEx 密集型的实体。大多数人关注我们的 CapEx 主要是因为 AI。但无论如何,即使不算上 AI,我们也是一个知识密集型和资本密集型的业务,这正是超大规模企业所需要的。你不能只是说,“嘿,我想进入超大规模市场”,如果你现在不能每年投入 500 到 600 亿美元的 CapEx,那么这就是市场的门槛。
但话又说回来,这始终会受到市场状况的制约。你不能让你的 CapEx 远远超过你的收入增长。因此,绝对存在一个限制因素,是的,训练算力的分配发生了阶跃变化,但最终推理是由需求驱动的。所以,如果你综合考虑这些因素,我觉得即使是周期性的调整也不那么困难。作为一个纯粹的商业管理问题,我不是为了一个季度而管理它,但这并不让我害怕。
Ben Thompson:你并不像华尔街那么担心。我再问一个快速的问题,因为我喜欢这个。Bill Gates 曾说我们高估了两年内会发生的事,而低估了十年内会发生的事(“we overestimate what happens in two years and underestimate what happens in ten”)。这些说法现在仍然适用吗?因为感觉两年内已经发生了很多事。
Satya Nadella:我认为这些单位可能是准确的,不过也许我可以说——这里最大的问题是,如果你以摩尔定律为例,天哪,我喜欢那 18 个月的时间周期。事实上,我非常喜欢 Epoch AI 的一张图,他们只是讨论了自从大约 1950 年左右以来,给予机器学习算法的浮点运算次数,它就遵循了摩尔定律。它每 15、16 个月翻一倍,然后到了 2010 年,它增长了 3 倍,而且我认为实际上它的变化更大了。所以它可能每六个月翻一倍,甚至更快,这很难让人想象。每个人都说,“哦,我懂指数级增长”,相信我,生活在那样的世界里……
Ben Thompson:当那个指数级增长时,事情就变得完全不同了。
Satya Nadella:是的,这非常困难。因此,关于特别是当你拥有新兴技术时会发生什么的问题,这就是为什么我认为 AI 安全性是一个非常重要的问题,我们必须牢记这一点,但我们也必须牢记会出现新的创新。那么你如何利用这种新的创新来做好事,同时又要牢记安全性呢?这是一个非常不同的局面。
Ben Thompson:Satya,我知道我们时间有限,但还是要谢谢你,很高兴再次和你交谈。
Satya Nadella:当然,Ben。非常感谢你邀请我。
微软 CTO Kevin Scott
——构建基于 AI 的平台
Kevin Scott
CTO
微软
-
AI 平台 -
AI 的规模化 -
AI 作为工具 -
OpenAI 合作 -
规模法则 -
微软的投资
AI 平台
Ben Thompson:让我们回溯到大约 10 年前,我很想了解你的思考过程,这段旅程是如何让微软从 AI、HPC 或 AI 计算,最终走到与 OpenAI 的合作的。是否有某个特定的时刻让你意识到这是微软需要走的方向?
Kevin Scott:当然。虽然我在微软只有七年半的时间,但我认为 10 年前,当我在 LinkedIn 负责工程和运营团队时,已经很明显,我们正处在一个全新且值得关注的 AI 发展曲线上。虽然那时还没有现在这种生成式 AI,但大家已经开始使用非常复杂的统计机器学习技术,并且从系统规模的扩大中获得了巨大的好处,这比我预期的要快得多。
我在这个行业已经工作很长时间了,我曾在 Google IPO 前后建立过一些机器学习系统,包括当时运行广告拍卖的大型机器学习系统。早在那个时候,规模的重要性就已经显而易见了。大约六年前的一个新变化是,这种规模化开始让 AI 模型表现得像平台一样。
因此,与其拥有一个专用于特定任务的模型,并通过扩大规模来让该任务(如广告的点击通过率预测)变得非常出色,我们开始看到这些大型语言模型的规模化属性使得它们能够被大量重复使用,用于许多不同的任务。
Ben Thompson:好的,那正是接下来我想问的问题,因为你和 Satya 一直在谈这个平台转变(platform shift)、平台转变,“平台” 这个词不断出现。
Kevin Scott: 是的。
Ben Thompson:
好的,这确实是我想问的问题,因为你和 Satya 一直在谈论这个平台转变,平台转变,而 “平台” 这个词不断出现。
KS:是的。
Ben Thompson:我原本想问你这是什么意思,但从你的回答中我听到的是,你说的平台,指的是它具有通用性。
Kevin Scott: 没错,它可以作为一个组件,以非常灵活和通用的方式与你正在构建的软件系统组合在一起。因此,与其在 AI 背景下像微软这样的公司拥有数百个不同的团队,从上到下都必须负责 “这是我的数据”、“这是我的机器学习算法”、“我将如何用这些数据训练机器学习系统,并如何部署它”、“我将如何从部署过程和实际使用中获取反馈以改进整个模型”,从而让数百个小型飞轮运转,不如集中精力进行核心模型训练,这样你将获得的结果可以在你已经拥有的众多应用程序中广泛使用,并且它开辟了构建一些以前不可能的新事物的可能性。
Ben Thompson:好的,我想再进一步探讨一下这个平台的概念。我从你的话中听到的,也许我并没有从你那里听到,我在和你交谈之前就已经这么认为了,但是有些平台,比如 Windows 作为一个平台,这就是我们所认为的平台。它有 API,有网络效应,它是一个双边网络,一边是开发者和用户,但另一方面也有像 x86 这样的平台。
Kevin Scott: 好的。
Ben Thompson:我理解你对 “平台” 这个词的使用更接近于 x86 而不是 Windows,对吗?
Kevin Scott:是的,这个比喻有点贴切。
Ben Thompson:或者更好的例子可能是处理器,因为当谈到从专用到通用的转变时,这听起来就像是从只执行单一任务的专用处理器到广泛可编程的通用逻辑芯片的转变。
Kevin Scott: 是的,我认为 x86 可能是一个相当恰当的比较,因为 x86 之所以有意思,是因为它作为一种通用基础设施,允许编写大量的软件,并且系统和平台的能力随着时间的推移而增强,因为它大约每 18 个月就会变得更便宜、更强大。因此,你只需要将这种快速发展的能力传递给许多人,这些人正在基于它构建各种应用。
x86 与操作系统、PC 制造商以及应用程序开发者之间有一个明确的界限。有时微软既开发应用程序又开发操作系统,所以这两方面微软都有所涉及,但对于开发者来说,这个平台的抽象程度非常高,因为有这个被称为 “摩尔定律” 的指数增长,最终将使得这种技术变得无处不在。
Ben Thompson:好的,我们先放下摩尔定律的话题,我知道你和 Satya 都很喜欢谈这个话题。你提到了 Wintel 架构,x86 的发展历程是这样的,随着时间的推移,出现了 Windows、Linux,甚至 Mac 或其它操作系统,因此确实存在多个层次,但总的来说,从开发者的角度来看,他们更关心的是操作系统这一层次。
关于 AI 模型,我的问题是真正的机遇将在哪里出现?让我们退后一步看。我认为,目前关于英伟达的一个有意思的地方在于,尽管有很多理由对英伟达持乐观态度,但我认为有一个值得关注的结构性原因,那就是 CUDA 层,我们现在都专注于该层,并为其开发各种框架。LLM 使这种情况变得普遍化,现在实际上,在更高的层次上正在发生一些变化,你不需要了解 CUDA 就可以构建一个 AI 应用程序。但是,这是否是实际的层次,还是会有一个类似于操作系统的更高层次存在?
Kevin Scott: 这很难说。可能不是传统意义上的操作系统……
Ben Thompson:不是传统的操作系统,而是类似于那种上下文环境。
Kevin Scott: 是的。我认为这是计算机历史的一个缩影,大家总是需要更高层次的抽象。
Ben Thompson:有了这些新模型,我们现在只是在重新设定这个抽象层次。
Kevin Scott: 是的,我完全同意这一点。关于抽象的层次,目前确实非常不同。我们现在有提示工程师,他们能够通过自然语言来指导这些系统执行复杂任务,比如告诉系统你想要它做什么或不做什么。为了提升系统效率,我们正在开发各种工具,比如微软研究院的 GraphRAG 系统,它可以进行图结构的上下文组合,确保模型只接收必要的信息,从而避免不必要的标记,这有助于降低成本和延迟。
因此,我们还不知道完整的抽象集合是什么,这就是为什么我们讨论 Copilot 堆栈这个概念的原因,我们甚至还没有完全弄清楚 Copilot 堆栈中的所有元素是什么。在过去几年里,我们已经弄清楚了部署现代应用程序所必需的很多东西,但即使模型变得更加强大,抽象层也会越来越高。回到你关于 Windows 的类比,第一版的 Windows 没有 DirectX,因为那些机器的图形处理能力还不够强大,无法考虑使用着色器。
Ben Thompson:这并不是说没有人创造过它,而是说当时还没有人想到过它。
Kevin Scott: 是的,仍有许多未知领域等待我们去探索。但我认为我们至少已经有了一个初步的看法,虽然可能不是最终或完全正确的,但它为我们指明了构建基于强大前沿模型之上丰富、有意思、新颖应用程序所需的所有组件的方向。
Ben Thompson:那么,这个看法具体是什么呢?是否与 Copilot 堆栈的表述相关?从长远来看,与过去几十年相比,开发者在构建计算机应用程序时面临的决策集已经发生了巨大变化。你对这种演进有何看法?
Kevin Scott: 我认为,我们现在达成的共识和你一样,随着各种平台的出现,都会经历一系列抽象层的叠加。在抽象堆栈的底部,有一个大型基础模型,然后有数据集和检索机制,确保模型能够访问完成任务所需的信息。在此基础上,我们有一系列工具来进行编排,可能需要跨多个模型操作,以满足成本、质量或数据隐私的要求。
在未来的一年里,我们期待看到推理发生的位置更加多样化。一部分推理可以在设备上进行,如 PC 或手机,如果可能的话,我们应尽可能在设备上进行推理。只有当设备能力或容量不足时,才需要调用云端更强大、更复杂的资源。
Ben Thompson:在这个过程中,最重要的是编排代理,它首先要决定是在本地执行还是云端执行。如果选择云端执行,我们还需要考虑如何优化提示或请求,以减少标记数量,提高效率。就像你之前提到的 Windows 上的 Phi 模型,其实最重要的部分不仅在于 Windows 上的协作绘图,更在于通过云端为 Copilot 降低成本。
Kevin Scott: 我认为这是一个重要的问题,而且抽象层次正越来越多。关键在于,如果你正在打造一个真正有用且目标用户非常广泛的产品,那么就需要尽可能地将它分发给尽可能多的人。因此,成本(COGS)绝对是一个需要考虑的因素。所以,如果有一些方法能让你以高质量产品的形式提供给他们,比如通过云端卸载到一个小模型来提供那个应用程序,那就太好了。绝对应该这样做。
Ben Thompson:我记得你之前提到我们不必过于担心成本(COGS),因为一切都会变得非常便宜。
Kevin Scott: 会的。
AI 的规模化
Ben Thompson:这是一个非常重要的销售点。它让我们看到了整个领域的巨大潜力和机会。
Kevin Scott: 是的,我经常强调这一点。我认为现在整个领域最值得关注的一点是,前沿模型的能力正在以指数级的速度提升,而且我们还没有接近规模效益递减的拐点。
Ben Thompson:那么,你认为我们可能会遇到哪些规模壁垒?是数据问题吗?
Kevin Scott: 嗯,我认为数据确实是一个挑战。对于一些前沿模型来说,获取足够的数据来训练它们已经成为一个难题。然而,Phi 模型的一个重要创新是它使用了一个前沿模型来生成数据——
Kevin Scott: 我们在这一领域已经深耕多年,过去常常用它来生成非生成模型所需的数据。假设你想要构建一个计算机视觉分类模型,并且希望它训练时不会受到底层训练数据集中偏见的影响,那么你可以利用生成模型来生成大量合成数据,从而得到具有公平分布的训练数据,以满足你期望的模型性能。因此,我认为生成合成数据是构建小模型和大模型的一个越来越重要的方法,特别是在强化学习领域,其价值尤为显著。
Ben Thompson:关于规模化的问题,是什么在推动它的发展?你提到了基础模型,并在台上与 Sam Altman 的类比中提到了我们从哪个更小的 “动物” 开始?
Kevin Scott: 鲨鱼。
Ben Thompson:从鲨鱼到虎鲸,再到目前正在训练的蓝鲸——一个尚未命名的模型,据说将在某个时候发布。那么,答案很明显,很多效率和扩展能力都来自于更小的模型,因为这些大模型可以生成所有的合成数据,提供所有必要的资源——还可以进行优化,但这并不能完全回答关于基础模型规模化的问题。你对它们的规模化有信心吗?
Kevin Scott: 要完全回答这个问题有点困难,因为这可能会泄露我不愿意透露的许多细节。
Ben Thompson:这个回答已经够了。
Kevin Scott: 但你看,我确实认为合成数据对训练大型基础模型也是大有裨益的。想象一下,如果你希望训练一个基础模型在编码方面表现极其出色,你可以通过多种方法生成具有特定特征的合成程序。因为程序是确定性实体,你可以生成一个合成程序,并通过模型检查器来验证它,比如,“它是否可编译?”“它是否产生了一组输出?”“它是否是一个有效的输入,可以放入训练过程中?” 你可以设计一个训练课程,或者至少是部分训练课程,用于任何模型。通过在这些领域生成合成数据,你可以相当简单地生成形式良好的训练输入,使模型在你试图训练它们的特定课程上变得更好。但这并不意味着所有的数据都可以是合成的。
Ben Thompson:你之前提到的一个例子是模型进行点击率预测和广告定向投放,以及编码。这些好处在于,尽管你正在生成一个概率模型,但你使用的数据是确定性的,对吗?
Kevin Scott: 对。
Ben Thompson:那么,当达到这种可泛化的能力时,是什么给了你信心,认为其泛化能力可以扩展到几乎所有领域的应用场景?其中一个极端是,它有纯粹的创造力,没有错误答案,运行得很好;另一个极端是,它在具有验证功能的领域运行,这样实际上可以并行地使用 AI,并得到最佳答案,因为可以对其进行评分。然而,在两者之间还存在着巨大的中间区域,就是用户——我称之为 “偷懒功能”——希望 AI 能够帮他们完成工作,但现实问题在于,这些领域不一定存在评分机制。那么,该功能可以推广到这些领域吗?
Kevin Scott: 是的,我认为我们将能够泛化很多事情。在 Phi 论文中,我们提到的一件事,标题大概是《教科书就是你需要的全部》,这也让我很有信心。我们有能力对人类专家进行相当有限的课程培训,使他们能够做非常专业的事情。
就像我作为计算机科学家接受培训的方式一样,我阅读了大量的计算机科学论文和教科书,并做了大量的问题集,不断地练习、练习、再练习。经过一段时间,我足够称职,可以在世界上做一些有用的事情了。所以,这让我有信心,我们将能够找出如何为这些模型生成足够的课程,并找到一个学习函数,让我们构建出具有相当强大认知能力的东西。
现在,我不知道的事情是——这将是一个我们很快会弄清楚的值得关注问题——我和一些人打赌,我想象一台计算机会在数学家之前证明 “黎曼猜想”。黎曼猜想是数学中一个有着百年历史的难题之一,由希尔伯特(David Hilbert)在 19 世纪末或 20 世纪初提出,大家一直在努力解决这个问题。黎曼猜想基本上是关于素数分布的一个陈述,这是一个非常困难的问题。这是一个容易陈述的问题,但一直有一些极其聪明的人在努力解决它很长时间了。所以,我实际上相信这是一个可能非常复杂的问题,其证明将会令人难以置信。我的预测是,一台计算机将在人类之前解决这个问题,并且可能会涉及到人类的协助。它不会是完全自主的。
AI 作为工具
Ben Thompson:关于人类的协助。你在今天的主题演讲中说,你一辈子都喜欢工具。
Kevin Scott: 是的。
Ben Thompson:AI 将仍作为工具,今天看它显然是一个工具。
Kevin Scott: 是的,我认为是的。
Ben Thompson:为什么?为什么它不会成为更自主的东西?
Kevin Scott: 是的,我不太看得到...
Ben Thompson:我们都不知道。
Kevin Scott: 是的,嗯,我们都不清楚未来会如何,但我认为我们已经有很多线索,关于人类将需要什么。自从 1997 年 Deep Blue 在国际象棋比赛中击败加里·卡斯帕罗夫(Gary Kasparov)以来,就没有人在下棋方面能超过计算机,但大家其实对两台计算机对弈国际象棋并不感兴趣,大家关心的是人与人之间的对弈。国际象棋已成为一种更广泛的消遣方式,甚至被搬上了电影荧幕。大家知道马格努斯·卡尔森(Magnus Carlsen)是谁。
Ben Thompson:那么有没有一种观点,认为 AI 可能会接管一切,但我们甚至不会在意,因为我们只关心人与人之间的互动?
Kevin Scott: 我不认为 AI 会接管任何东西,我认为它将继续是我们用来为彼此创造、服务、做有价值事情的工具。我认为我们会对没有人类参与的事情失去兴趣。
我认为我们所有人都在追求的是意义和联系,我们渴望为彼此做事。我认为我们有一个巨大的机会,可以利用这些工具以不同的方式做更多这样的事情。但我并不担心我们会失去自己的位置或目标。
Ben Thompson:AI 将如何改善你成长的弗吉尼亚州的生活?
Kevin Scott: 今天早上我在台上分享了我妈妈的故事。我认为去年秋天她的健康状况非常糟糕。看看当今世界的人口结构,我们面临着一个迅速老龄化且人口正在减少的问题。
Ben Thompson:人口减少。
Kevin Scott: 在许多地区,人口数量正面临缩减。中国、意大利和日本都遭遇了人口减少的问题,我认为德国也即将步入这一行列,中国的人口同样在减少。我们可以观察到人口达到峰值的时刻。我预测法国将在 2030 年代初迎来人口的峰值,如果没有移民补充,像美国这样的国家实际上已经开始经历人口减少。因此,我们都生活在一个人口减少的世界中,在有生之年,为了保持我们的生活水平,甚至在人口减少、劳动力不足的情况下,要想享有更好的生活,就必须实现生产力的大幅提升。我们必须找到一种方法,在人口减少的情况下,完成所有必要的工作。
在美国的农村地区,有些地方已经出现了这一问题的初步迹象,我们终将在某个时刻面临这一挑战。那里缺乏足够的医生去弗吉尼亚州的格拉迪斯照顾迅速增长的老年人口。因此,我认为 AI 的应用,能够让所有人平等地获得他们所需的一切,以维护他们的尊严并过上更好的生活。当没有充足的人力资源时,就不必依赖于如何将人送往需要的地方来完成工作。我知道这听起来可能很抽象,似乎是一个遥远问题。
Ben Thompson:我来自威斯康星州的一个小镇,我完全明白你的意思。
Kevin Scott: 这是一个现实而紧迫的问题。就拿我母亲经历的医疗危机来说,我觉得每个人都已经尽力了,但仅仅尽力还是不够的。我不禁想象,如果没有我的参与,她的情况可能会截然不同。同时,我也在想那些没有子女可以依靠的老人。如果 AI 能够在其中发挥作用,帮助人们在医疗保健、教育、创业机会等方面获得更多的控制权,我相信这将带来很多益处。然而,这并不意味着它完全是件完美无缺的好事,我们还需要考虑其中的风险和潜在的负面影响。
Ben Thompson:我认为总的来说,特别是在我们这个圈子里,与许多其它技术革命不同,我们还没有充分思考过其潜在的益处。当你谈论所有这些好事时,大家通常会说,“哦,我最好也提一下安全性问题”。但如果你去问问这个领域之外的人,他们会说,“哦,我们知道这些好处”——但往往忽略了这部分。就像在说,“不,等等,我们能停下来谈谈吗?我们能真正深入讨论一下这些好处是什么吗?” 所以,我很欣赏你对这一点的看法。
Kevin Scott: 我确实认为还有至少一个具有这种性质的技术革命,那就是印刷革命,它带来了印刷机。
Ben Thompson:教堂——花了 10 年、15 年的时间来适应,但在历史的长河中,它们很快就跟上了时代的步伐。
Kevin Scott: 是的,事实上,情况比那还要久远。我们经历了大约一个世纪的动荡和变革,最终我们得到了一个我们所有人都视为理所当然的东西。你根本无法想象一个没有书写和信息自由流动的世界。
Ben Thompson:我们也最终得到了一个完全重新组织的 “威斯特伐利亚体系”(Westphalian system)。我们经历了战争的岁月,发生了很多事情。我们有整个宗教改革的分裂,发生了很多变革。
Kevin Scott: 是的,我的妻子接受过早期现代欧洲历史的训练,现在她是一位慈善家。但那个时代,也就是印刷革命,一直是我们家庭对话的一部分。
AI 的合作
Ben Thompson:是因为你是外来者,你曾在 Google 和 LinkedIn 工作过,所以你能够来到微软并说:“我注意到你们与 Google 之间有明显的差距,你们需要在某些方面采取更激进的措施” 吗?
Kevin Scott: 可能吧。但我认为公司内部其实也有人意识到我们落后了。
Ben Thompson:从广义上讲,你不需要说服任何人吗?
Kevin Scott: 是的。但问题在于 “我们该如何行动?” 我一直被问题所吸引,这很有意思。
Ben Thompson:你需要一个能够运用你工具的地方。
Kevin Scott: 没错,我是个工程师出身,你会注意到,大家解决问题的方式各不相同。有人擅长开始,有人擅长收尾,而很少有人两者都擅长。我选择的工作大多是关于——就像电影《魔法保姆麦克菲》(Nanny McPhee)那样,我不知道你是否看过。
Ben Thompson:哦,我没看过。抱歉,我没理解你的意思。
Kevin Scott: 麦克菲是一个虚构的保姆角色,我并不是说我有魔法,但她的角色是,当孩子们需要她但不想要她时,她必须留下;而当他们不再需要她但希望她留下时,她必须离开。这就是吸引我去做的事情。就像,“好吧,这是一个棘手的情况。我认为我可以帮忙解决这个特定的问题。”
Ben Thompson:既然微软在某些方面落后了,你是否觉得这是一个挑战和机会?
Kevin Scott: 嗯,整个公司并非完全——微软在其它领域表现还是相当不错的,尤其是在云服务和增长方面。问题在于,“我们在 AI 方面确实落后了”,但在 2017 年,AI 的重要性还没有那么明显。
Ben Thompson:这更多是因为他们的产品线吗?例如,如果必应的规模更大,他们的广告业务更庞大,他们可能会更——或者这是一种疏忽?是什么推动了他们?
Kevin Scott: 很难说。我认为现在投资 AI 的关键是要有纪律地投资。这不是一个你可以随意撒钱、把资源分散到各种不同领域,最后期待它们能共同成就伟大的领域。
因此,我认为微软一直在大量投资 AI,有很多员工致力于此,但他们在很多不同的事物上分散了精力,这在企业中是非常昂贵和复杂的。我认为这仍然是大家感到困惑的地方。
Ben Thompson:那么你是如何说服微软的?“看,你们投入了很多资金,我们明白。你们有微软研究院和其它部门。但实际上,你们真正需要做的,微软,是发挥你们的核心能力,即构建平台的能力,与 OpenAI 这样的组织合作,他们虽然没有资金,但有能力建造所需的内容。我们必须携手合作”?
Kevin Scott: 嗯,我对这种说法有些异议。我不认为我们的核心能力是花钱。我认为,从公司的 DNA 来看,我们的核心能力在于构建平台,寻找机会来构建那些其它人可以在其之上发展业务和产品的平台。
Ben Thompson:你说得对,这确实带来了大量的资金投入。
Kevin Scott: 是的,我认为在成功的情况下确实如此。因此,这个论点基本上与我们之前讨论的内容一致。就像,“嘿,我们现在看到技术的一个趋势,它就像一个平台,这个平台本身将从专注和对你想要投入资金的事情有清晰的认识中受益。” 不仅仅是你的资金,还有你在开发这个新平台上投入的所有机会成本。
Ben Thompson:然而,微软一直倾向于 “自建而非收购”。在这种情况下,问题不是收购,而是 “自建与合作伙伴” 的选择,这更加微妙。是哪些证据或哪一个瞬间说服了董事会,使他们觉得 “我们没时间了,必须赶快赶上”?
Kevin Scott: 我认为大约是在 2019 年我们与 OpenAI 达成第一笔合作的时候,那时我们对规模化规律有了相当清晰的认识。我们意识到必须立即行动,而有两三个选择。在我看来,以及 Satya 的判断中,这是让我们迅速启动并进入市场最快的方式。
Ben Thompson:但风险在于,你将很多控制权交给了一个你无法完全掌控的实体。作为这一主张的主要支持者,2013 年 11 月你感受到的压力有多大?
Kevin Scott: 那确实是有压力的。但我要重申的是,我认为微软作为一个平台提供商,多年来与合作伙伴一起构建复杂事物方面做得相当出色。这不像 PC 革命完全由微软完成,而是微软与英特尔、带有图形卡的 Nvidia 以及整个 OEM 生态系统共同合作的成果。即使是 Azure 的成功,也离不开我们与其它基础设施如 Databricks 和 Snowflake 的合作,以及众多运行在我们云和其它云端的服务。因此,在当今时代,如果你真的在谈论这些超大规模的平台,我们必须非常擅长合作。不能有这样的想法:我要自己包揽一切,这太难了。
Ben Thompson:回到抽象问题,在这种背景下,你是否确信,从广义上讲,这能让你高枕无忧?除了拥有算力的人可能控制世界外,模型最终会被商品化吗?当然,如果情况需要,你将不得不做一些工作,但 Office 应用程序可以运行任何模型,不必局限于 OpenAI 模型。
Kevin Scott: 好吧,我认为这与商品化关系不大,而更多地与我们现在正在进行的这种分两步走的模式有关。首先,需要有一个持续推进的前沿,我认为如果我们想成为一个现代的 AI 云服务提供者,或者想要构建现代的 AI 应用程序,拥有一个前沿模型是非常关键的。OpenAI 在构建这些前沿模型方面做得非常出色,他们非常高效地利用了计算资源。随着前沿的不断推进,还需要有一个完整的生态系统,其中有许多非常聪明的人正在努力优化各个方面。
规模法则(Scaling Laws)
Ben Thompson:你是否觉得 Phi 真正验证了你的战略,你从无法做任何事情到在几年内构建了最好的小模型?
Kevin Scott: 是的,我认为 Phi 的有价值之处不在于它替代了什么,而在于它与我们已经拥有的东西完美结合。因为一个前沿模型可以做很多事情,我不想让任何人感到困惑。我想再次强调,在 Build 大会上我传达的一半信息是,“你必须意识到这个前沿正在以多快的速度前进。一个真正的误区是过分沉迷于所有人都在做的所有优化的线性化”。
Ben Thompson:技术界是否忽略了建立在摩尔定律基础上的经验?回到 80 年代或 90 年代,你需要一些时间才能获得——你需要构建一个效率较低的应用程序,因为你想要为用户体验的前端进行优化,你只是相信英特尔会解决你所有的问题。
Kevin Scott: 是的,你说得对。
Ben Thompson:是不是有些方面被遗忘了?
Kevin Scott: 我认为是的。
Ben Thompson:因为每个人都抱怨程序臃肿,但实际上有时候你需要它,因为性能问题会得到解决。
Kevin Scott: 是的,你可以在之后解决臃肿的问题。
Ben Thompson:没错。
Kevin Scott: 你不希望有无意义的臃肿,但你也不想……
Ben Thompson:你不想为了消除它而过度优化。
Kevin Scott: 回想我职业生涯的早期,大家曾经以此为傲。你编写这些程序,然后深入你的关键路径函数的内部循环,编写大量的……
Ben Thompson:就像,好的,你从 0.0002 毫秒优化到 0.0001 毫秒了。
Kevin Scott: 确实有一段时间,这是很重要的,是区分有用之物和废物的关键。但是因为你有了摩尔定律,这个指数级改进的过程,如果你没有意识到这一点,你所做的一切可能只是在为某事的内部循环编写汇编语言,而错过了写出更强大软件的所有机会。
我在读研究生时是一个编译器优化的人。我有个朋友,托德·普罗布斯廷(Todd Proebsting),他是亚利桑那大学的教授,曾在微软研究院工作过一段时间。他提出了普罗布斯廷定律(Proebsting'Law),这是对摩尔定律的一种戏谑。普罗布斯廷定律说,编译器优化研究人员使计算机程序的性能翻倍的工作每 18 年进行一次。
Ben Thompson:这可让人清醒不少。
Kevin Scott: 是的,他有些道理。我在读研究生时写了一篇关于这个问题的论文,当时的情况甚至比这还糟糕,这也是我决定不再从事编译器优化工作的原因之一。因为你可以花费六个月的时间去解决一个非常复杂的问题,将基准测试提高 4%,但在这段时间里,材料科学家和建筑师们可能已经将速度提升了两倍。那么你在做什么呢?最好努力利用这些新的快速技术,而不是试图优化掉旧的慢速技术。
Ben Thompson:是什么推动了这一切?你提到了新模型的出现,并在 GPT-4 的背景下提到了 “GPT-4o,成本降低了 12 倍,速度提高了 6 倍”。如果深入研究,GPT-4o 在某些方面可能并不如 GPT-4 出色,但在某些优化过的方面表现优秀。这仅仅是模型的优化吗?还是你们找到了新的解决方案和推理方法?这其中的驱动因素有哪些?
Kevin Scott: 是的,我认为有两个基本因素。首先,硬件实际上正在变得更好,这得益于英伟达、AMD 等公司的出色工作,以及微软也正在进行自己的芯片设计工作。尽管现在摩尔定律可能不再完全适用,即较小的晶体管变得更便宜并为通用计算提供更多动力,但至少目前,我们仍在创新如何让这些晶体管为 AI 中的这种并行应用工作。
Ben Thompson:嗯,总是有更多的创新空间。即使不能从晶体管方面完全获取,也可以在网络等其它方面进行创新。
Kevin Scott: 是的。
Ben Thompson:“我们将从整体上重新创造它”,这是《点球成金》(Moneyball)中一句话。
Kevin Scott: 我们从硬件方面获得了很大的性价比优势,但更为关键的是,我们在创新上投入了大量的精力。这包括如何优化整个系统软件堆栈,以及如何利用新型的数据格式。目前,许多工作都转向使用更快的并行数据处理,例如采用 FP8 而不是对模型进行全部的 32 位算术运算,这有助于更高效地使用内存,完成更多的操作。
Ben Thompson:所以,有些违反直觉的是,使用更少的精度,在某些方面可能看似更 “笨拙”,但实际上这是一个更好的解决方案,因为价格和速度更为关键。
Kevin Scott: 到目前为止,更少的精度并没有使任何事情变得更 “笨拙”。你只需看看神经网络中的所有激活,它们都非常稀疏。网络很大,但每个激活中并没有大量的信号。
Ben Thompson:让我印象深刻的是,并行处理方法的关键在于抽象层面的普遍性。我发现最具说服力的应用是那些能够实现并行处理的应用。在这一点上,我们不必纠结于任何一项计算的精确度。如果代价是降低了并行性,那么你只需要越来越多的并行性。
Kevin Scott: 正确。硬件在变得更好,但我们的进步速度甚至比硬件变得更好的速度还要快。用于训练和构建推理引擎的技术正在变得非常出色。
微软的投资
Ben Thompson:你对投资感到有信心吗?这可能是大家关心的问题。比如,你可能会说,“我们对我们的收入有所了解”,那么这种了解是什么?是 Office Copilot 的收入吗?还是 API 的使用?是什么让你有信心知道,是过度投资更好,还是在推理方面不投入足够的算力,还是投入过多会有风险——或者这只是如果你有过多的算力对每个人都有好处?
Kevin Scott: 目前我们看到的是,算力过剩几乎没有什么坏处,但这只是理论上的,因为实际情况是我们并没有算力过剩。现在对所有 AI 产品和服务的需求非常高,以至于我们正在采取各种疯狂的举措,以确保我们有足够的算力和整个系统的优化,以满足我们看到的需求。
展望未来,经济机会是巨大的。我认为 API 业务正在迅速从零增长为一个非常庞大的业务,比我们以往见过的任何东西都要快。Copilot 业务也非常有吸引力。Copilot 的用户参与度是我们在任何新的 Microsoft 365 产品或 Office 产品中看到的最高水平,也许是历史上最高的。很多时候,你会销售一个新的企业产品,然后需要相当长的时间才能在组织中推广开来。
Ben Thompson:听起来好像如果你可以在 CapEx 上投入更多,你会这样做,只是受到供应的限制?
Kevin Scott: 绝对是的。我们在很多不同的方面都受到限制,但如果我能在 CapEx 上投入更多...
Ben Thompson:数据中心的能源也是一个考虑因素。
Kevin Scott: 是的,如果我能在 CapEx 上投入更多。
Ben Thompson:你在需求方面没有顾虑吗?
Kevin Scott: 不,现在没有。
Kevin Scott,非常感谢你的分享。
Kevin Scott: 谢谢你邀请我。
本文来源:Andy730,原文标题:《微软 CEO 和 CTO 访谈:AI 平台转型》