大家好,我今天想分享一篇关于人工智能竞争的新分析报告。这篇文章来自红杉资本,美国的一家领先风险投资公司,作者是David Cahn。David深入探讨了AI行业的未来发展趋势,尤其是基础设施建设对AI进步的重要性。他指出,与其依赖技术突破,不如关注数据中心和算力集群的效率,这可能成为下一轮AI竞争的决定性因素。

红杉资本(美国)在8月5日,最新发表了对于AI产业发展的判断,谈到了“算力集群”“数据中心”“房地产”等非常硬核的内容。

对于微软亚马逊谷歌等头部公司的AI竞争,也作出了分析和预判。从财报和AI的未来回报角度,非常大胆地作出了点评和预测——“基建效率”可能比“研究突破”更重要。

相较于国内大厂、模型公司的竞争,海外大公司算力、电力等基础设施层的建设,也许也能为我们带来启示。

特别想介绍一下这篇文章的作者,David Cahn,红杉美国合伙人,前Coatue的COO及合伙人,主导投资了Runway、HuggingFace、Notion等AI相关领域的明星项目。红杉很多有观点的文章、内容,都是出自他之手。

David Cahn尤其对失败的创业者有共鸣,他喜欢与那些快速迭代、犯错、从错误中吸取教训并不断尝试的人一起工作。

也把我很喜欢的David的两段话送给大家:

“甘愿失败可能显得愚蠢,但这是创始人的必备素质。当我第一次开始投资人工智能时,它并不是一个受欢迎的类别。许多投资者认为市场太小。公司陷入困境,因为可供销售的客户太少。”

“伟大的创始人拥有别人还不相信的洞察力。我的工作就是理解他们的观点,并在别人不相信的时候相信他们。”

以下是文章正文:

在过去的12个月里,AI领域的决定性项目一直是“模型奇偶性”竞赛。这一阶段的特点是——找新的研究技术、更好的训练数据和更大的集群规模。

AI军备竞赛的下一阶段会有所不同:它将更多地由“物理设施”,而不是“科学发现”来定义。

到目前为止,我们可以通过主机代管或改造,将算力集群安装到现有的数据中心。

如果需要将集群大小从15k GPU增加到25k GPU,就找到了一种插入更多GPU的方法。

然而,这种情况正在发生变化:大多数ai市场里的参与者,已经深入骨髓的“惨痛教训”是——模型大小是性能的首要驱动力。

因此,下一代模型的目标,是将模型规模增加10倍,达到300k GPU。要容纳其中一个模型,就需要建造一个全新的数据中心。

人工智能已经从两个方面被彻底改变:

首先,它改变了模型之间的交付周期。如果之前你可以在6到12个月内训练你的模型,现在你需要增加18到24个月的构建时间才能真正开始训练。

其次,它改变了最大竞争优势的来源。在新时代,“基建效率”可能比“研究突破”更重要。

AI工作方式的巨大变化,是近期科技巨头“财报”的一个重要主题。

大型科技公司的年化资本支出,从1380亿美元同比增长到2290亿美元。

这910亿美元的增量运营支出,是新的“人工智能数据中心”建设的一个很好的代表,也是一项巨大的投资。

今天的资本投入,可能会在2025年底至2026年初之间取得成果。

届时我们将能知道,这些更大的模型是否足够智能,是否能够释放新的价值来源并产生投资回报。

AI竞争新阶段:基建效率或超越技术突破

微软亚马逊谷歌Meta的“增量资本支出”

那么,未来1到2年到底会发生什么?

在人工智能产业建设的新阶段,作为个人我们如何“获胜”呢?

“建设数据中心”是一项混乱而复杂的业务。我们认为,日常的运营执行将对最终AI的发展结果产生最大影响。以下是它在幕后的运作方式:

  • 一家房地产开发商——QTS、Vantage和CyrusOne是三家受欢迎的开发商——去购买他们认为可以建造数据中心的土地和电力。

  • 开发商与大型科技公司接洽,向他们提供数据中心15年或20年的租约,总成本为200亿至100亿美元。

  • 一旦开发商签署了协议,他们就会进入资本市场,根据协议筹集债务,通常来自银行或房地产投资者。

  • 债务投资者并没有为数据中心未来的人工智能需求提供担保——他们正在为微软或亚马逊等客户的信用提供担保,并期望收益率略高于公司债务。

  • 开发商会雇佣一家总承包商,例如最受欢迎的数据中心建筑商之一DPR。

  • 总承包商去雇佣分包商。然后,分包商去招聘劳动力。劳动力是数据中心建设成本的重要组成部分。

  • 劳动力转移到数据中心的建设地点——例如,一个小镇或城市——他们被安置在该地区的酒店或其他住宿场所。

  • 在两年的时间里,一个大规模的建筑项目开始了,从整体结构的钢和混凝土开始,到安装工业部件和GPU结束。

  • 在整个过程中,数据中心的最终用户(例如微软或亚马逊)正在与自己的供应链就柴油发电机、液体冷却系统和其他必要设备进行谈判。

今天,五家公司已经到达了这场新的数据中心扩展竞赛的起点:微软/OpenAI、亚马逊/Anthopic、谷歌、Meta和xAI。

每个大公司背后,都有一个符合严格基准的模型,以及继续进行所需的资本。

随着市场结构的明确化,我们可以开始看到每个参与者将如何采取独特的方法——从他们自己的业务基础出发,来赢得胜利:

  • Meta和xAI都是消费类公司,它们都将进行垂直整合,希望从各自拥有一个单一的创始人决策者中受益,该决策者可以简化模型构建工作并将其与数据中心设计和建设紧密结合。两家公司都将求在更智能的模型的基础上推出杀手级的消费者应用程序。

  • 微软和亚马逊拥有庞大的数据中心团队和雄厚的财力,他们利用这些资产与顶级研究实验室建立了合作关系。他们希望通过:一是向其他公司提供销售培训,二是销售模式推理来获利。他们将需要管理其前沿模型(GPT 5和Claude 4)与为企业客户使用而构建的其他数据中心之间的资源分配。

  • 谷歌既有消费者业务,也有云业务,还有自己的内部研究团队。周五,该公司宣布将把Noam Shazeer重新纳入公司。谷歌还与TPU进行了垂直整合,一直到芯片层。这些因素应该提供长期的结构性优势。

随着资本支出计划的稳固实施和竞争格局的形成,新的人工智能时代开始了。

在人工智能的这个新阶段,钢铁、服务器和电力将取代模型、计算和数据,成为任何希望领先的人势在必得。

通过对AI产业的深度分析,我们可以看到,未来的竞争不仅仅依赖于技术突破,更需要强大的基础设施支持。随着数据中心和算力集群的建设成为新焦点,AI行业的发展将迎来新的挑战和机遇。希望这篇文章能够为大家提供有价值的见解,帮助我们更好地理解AI领域的未来走向。