
凤凰网科技讯 2 月 23 日,华尔 * 街日报发文解析,为什么人工智能领域的支出在日益增加。文章认为,尽管投资者曾短暂犹豫,但现在,大型科技公司、政府和风险投资人正以前所未有的速度将资金注入 AI 领域。要理解这一现象,我们需要深入了解 AI 技术本身的演变。
从大语言模型到推理模型
传统的大语言模型需要大量的电力和计算时间进行训练。然而,人们正在迅速找到方法,以减少在用户运行大语言模型时所需的资源量。推理模型则不同,它们基于大语言模型,但在实际运行中消耗的资源(包括芯片和电力)要多得多。
自 OpenAI 在 9 月发布其首个推理模型 o1 以来,AI 公司纷纷推出竞争产品。其中包括今年年初震撼 AI 界,改变众多科技和电力公司估值的 DeepSeek R1,还有埃隆 · 马斯克旗下的 Grok 3 推理模型。
DeepSeek 之所以引起恐慌,是因为它展示了一种可能性,即以其他模型成本的一小部分来训练 AI。这可能会减少对数据中心和昂贵、先进的芯片的需求。但实际上,DeepSeek 推动了 AI 行业去发展资源需求量更大的推理模型,这意味着基础算力设施仍然非常必要。
推理模型的资源需求
推理模型及其相关产品(如" Deep research "工具和 AI agent)为何需要如此多的资源?答案在于它们的工作方式。
Nvidia 的 AI 产品管理副总裁 Kari Briski 最近表示,推理模型可以轻松消耗超过传统大语言模型 100 倍的计算资源。这种倍增来自于推理模型在长时间"思维链"中与自己对话(并非所有对话用户都能看到)。模型使用的计算资源与生成的单词数量成正比,因此生成 100 倍单词的推理模型将使用更多的电力和资源。
当推理模型访问互联网时,资源需求量会进一步增加,如谷歌、OpenAI 和 Perplexity 的 Deep research 模型。
这个数量的资源需求仅仅是开始。谷歌、微软和 Meta 计划在 2025 年共同支出至少 2150 亿美元,比去年增加 45%,其中大部分用于 AI 数据中心。

科技巨头们的季度资本支出
未来 AI 有多大需求?
为了预测未来 AI 的需求量,我们可以列出一个简单的等式。等式中的第一个值,是 ChatGPT 这种大模型处理单个标记所需的计算量。
1 月,随着中国 AI 模型 DeepSeek R1 的发布,每个标记的成本(包括算力资源和金钱)似乎会大幅下降。DeepSeek 及其相关论文展示了一种方法,可以比美国 AI 实验室先前披露的方法更高效的方式训练和交付 AI。
表面上看,这似乎表明 AI 未来对算力的需求将大大减少,比如为当前的十分之一。但推理模型在"思考"时所增加的需求量会弥补这一点。简单来说,类似 DeepSeek 的高效 AI 模型,把对算力的需求减少到十分之一,但如果整个行业对推理模型的需求增加 100 倍,那么未来 AI 对算力的需求仍将是现在的 10 倍。

位于智利圣地亚哥的谷歌数据中心
1000 倍增长
随着企业发现新 AI 模型更强大,它们会越来越多地调用这些模型。这将算力的需求从训练模型转向使用模型,即 AI 行业中的"推理"。
Baseten 的 CEO Tuhin Srivastava 表示,这种向"推理"的转变已经在进行中。他的客户包括在应用程序和服务中使用 AI 的科技公司,如 Descript 和 PicnicHealth。这些客户发现,随着对自身产品需求的快速增长,他们需要更多的 AI 处理能力。
未来几年,技术创新和更先进 AI 芯片的出现可能意味着,向客户提供 AI 的系统会比今天高效一千倍。风险投资家 Tomasz Tunguz 表示,投资者和大型科技公司在赌,未来十年中,由于推理模型和 AI 的迅速普及,对 AI 模型的需求可能会增加一万亿倍或更多。
"你键盘上的每一次按键,或你对着麦克风说的每一个音素,都将由至少一个 AI 转录或处理," Tunguz 说。如果真是这样,他补充道,AI 市场可能很快会比今天大 1000 倍。(作者 / 陈俊熹)