算力不会撞墙:Mustafa Suleyman 的指数时代宣言

算力不会撞墙:Mustafa Suleyman 的指数时代宣言

微软 AI CEO、DeepMind 联合创始人 Mustafa Suleyman 在 MIT Technology Review 发文,用「从 2010 年到今天训练算力增长一万亿倍」这一数字开场,系统驳斥「AI 将撞墙」的悲观论。文章从芯片性能、内存带宽、万卡互联、软件算法四个维度拆解加速机制,以能源成本指数下降反驳能源瓶颈论,预测 2028 年底有效算力将再增 1000 倍,足以支撑接近人类水平的半自主智能体出现。

每日深读
2026/4/9 · 14:15
0 订阅 · 5 内容
信源:MIT Technology Review|作者:Mustafa Suleyman,微软 AI 首席执行官,DeepMind 联合创始人|发布日期:2026 年 4 月 8 日|原文AI development won't hit a wall anytime soon—here's why预计阅读时长:18 分钟

怀疑者还没赢过一次。
过去六年,悲观派一波接一波:预训练数据要耗尽了,摩尔定律见顶了,能源支撑不住了,算力增长必然减速。每一次预测,事后都被数据击穿。Mustafa Suleyman——微软 AI 的掌舵人,同时也是 DeepMind 的联合创始人——在这篇 MIT Technology Review 长文里扔出了一记反驳:问题从一开始就出在人类的认知框架上。
我们的大脑在漫长演化中被校准为处理线性变化——今天比昨天多一点,明年比今年快一点。指数曲线从视觉上看起来是平的,直到它突然垂直。Suleyman 用一个数字把这个问题砸在桌上:从 2010 年到今天,前沿 AI 模型的训练算力从约 10¹⁴ 次浮点运算增长到超过 10²⁶ 次——涨幅,整整一万亿倍1。人类没有直觉能够把握这个数字。
"We evolved for a linear world...But it catastrophically fails when confronting AI and the core exponential trends at its heart."
——「我们在线性世界中进化而来……但这种直觉在面对 AI 及其核心指数趋势时彻底失效。」
这不是一篇鼓励盲目乐观的文章。Suleyman 的论证是结构性的,层层递进。他要回答的问题只有一个:这次会不会真的撞墙?

核心论点

AI 算力的增长尚未到顶,且增速本身仍在加快——未来两年内,有效算力将再增长约 1000 倍,足以将 AI 从对话助手推进至接近人类水平的自主智能体阶段。1

论证脉络:三层拆解

第一层:用数字击穿直觉

最有说服力的证据,往往是那个让你「停住看第二遍」的数字。
2020 年,在 8 块 GPU 上训练一个标准大语言模型,耗时 167 分钟1。2026 年,同等规模的任务在现代硬件上不到 4 分钟即可完成1。这是 40 倍以上的提速——而摩尔定律在同期只预期了约 5 倍。实际加速是预期的 10 倍。
正在加载统计卡片…
单块芯片性能的变化同样戏剧性:英伟达 GPU 的原始算力在 6 年内从 312 teraflops 增长到 2250 teraflops,提升超过 7 倍1。还有 Epoch AI 的研究显示,达到固定性能所需算力每 8 个月减半——远快于摩尔定律的 18-24 个月周期1。部分近期模型的推理成本年化降幅最高达到 900 倍1
这不是一个维度在加速,是多个维度同时在加速,且互相叠加。

第二层:加速的底层机制

Suleyman 拒绝停留在现象描述层面,他拆解了算力爆炸的底层机制1
先是芯片本身:处理器运算密度持续提升,微软自研的 Maia 200 芯片比现有硬件每美元性能高出 30%。但原始算力够快还不够——更早的瓶颈其实是内存带宽,处理器跑得再快,数据喂不过来也白搭。最新 HBM3(高带宽内存)的带宽是前代产品的 3 倍,基本消除了这个制约1,处理器终于能持续满载运行。
再往上一层是互联:单块 GPU 的天花板有限,真正的飞跃在于把它们连成一体。NVLink 和 InfiniBand 技术已经可以将数十万块 GPU 连接成一个统一运作的超算——2012 年 AlexNet 只用了 2 块 GPU,今天最大的 AI 集群 GPU 数量已超过 10 万块1。硬件之外,软件算法效率的提升还产生了独立的乘法效应:更优的模型架构、更高效的训练方法,让同等算力能办成远更多的事。Suleyman 的结论是,即便硬件停止进步,软件侧的红利仍足以维持增速。
现代大规模 GPU 集群机架阵列,数以万计的处理单元通过高速光纤互联,构成一个统一运作的超算体
现代大规模 GPU 集群机架阵列,数以万计的处理单元通过高速光纤互联,构成一个统一运作的超算体

第三层:能源约束——最后的护城河,还是早晚突破的堤坝?

批评者剩下的最大筹码是能源。
一个冰箱大小的 AI 机架耗电 120 千瓦,相当于 100 户家庭的用电量1。Suleyman 预测到 2030 年每年可能新增 200 GW 计算能力,相当于英国、法国、德国、意大利峰值能源消耗的总和1。这些数字本身就令人咋舌——它们是真实的挑战,不是假设。
但 Suleyman 的反驳是:能源本身也是一条指数曲线,只不过方向向下。太阳能发电成本 50 年来下降了近 100 倍,电池价格 30 年来下降了 97%1。他的论点是:电力不是固定约束,它本身也是一条下行的指数曲线。当 AI 能源需求在指数上升,可再生能源成本在指数下降,两条曲线正在接近——Suleyman 的赌注是,它们会在时间用完之前交叉。
正在加载图表…
太阳能发电 50 年成本下降约 100 倍,电池价格 30 年下降 97%1。数据示意,非精确点位。

关键洞见

增速本身在加速。头部实验室算力容量年增长接近 4 倍;2020 年以来前沿模型训练算力每年增长 5 倍1。这是复利逻辑,和利息计算一样,每年的基数都在变大。
临界点是 2027 年那个「1 亿块 H100」数字。Suleyman 预测届时全球 AI 算力将是 2024 年的 10 倍1。他认为这个规模足以完成从对话机器人到「可以独立推进数周乃至数月复杂项目的半自主智能体」这一跳跃——这不是小版本更新,是产品形态的切换。
硬件之外还有一个乘法项:软件效率。推理成本年化降幅最高达 900 倍1,意味着同一块芯片今年能做的事情,明年可以做 10 倍。硬件和软件各跑各的指数曲线,结果相乘。
还有一点值得单独说:Suleyman 并不是在嘲讽质疑者,他是在诊断他们的预测工具本身。当一个线性世界出身的观察者试图给指数曲线「摘顶」,每一次预测都会偏低——不是因为数据差,是因为模型本身就建错了。

精选金句

"The skeptics keep predicting walls. And they keep being wrong in the face of this epic generational compute ramp."1
——「怀疑者不断预测会撞墙。而他们在这场史诗级的计算跃迁面前,一次次被证明是错的。」
"Forget basic assistants that answer questions. Think teams of AI workers that deliberate, collaborate, and execute."1
——「忘掉那些只会回答问题的基础助手。想象能够商讨、协作、执行的 AI 工作团队。」
"The compute explosion is the technological story of our time, full stop. And it is still only just beginning."1
——「算力爆炸是我们这个时代的技术故事,句号。而它才刚刚开始。」

值得继续思考的问题

算力曲线如果继续按 Suleyman 的轨迹走下去,最先被重塑的不是技术本身,而是「谁拥有算力」这个问题的政治经济学。当年增 200 GW 的计算能力集中在少数几家超大体量的参与者手里,访问算力的能力将成为一种新的基础设施权力——就像上个世纪的铁路或石油一样。怀疑论者错判了曲线的斜率,却未必错判了它的后果。

编辑推荐语

昨天我们读的是「没有人在追踪 AI 对就业的冲击」,今天来看一篇上游的文章:驱动这一切的算力本身,究竟还有多少底牌没有亮出来?Suleyman 用的不是乐观主义,而是具体数字——训练时间从 167 分钟压缩到不足 4 分钟,增速是摩尔定律的十倍——他在做的,是帮你校准自己对指数时代的感知系统。

围绕这条内容继续补充观点或上下文。

  • 登录后可发表评论。