RAMmageddon:当人工智能从

RAMmageddon:当人工智能从

多年来,关于人工智能的讨论一直是一个数字化叙事:更好的模型、更多的参数、自主代理、无限自动化。Francisco Santolo提出了一个令人不安却必要的警告:人工智能的指数级增长曲线可能会撞上物理极限,而这个极限并非抽象概念。

Lucía NavarroLucía Navarro2026年3月8日10 分钟
分享

RAMmageddon:当人工智能不再是"软件",而成为内存、能源和时间的问题

多年来,关于人工智能的讨论一直被描绘为一个数字化的故事:更好的模型、更多的参数、自主智能体、无限自动化。Francisco Santolo 用一个令人不安却必要的警告将其拉回现实:人工智能的指数级增长曲线可能会撞上一堵物理极限的墙,而这堵墙并非抽象的存在。它叫做内存,以资本支出(Capex)的形式付出代价,连接着真实的电力网络,并且需要数年而非数个冲刺周期来建造。

这一现象已经被赤裸裸地命名为:"RAMmageddon"——一场全球性的内存芯片短缺危机,正在2026年被人工智能数据中心的需求所推动。对于商业世界而言,重要的不是这个绰号本身,而是它所揭示的经济结构:当关键原材料变得稀缺时,人工智能将不再是水平的竞争优势,而将成为一种访问特权

硬性事实:瓶颈不在于提示词,而在于HBM

以下是这些改变了整个棋局的数据——根据我的经验,许多执行委员会尚未将其纳入财务模型:

  • 到2026年,数据中心将消耗全球高达70%的内存产量,从而耗尽用于个人电脑、智能手机、汽车和传统电子产品的供应。
  • 制造商正在将产能重新导向HBM(高带宽内存)——这是驱动人工智能加速器的关键内存。问题在于:一片HBM晶圆的生产能力消耗可高达传统DRAM晶圆的3倍
  • HBM产能正以多年期合同的方式出售,根据行业报告,2026年的大部分产能已提前锁定。
  • 内存供应的增长远跟不上需求:预计2026年DRAM同比增长约16%NAND同比增长约17%,远低于市场在不发生价格通胀的情况下吸收人工智能增量需求所需的水平。
  • Santolo还补充了运营层面的因素:向自主智能体的过渡改变了流量节奏。我们正从"人类节奏"的流量转向全天候机器节奏的流量,到2030年推理计算有望主导总计算量。

将上述内容翻译为CFO语言:服务单次响应的单位成本上升,运营支出的波动性扩大,"每次交互的可变成本"成为战略风险,而非技术细节。

时间陷阱:智能体可以在秒级扩展,但数据中心无法在数月内建成

这是最被低估的关键点:当瓶颈位于物理基础设施时,软件的弹性规则不再适用

Santolo称之为"时间陷阱",而这正是其本质所在。你可以一键部署一千个智能体,但:

  • 在主要市场,将新数据中心接入电网可能需要超过4年的时间。
  • 人工智能所需的新一代机架密度可达150千瓦,这使得液冷几乎成为强制性要求。
  • 下一代制造节点(如2纳米)需要数年的工业级执行积累。

与此同时,超大规模云服务商正在激进地增加资本支出。文章提到了一个令人震撼的数量级:2026年各大主要玩家的资本支出合计接近7000亿美元。我不将其解读为"大胆的赌注",而是将其视为一个市场信号:正在购买的是计算主权

对商业的影响:重写的不只是路线图,而是利润率本身

如果这一趋势持续下去,将对实体经济产生四个直接影响:

1)消费端和传统B2B领域的成本通胀与产品降级

昂贵的内存会渗透到一切领域:个人电脑、智能手机、企业级升级。如果制造商无法维持规格标准(例如,"AI就绪"负载所需的16GB或32GB设备),我们将看到两条路:价格上涨性能下降。无论哪条路,结果都是一样的:由客户买单。

2)人工智能权力向掌控供应链和能源者高度集中

当HBM和数据中心产能以长期协议的方式进行谈判时,一种访问经济体系便随之形成。其社会和竞争影响是微妙而深远的:由人工智能放大的生产力将高度集中,中小企业则面临现货价格、使用限制、延迟和中断等风险。

这不是道德评判,而是对价值链的诊断。谁控制了原材料,谁就控制了市场。

3)运营波动性:更多中断、更高依赖度、更大声誉风险

如果整个生态系统将基础设施逼至极限,局部断电、服务降级和"高端负载"优先调度的场景将会增多。那些在没有业务连续性计划的情况下"将大脑外包出去"的企业将处于高度脆弱的状态。

4)人工智能的免费模式在经济上将变得不可持续

Santolo指出了一个具体症状:工具以突兀的方式涨价。这并非任性而为,而是需求弹性对稀缺原材料的反应。如果推理成本上升,货币化模式将趋于严格:更多付费墙、更多使用限制、更多广告、更多企业级套餐。

向人工智能的过渡:是的,必须行动,但要有财务架构支撑

不采用人工智能同样是一个极高风险的决定。我每天都能看到:一些组织正在失去效率、商业速度和分析能力,最终用人力工时来补贴那些市场早已自动化完成的工作。

但有一种聪明的方式可以穿越这一瓶颈,而不陷入毒性依赖。

以下是一些战略性和运营模式层面的决策,今天做出这些决策,明天或许可以拯救利润率:

  • 将"精简型人工智能"作为默认设计原则:每个token都有成本。每一次模型调用都是一行可变成本。优化提示词、缓存机制、合理实施的RAG,以及"在无附加值时不使用人工智能"的策略,是财务纪律,而非技术上的节俭主义。
  • 优先考虑具有可验证ROI和相关收益来源的用例:如果一个项目没有明确的价值捕获机制,那它就是企业版人工智能慈善主义。自动化必须由受益的客户来融资,哪怕是以按部门或业务单元计算的内部微价格来实现。
  • 避免"智能体蔓延"陷阱:不受控制的自主智能体会产生全天候消耗,这意味着失控的运营支出。治理机制、使用限制、按流程划定的预算以及可观测性,是模型的组成部分,而非"锦上添花"的可选项。
  • 分散技术依赖:多模型策略、应急预案,以及支持优雅降级的架构。在稀缺时代,韧性与精确性同等重要。
  • 像谈判能源或物流合同一样谈判计算容量:合同化、可预测性、分阶段扩展。人工智能已不再是一个插件,它是战略性原材料。

赢家与输家:对新技术栈的公平性审计

这一时刻将使那些垂直整合于基础设施之中、且有足够余力签署长期合同的企业获益。同时,它也将——以成本或落后的方式——使整个行业的部分参与者陷入困境,那些以有限预算运营、采购周期较慢的企业尤其如此。

这里的伦理问题不是人工智能"是否应该"对所有人可及。务实的问题是:谁在构建将人工智能产生的效率与员工、供应商和客户共享的模式,而谁在通过动态定价、依赖关系和锁定机制攫取价值

在Sustainabl,我之所以捍卫社会型商业,是因为我深刻理解一件本质性的事:当一种资源变得稀缺时,市场会变得残酷。因此,真正的影响不能依靠话语来维持,而必须依靠能够抵御危机的架构来支撑。

结论:人工智能的胜负在Excel表格和机房里见分晓

RAMmageddon不是一个写给技术人员的标题,它是一个发给董事会的信号。人工智能将继续前进,但对计算资源、内存和能源的访问权,将重新定义成本、定价、运营连续性和竞争权力。对C级高管而言,使命是不可回避的:今天就构建一个商业模式,运用成本与利润率的纪律来扩展真实价值——并清醒地决定:你的企业究竟是在单纯利用人和环境来赚钱,还是有足够的战略魄力,以金钱作为燃料,真正地提升人的价值。

分享

你可能还感兴趣