亚马逊最近承认了一个任何电子商务公司都不能承受的问题:其承诺变得脆弱。根据《商业内幕》引用的内部文件,该公司将实施为期90天的“安全重启”,对 335 个一类系统 的代码更改进行更严格的控制,这些系统直接影响消费者。
这次变故并非源于哲学思考,而是账务问题。 2026年3月5日 ,未经过自动化验证和内部管理流程的生产变更导致北美市场的 订单量下降了99% ,并丢失了 630万笔订单。几天前的 3月2日 ,客户在将商品加入购物车时看到的错误交货时间,导致约 12万笔订单丢失 和大约 160万次网站错误。在第二次事件中提到了亚马逊的人工智能辅助代码工具 Q,其在控制平面操作中暴露了“边缘风险”,没有安全防护。
亚马逊电子商务服务的高级副总裁戴夫·特雷德韦尔明确表示,将引入“受控摩擦”来保护零售体验中最关键的部分。这一信息对任何以速度为导向的组织来说都显得不安:当一家企业以秒为单位兑现承诺时,缺乏控制的部署并不是敏捷,而是带有利息的债务。
可用性已不再是技术指标,而是产品
在亚马逊,可用性不再是“质量”。它是客户相信其他一切的最低条件。一旦出现无法购买、查看账户或与商品页面互动的情况,比如因失败的部署导致的几小时中断——这不仅仅是失去交易。它贬值了主要资产: 确定性。而确定性正是支撑价格的理由。在零售行业,亚马逊不仅销售商品;它还销售一种信念:订单会在承诺的时间准时送达。正是这种假设促成了 Prime 的存在和留存。当购物车显示错误的交货时间或系统停止处理订单时,企业就迫使用户进行额外的心理工作:重新尝试、比较、推迟、怀疑。这种摩擦在财务仪表盘上并不可见,但在转化率、复购率和卖家信任度中悄然流露。
简报中的数据毫不客气地展现出了这一点。一次已被记录的事件在单日内导致 630万笔订单丢失。简报提到,以 40到50美元 的平均订单值计算,损失额可能超过 一亿美元 的未捕获收入。无需争论这一金额的准确性,只需明白一点:当你的业务每秒处理成千上万笔交易时,任何有错误的分钟都更像是一次收银机的停摆,而不是程序的bug。
因此,这一措施并非是为了增加繁文缛节。这是一项捍卫“价格”的举措,是市场乐意支付亚马逊承诺的可靠交付、响应迅速的网站和高峰期不会出现故障的结账体验的成本。
问题不在于人工智能,而在于变更的治理
在公共叙述中,诱惑是寻找一个容易的替罪羊:人工智能在编写代码。在内部细节中,诊断对于任何首席执行官或首席财务官来说更为重要:损害来自于 没有保护措施的高影响变更,省略的流程和不足的授权。3月5日的事件包括一个在成熟组织中应该被视为禁忌的元素: 只有一个人被授权执行高风险配置变更,而没有双重授权。在实践中,这意味着内部控制系统——将速度与鲁莽相区分的系统——在不可渗透的地方变得渗透。2月2日的事件确实提到了 Q,但简报本身表明,亚马逊坚持认为只有一次经审查的事件涉及到人工智能,而且没有一次是由于“由人工智能编写的代码”造成的。“边缘风险”这一术语的使用是有价值的:风险不在于工具,而在于工具加速了本应更慢并因此自然被审查的系统区域的动作。
领导者们所需讨论的正确问题不是是否使用人工智能,而是在哪里允许它在没有保护的情况下运行。控制平面——管理配置、权限、路由和部署的层级——是风险倍增器。在这里的小变化会传播到数百个服务。加上对这些变更的写入或修改速度的加快,瓶颈不再是开发,而是治理。
亚马逊正在以非常具体的规则做出回应:双人审核、强制使用内部文档和批准工具,以及通过自动化系统遵循可靠性工程的核心规则。转化为业务就是:他们提高了内部生产变更的成本,以降低对客户失误的外部成本。
受控摩擦是直接提高用户付费意愿的投资
有一种观点是许多技术团队错误地向财务部门传达的:“更多控制”意味着“更少速度”,而进而“更少收入”。在大规模电子商务中,这一推理往往存在反向效应。部署速度只有在保持客户对承诺的信任的情况下才能创造价值。亚马逊实施的90天重启是为了重新平衡一项失去平衡的方程式:他们正在优化变更的推出时间,却未能保护业务中最有利可图的成分——感知的确定性。当这种确定性下降时,客户间接地请求折扣:购买减少、回归减少、比较增多、惩罚依赖于此平台的卖家,并开启其他选择。在一个全球电子商务市场超过 6.3万亿美元 的环境中(这一数据体现在简报中),可靠性不是一种美德。这是一种需求捕获机制。
这一措施也反映出组织结构的变化。如果重启适用于 一类系统 的“所有权”由 VP 级别的组织管理内部信息是可控的,表明可用性不再仅仅是工程的 KPI;这是一个高层承诺。这避免了经典模式中,没有人“拥有”风险,因为它在团队之间被稀释。
成本是实际的:更多审查、更多文档、更多审核、更多时间。但替代成本在于失去的订单与大规模的错误。即使公司因重新尝试而恢复部分订单,用户体验的损害发生在最敏感的时刻:购买时。
除了还有一个附加效果:通过在客户影响最大的位置引入摩擦,亚马逊鼓励团队在风险较小的地方创新。这是一种将创造力重新分配到低风险区域的方法,同时并不全面阻止开发。
每个数字企业的教训是,管道同样也有定价
大多数公司将其部署管道视为工程事务。亚马逊将其视为实际的产品一部分。当变更通道过于宽松时,客户以故障的方式支付了价格;当过于严格时,企业以缓慢的方式支付了价格。解决方案不是教条,而是细分。亚马逊进行了细分:对 335 个一类系统 实施了最严格的控制,因为它们与消费者直接相关。这是经济影响导向的设计。组织接受不是所有变更都应得到同等处理,但“高风险变更”的标准需要高出操作人员的良好意图。
这一消息同样重新整理了关于开发中人工智能的辩论。采用代码助手本身并不可怕;真正危险的是允许它们在缺乏防护的层面上加速修改。引用的内部文件警告称,在控制平面上使用生成功能将会“加速”边缘风险的暴露,并要求在控制平面上进行安全投资。这是对任何正在将人工智能投入生产的公司的操作提醒:工具放大现有系统的特点。如果系统存在缺陷,人工智能发现它们的速度会更快。
与此同时,亚马逊试图分隔其叙述:一位发言人将审查描述为常规过程,并澄清重点是零售,而非 AWS。在战略层面,这种分隔是合理的:市场对电子商务的崩溃与对云服务因其他原因而发生的事件的惩罚不同。但是对于高管来说,这种认识是统一的:操作风险有多个向量,而“变更不当治理”的向量通常是最可预防的。
胜利者将是以最低摩擦成本购买信任的人
亚马逊正在承认,其商业承诺不仅取决于工程,还取决于内部控制。为期90天的重启,更多的审核、更多的可追溯性和更多的规则自动化,并不是对繁文缛节的庆祝,而是以时间预算购买信任的举措。这一学习教训并不是简单模仿亚马逊的流程,而是学习其标准。以价格竞争的公司往往削减了维持其收费能力的关键内容:可靠性、可预见性和无障碍体验。而维持利润率的公司,则将可用性与变更控制作为产品的一部分,并为此明确支付成本。
盈利增长是在服务设计上减少客户摩擦、提高实现承诺结果的确定性,从而提高用户付费意愿,提供几乎无法拒绝的提案。











