从数量到筛选:AI智能体正在被迫解决的陷阱
在几乎所有过去八年中投资过人工智能的组织内部,流传着一种根深蒂固的信念。这种信念认为,问题永远是数量问题。更多数据。更多tokens。更广覆盖。更多存储历史。仿佛智能与数量成正比,任何系统故障的解决方案都只是简单地添加更多内容。
这种信念并非出于天真,而是诞生于大数据时代——那个时代,积累信息在技术上既困难又昂贵,因此本身就具有价值。谁拥有更多数据,谁就拥有优势。谁能处理这些数据,优势就更大。这一模式简单明了,具有清晰的市场逻辑。
而如今,在生产环境中部署AI智能体的组织所经历的现实,正在迫使人们对这一前提进行令人不安的重新审视。问题已不再是数据匮乏。成熟行业中的中型企业在CRM系统、数据库、文档、电子邮件、支持工单、内部沟通线程和遗留系统中积累了数万亿tokens。问题在于,智能体不知道如何处理这些庞大的数量。这并非因为它们无法处理,而是因为从来没有人教会它们如何进行筛选。而这种无法选择的能力并不是技术问题,而是一个组织设计问题——各企业多年来一直以"首先需要更多数据"为借口,回避正视这一问题。
更多上下文等于更好上下文的幻觉
向模型提供所有可用内容,与赋予其访问此时此刻执行良好所需的精确片段之间,存在着结构性差异。第一个选项看起来更安全,因为它感觉更完整。第二个选项则需要事先做出一个艰难的决定:知道什么重要,什么不重要。
这个决定代价高昂,因为它迫使组织中的某个人承诺确立一套相关性层级。而承诺相关性层级,意味着接受某些事物并不像我们认为的那么重要,意味着承认我们多年来收集的某些数据并不改变结果,意味着承认某个部门坚持认为至关重要的某些来源,在实践中不过是噪音。
愿意进行这种对话的组织并不多。不是因为它们没有能力,而是因为这涉及内部政治成本,没有人愿意承担。结果就是,智能体接收到充斥着矛盾信息、缺乏清晰层级的膨胀上下文,并产出在技术上看似合理、但在操作上毫无用处的响应。失败被归咎于模型本身,而那场从未发生的对话则继续被搁置。
针对这一问题而出现的解决方案有一个技术名称:上下文工程。它不是一种提示词优化实践,尽管表面上可能看起来如此。它是一门以组织标准来决定智能体在执行特定任务时应接收哪些信息的学科。它涉及结构化搜索(从正式系统中提取精确事实)、语义搜索(从非结构化内容中检索含义)以及倒排索引(实时定位精确标识符)。三个不同的检索层,各具不同功能,彼此不可相互替代。三者结合,才能将积累的知识转化为可用的上下文。
问题在于,正确实施这一方法,需要组织中有人事先定义了什么任务类型需要什么相关内容。而这不是工程问题,而是一个知识治理问题——大多数组织从未以明确的方式解决过这一问题。
上下文图谱揭示的组织成熟度
企业AI智能体架构的下一个前沿有另一个名称:上下文图谱。它与传统知识图谱的区别是精确的,值得细细探讨。
知识图谱对存在的事物进行建模:实体、关系、分类体系、本体论。它告诉智能体组织的概念世界是如何构建的。这很有用,但还不够充分。一个知道例外审批流程存在的智能体,并不因此知道这些例外在实践中是如何解决的,也不知道在模糊情况下谁有真正的权力来批准它们,更不知道哪条非正式对话线程产生了如今被编纂为政策的决定,或者运营团队两年来一直在使用什么变通方法,因为正式流程根本行不通。
上下文图谱捕获的正是这一程序层面。它记录决策轨迹:谁批准了什么,按什么顺序,使用什么工具,得到什么结果。它构建了一种持久的组织记忆,不仅包括事物的当前状态,还包括走到今天这一步的路径。
这对组织领导者而言,而不仅仅是对技术设计者而言,意味着深远的影响。一个能够构建有效上下文图谱的组织,是一个能够使自身决策过程变得可见的组织。它已经命名了真实的审批流程、惯常的例外情况、升级模式。它已经进行了关于决策实际是如何做出的对话,而不仅仅是组织架构图所说的应该如何做出决定。
许多组织无法构建这一层,是因为它们没有将其明确表达出来。不是因为信息不存在,而是因为这些信息以分散的方式存在于非正式对话中、特定人员的记忆中、从未有人有意愿明确化的无文档实践中——因为明确化这些实践,也意味着让它们变得可审计。而这里存在一种张力,AI智能体项目正以比任何以往流程咨询更清晰的方式将其浮出水面。
AI智能体无法依赖组织拒绝命名的内容来运作。 而拒绝命名并不总是技术层面的问题,往往是政治层面的问题。它是对某些区域或人员不愿见到被正式化的裁量空间的保护,因为正式化将意味着他们失去一部分权力或自主性。
为什么采用节奏预测的是未来谁将拥有优势,而非今日谁拥有优势
Gartner预测,到2028年,企业环境中超过50%的AI智能体系统将使用上下文图谱。这个数字值得仔细解读,因为它并不是说所有组织都将很好地使用它们,而是说大多数组织将以某种方式使用它们。
以某种方式使用与使用得好之间的差距,取决于一些无法靠技术预算解决的事情。它取决于组织是否有能力完成前期工作——以细致而诚实的方式表达自身的决策方式。那些到2028年时,上下文图谱建立在没有人真正遵循的正式流程之上的组织,将拥有以更高效率复制功能障碍的复杂智能体。而那些完成了艰难工作、绘制出真实流程图谱的组织——包括那些非正式的、没有人记录的、因为不透明才方便的流程——将拥有本质上不同的东西:一种能够学习的机构记忆。
AI智能体领域的竞争优势,不会属于部署了更多模型或存储了更多tokens的人,而会属于那些更早知道如何筛选的人。属于那些构建了能够识别出可以改变具体决策结果的精确上下文片段的系统的人。而这在实践中,是一种先于技术的组织能力。
值得考虑在相反场景下会发生什么。一个拥有数百个并行运行的智能体的组织,每个智能体各自构建关于企业如何运作的碎片化、不一致视角,会产生一种不会立即显现但在结构上具有腐蚀性的混乱。智能体相互矛盾。一个做出的决策与另一个不一致。机构记忆不是在积累,而是在碎片化。当出现问题时,没有人能清晰地追溯是哪个智能体接收了什么上下文,以及为何以那种方式行动。治理体系恰恰在最需要它的时刻崩溃。
筛选是组织尚未学会的纪律
企业AI过去八年的演变,相当一致地确认了一件事。问题从来不是数据匮乏,而是抵制决定什么重要。
决定什么重要是有代价的。这意味着某些领域比其他领域受到系统更少的关注。这意味着某些代表多年积累工作的数据来源不会进入智能体的操作上下文。这意味着某人必须致力于建立一套层级,并在面对反对意见时坚守它。
这种对话,在我所了解的大多数组织中,从未在AI战略的背景下以明确的方式发生过。它以"如果给予足够的计算能力,系统可以处理一切"这一隐含承诺被回避了。而AI智能体现在所揭示的是,这一承诺从未是可行的。不是因为计算能力不足,而是因为智能体所能发挥的智能,受到其所接收上下文质量的限制;而上下文质量不是数量的函数,而是组织能够以多大的清晰度表达它所知道的内容及其使用方式的函数。
那些成功构建这种清晰度的组织,并不是因为找到了正确的技术平台。而是因为有人在领导岗位上有意愿去推动别人回避的对话,去命名系统倾向于留作无名的内容,去承诺建立一套具有真实可见政治代价的相关性层级。这是一种无法通过基础设施预算购买的能力。而目前,它是最为稀缺的。










