Databricks apuesta por la ontología y revela quién controla el cerebro de los agentes de IA empresarial
企业人工智能的历史可以用层级来衡量。首先出现的是向量数据库,它能够对大量文本进行语义相似性搜索。随后出现了检索增强生成技术——即英文缩写RAG——它将语言模型与外部知识源相结合,以减少幻觉现象。这一架构主导了过去两年,并成为构建企业助手的事实标准。
如今,Databricks正在押注这一架构已经不够用了。在其年度大会Data + AI Summit上,首席执行官Ali Ghodsi发布了Genie Ontology,这是一个上下文层,能够自动从内部数据、仪表板、SQL查询、文档、数据管道和应用程序中提取业务定义,并将其组织成一个动态图谱,供AI智能体查询,以理解组织的运营方式。该产品目前处于预览阶段,采用一套受谷歌PageRank启发的优先级排序系统,以确定哪个来源应具有更高的权威性:信息的创建者、使用频率、是否与经认证的资产相关联,以及最后一次更新的时间。
这一举措不仅仅是技术层面的。它是一份关于谁将控制未来企业语义基础设施的意向声明,而这场争夺具有深远的经济后果。
从归档到权威
Genie Ontology试图解决的问题并不新鲜。在任何中大型企业中,"月度经常性收入"的定义在财务、销售和数据团队之间可能各不相同。三个部门,同一指标,三个不同的数字。传统的RAG系统无法解决这一问题:它们会检索看起来与问题相似的内容,但无法区分官方定义与某人三年前在一份Google文档中写下的内容。
而本体论则不仅仅是检索;它对概念之间的层级关系进行编码,确立哪个来源对哪个定义具有权威性,并允许不同的AI智能体共享同一套业务词汇。Moor Insights & Strategy的分析师Michael Leone对此解释得很清楚:用一个单一的定义为所有智能体提供信息,意味着不再会对同一个问题收到三种不同的答案。在那些关键决策基于自动化报告做出的组织中,这种一致性的运营价值是极高的。
HFS Research的研究员Ashish Chaturvedi更进一步,将此与企业AI采用中最顽固的障碍联系起来:信任的缺失。根据他的分析,核心问题不是技术性的,而是知识治理问题。决策者不会根据AI的输出结果采取行动,因为他们无法追溯这些结果的来源,也无法验证推理链是否使用了正确的来源。一个基于官方定义并具有可追溯性的本体论,直接针对这一缺陷发起攻击。
Databricks还将Genie Ontology与其Unity Catalog Semantics平台整合,使组织能够上传自己的定义或企业词汇表,并保持对进入图谱内容的控制。据公司内部报告,在自身的测试过程中,该公司已生成约450万个本体论片段。这既让我们得以了解他们试图解决的问题规模,同时也揭示了保持其持续更新的复杂性。
进步叙事所遗漏的风险
任何架构都有其局限性。HyperFRAME Research的Stephanie Walter精准地指出了缺失的环节:验证。本体论改善了智能体运行的上下文,但并不能保证答案是正确的。一个智能体可能查询了正确的定义,却仍然应用了错误的逻辑、遗漏了数据集中的某些行、误解了一个工作流,或者执行了一个不期望的操作。语义一致性与运营正确性并不等同。
这种区别尤为重要,因为Databricks所瞄准的未来愿景并非查询助手,而是执行操作的智能体:修改数据管道、生成监管报告、触发警报,或在业务流程中做出自动化决策。在这种情况下,一个有据可查的语义错误可能比一个显而易见的歧义更加危险,因为它在被人发现之前已经走了更远。
Leone补充了另一个维度:大多数企业尚不具备严格实施本体论层所需的数据和治理成熟度。如果数据血缘关系薄弱、指标所有者尚未明确,或者现有定义相互矛盾,那么增加一个本体论层并不能解决问题,反而会加速问题的蔓延。图谱从现有来源中获取信息,如果这些来源本身就不一致,那么不一致性将以更快的速度传播,并以更具权威性的外表呈现。
Walter还补充了风险中最容易被忽视的一个维度:维护。本体论不是一个一次性配置完成的项目。它是一个活的资产,每当业务发生变化、新产品上线、指标被重新定义或某个业务部门进行重组时,都需要更新。如果没有更新流程、明确的所有权以及解决定义冲突的机制,图谱就会过时。而一个对智能体具有算法权威的过时本体论,在Walter看来,不过是"另一个以更复杂名称命名的停滞不前的元数据项目"。
这并没有使Databricks的押注失效,但确实划定了该产品必须证明其价值的地盘:不是在台上的演示,而是在数据不完善、治理结构仍在成熟中的组织内部的运营维护。
争夺企业控制平面
Genie Ontology并非孤立存在。Snowflake拥有Horizon Context,这是其为智能体打造的语义层。微软正在Copilot、Fabric及其IQ系列——Work IQ、Fabric IQ、Foundry IQ——中构建等效能力,将业务上下文和治理整合到其更广泛的基础设施中。Leone指出,问题在于每家供应商对一个基本相似的理念给出了不同的命名,这种术语碎片化拖慢了采用速度,因为CIO团队无法清晰地比较他们正在评估的内容。
抛开名称不谈,争夺的内容在结构上具有重大意义。Chaturvedi将其描述为一场争相成为企业AI控制平面的竞赛:一个数据、治理、语义和智能体执行相融合的地方。他使用的历史类比十分精准:ERP系统成为了业务交易的记录系统;数据仓库成为了分析的记录系统。现在,正在被定义的是哪个平台将成为AI智能体的记录系统。
Databricks将Genie Ontology定位在一个更广泛的架构中,该架构还包括LTAP——其针对智能体应用的基础提案——以及OpenSharing,旨在降低企业AI环境中的集成成本。将这些组件连接起来,指向了一个Ghodsi本人称之为"智能体记录系统"的愿景:一个智能体从中读取、推理和行动的权威来源。这不是一个孤立的产品;这是一个平台战略。
数据提供商在这场竞赛中的结构性优势是真实存在的:他们已经拥有智能体安全运行所需的数据、治理控制、血缘关系和权限。这使他们处于与模型提供商或编排工具提供商截然不同的位置。但这一优势也有其不利的一面:这也使他们依赖于客户已经整理好自己的数据。而对于大多数企业来说,这仍然还不是现实。
Chaturvedi提供了一个启发式方法,简化了当今评估这些选项的团队的决策:上下文层遵循数据重力。如果数据存储在Databricks中,Genie Ontology就是自然之选。如果数据在Snowflake中,那么Horizon Context就是选择。如果基础设施以微软为主,那么IQ系列就是路径所在。咨询公司Kanerika的Bhupendra Chopra强化了这一论点:超越各平台的市场营销,真正做出决定的是数据已经存放的位置。
Snowflake正试图通过押注开放语义互操作性来差异化其产品,理论上这允许业务定义在平台之间流转,而不会被锁定在单一供应商的数据模型中。这一押注直接针对语义依赖风险——平台锁定的等价物,但应用于企业词汇——在企业同时运行多个数据系统的环境中尤为相关。
价值在执行验证处被捕获
围绕这些平台的主流叙事聚焦于上下文、一致性和信任。这些维度都很重要,但有一个维度在现有任何提案中仍然没有可靠的答案:如何验证智能体所做的事情是正确的。
这才是真正的边界。不是智能体开始执行任务时所具备的上下文质量,而是能够以完整的可追溯性审计智能体做了什么、使用了哪些定义、处理了哪些数据、应用了什么逻辑,以及结果是否可以复现。Walter毫不含糊地总结道:企业AI的下一个争夺战场不是上下文,而是可验证的执行。
这对于这场竞赛中经济价值的捕获位置有着直接影响。一个提升语义一致性的本体论是一项有价值的资产,但对于一个组织而言,这还不足以让其将具有真实后果——财务、监管、运营——的运营决策委托给自主智能体。要让这种程度的授权成为可能,平台需要提供更多:决策的可审计记录、智能体出错时的纠错机制,以及对上下文变化而图谱尚未更新时会发生什么的保证。
Databricks正朝着这个方向构建,尽管Genie Ontology本身目前还没有回答这个问题。Data + AI Summit系列发布所揭示的,是一种朝着这一目标迈进的连贯战略:数据+治理+语义+智能体执行,作为集成层整合在单一平台内。这一愿景的连贯性是清晰的。真正的压力测试将在本体论必须在那些变化速度超过任何图谱自我更新速度的组织内保持精准时到来。
架构雄心与将要采用它的企业的运营现实之间的这种张力,将最终决定这场押注能否创造可持续的价值,还是会成为精密的基础设施——建立在尚未准备好承载它的基础之上。










