Databricks: Ontologie steuert KI-Agenten im Unternehmen

Databricks setzt auf Ontologie und enthüllt, wer das Gehirn der KI-Agenten im Unternehmensbereich kontrolliert

Die Geschichte der künstlichen Intelligenz im Unternehmensbereich lässt sich in Schichten messen. Zunächst kamen die Vektordatenbanken, die semantische Ähnlichkeitssuchen über große Textmengen ermöglichten. Dann kam die retrieval-augmented generation – kurz RAG –, die Sprachmodelle mit externen Wissensquellen kombinierte, um Halluzinationen zu reduzieren. Diese Architektur dominierte die letzten zwei Jahre und wurde zum De-facto-Standard für den Aufbau von Unternehmensassistenten.

Jetzt setzt Databricks darauf, dass diese Architektur nicht ausreicht. Auf seiner jährlichen Konferenz Data + AI Summit präsentierte CEO Ali Ghodsi Genie Ontology, eine Kontextschicht, die Geschäftsdefinitionen automatisch aus internen Daten, Dashboards, SQL-Abfragen, Dokumenten, Pipelines und Anwendungen extrahiert und sie in einem lebendigen Graphen organisiert, den KI-Agenten abfragen können, um zu verstehen, wie eine Organisation funktioniert. Das Produkt befindet sich in der Vorschauphase und verwendet ein von Googles PageRank inspiriertes Hierarchisierungssystem, um zu bestimmen, welche Quelle mehr Autorität verdient: wer die Informationen erstellt hat, wie oft sie verwendet wird, ob sie mit zertifizierten Assets verknüpft ist und wann sie zuletzt aktualisiert wurde.

Der Schritt ist nicht nur technischer Natur. Er ist eine Absichtserklärung darüber, wer die semantische Infrastruktur des Unternehmens der Zukunft kontrollieren wird, und dieser Streit hat wirtschaftliche Konsequenzen erster Ordnung.

Vom Archiv zur Autorität

Das Problem, das Genie Ontology zu lösen versucht, ist nicht neu. In jedem mittleren oder großen Unternehmen kann die Definition von „monatlich wiederkehrendem Umsatz" zwischen der Finanzabteilung, dem Vertrieb und dem Datenteam unterschiedlich sein. Drei Abteilungen, drei verschiedene Zahlen für dieselbe Kennzahl. Traditionelle RAG-Systeme lösen das nicht: Sie rufen ab, was der Frage ähnlich erscheint, unterscheiden aber nicht zwischen einer offiziellen Definition und einer, die jemand vor drei Jahren in einem Google-Dokument geschrieben hat.

Eine Ontologie hingegen ruft nicht nur ab; sie kodiert hierarchische Beziehungen zwischen Konzepten, legt fest, welche Quelle Autorität über welche Definition hat, und ermöglicht es verschiedenen KI-Agenten, dasselbe Geschäftsvokabular zu teilen. Michael Leone, Analyst bei Moor Insights & Strategy, beschreibt es präzise: Eine einzige Definition, die alle Agenten speist, bedeutet, dass man aufhört, drei verschiedene Antworten auf dieselbe Frage zu erhalten. Der operative Wert dieser Konsistenz ist in Organisationen, in denen kritische Entscheidungen auf der Grundlage automatisierter Berichte getroffen werden, hoch.

Ashish Chaturvedi, Forscher bei HFS Research, geht noch weiter und verknüpft dies mit dem hartnäckigsten Hindernis bei der Einführung von KI im Unternehmensbereich: dem Mangel an Vertrauen. Seiner Analyse zufolge ist das zentrale Problem nicht technischer, sondern wissensgovernance-bezogener Natur. Entscheidungsträger handeln nicht auf der Grundlage von KI-Ausgaben, weil sie nicht nachvollziehen können, woher diese stammen, und nicht überprüfen können, ob die Argumentationskette die richtigen Quellen verwendet hat. Eine Ontologie, die in offiziellen Definitionen mit Rückverfolgbarkeit bis zur Quelle verankert ist, geht direkt gegen dieses Defizit vor.

Databricks integriert Genie Ontology auch mit seiner Plattform Unity Catalog Semantics, was es Organisationen ermöglicht, ihre eigenen Definitionen oder Unternehmensvokabulare zu laden und die Kontrolle darüber zu behalten, was in den Graphen einfließt. Intern berichtet das Unternehmen, während seines eigenen Testprozesses etwa 4,5 Millionen ontologische Fragmente generiert zu haben. Das gibt eine Vorstellung von der Größenordnung des Problems, das sie zu lösen versuchen, und gleichzeitig von der Komplexität, es aktuell zu halten.

Das Risiko, das die Fortschrittsnarrative auslässt

Jede Architektur hat ihre Grenzen. Stephanie Walter von HyperFRAME Research identifiziert das fehlende Glied mit Präzision: Verifikation. Eine Ontologie verbessert den Kontext, in dem ein Agent operiert, garantiert aber nicht, dass die Antwort korrekt ist. Ein Agent kann die richtige Definition abfragen und trotzdem fehlerhafte Logik anwenden, Zeilen in einem Datensatz übersehen, einen Arbeitsablauf falsch interpretieren oder eine unerwünschte Aktion ausführen. Semantische Konsistenz ist nicht dasselbe wie operative Korrektheit.

Diese Unterscheidung ist besonders wichtig, weil der Horizont, auf den Databricks zielt, keine Abfrageassistenten, sondern Agenten sind, die Aktionen ausführen: Pipelines ändern, regulatorische Berichte generieren, Warnungen auslösen oder automatisierte Entscheidungen in Geschäftsprozessen treffen. In diesem Kontext kann ein gut begründeter semantischer Fehler gefährlicher sein als eine offensichtliche Mehrdeutigkeit, weil er weiter kommt, bevor jemand ihn entdeckt.

Leone fügt eine weitere Dimension hinzu: Die meisten Unternehmen verfügen nicht über die Daten- und Governance-Reife, die für die rigorose Implementierung einer Ontologieschicht erforderlich ist. Wenn die Datenherkunft schwach ist, die Eigentümer von Kennzahlen nicht definiert sind oder die geltenden Definitionen widersprüchlich sind, löst das Hinzufügen einer Ontologie das Problem nicht – es beschleunigt es. Der Graph speist sich aus den vorhandenen Quellen, und wenn diese Quellen inkonsistent sind, verbreitet sich die Inkonsistenz mit größerer Geschwindigkeit und dem Anschein von Autorität.

Walter fügt die stillste Dimension des Risikos hinzu: die Wartung. Eine Ontologie ist kein Projekt, das einmal konfiguriert wird. Sie ist ein lebendiges Asset, das jedes Mal aktualisiert werden muss, wenn sich das Geschäft ändert, wenn ein neues Produkt eingeführt wird, wenn eine Kennzahl neu definiert oder eine Einheit reorganisiert wird. Ohne Aktualisierungsprozesse, klare Eigentümerschaft und Mechanismen zur Lösung von Konflikten zwischen Definitionen veraltet der Graph. Und eine veraltete Ontologie mit algorithmischer Autorität über Agenten ist laut Walter „ein weiteres ins Stocken geratenes Metadatenprojekt mit einem ausgefeilteren Namen."

Das macht die Wette von Databricks nicht zunichte, definiert aber das Terrain, auf dem das Produkt seinen Wert beweisen muss: nicht in einer Präsentation auf einer Bühne, sondern im operativen Betrieb innerhalb von Organisationen mit unvollkommenen Daten und Governance-Strukturen, die noch heranreifen.

Der Streit um die Unternehmenskontrollebene

Genie Ontology existiert nicht im Vakuum. Snowflake hat Horizon Context, seine eigene semantische Schicht für Agenten. Microsoft baut gleichwertige Fähigkeiten innerhalb von Copilot, Fabric und seiner IQ-Familie auf – Work IQ, Fabric IQ, Foundry IQ –, indem es Geschäftskontext und Governance in seine breitere Infrastruktur integriert. Das Problem, so Leone, ist, dass jeder Anbieter eine grundlegend ähnliche Idee unterschiedlich benannt hat, und diese terminologische Fragmentierung verlangsamt die Einführung, weil die Teams der CIOs nicht klar vergleichen können, was sie evaluieren.

Jenseits der Namen ist das, worum es geht, strukturell bedeutsam. Chaturvedi beschreibt es als das Rennen darum, zur Kontrollebene der Unternehmens-KI zu werden: der Ort, an dem Daten, Governance, Semantik und Agentenausführung zusammenlaufen. Die historische Analogie, die er verwendet, ist treffend: ERP-Systeme wurden zum Erfassungssystem für Geschäftstransaktionen; Data Warehouses wurden zum Erfassungssystem für Analysen. Jetzt wird definiert, welche Plattform das Erfassungssystem für KI-Agenten wird.

Databricks positioniert Genie Ontology innerhalb einer umfassenderen Architektur, die LTAP – seinen Vorschlag als Fundament für agentische Anwendungen – und OpenSharing umfasst, das darauf ausgelegt ist, die Integrationskosten in Unternehmens-KI-Umgebungen zu senken. Miteinander verbunden, zielen diese Komponenten auf eine Vision ab, die Ghodsi selbst als „agentisches Erfassungssystem" beschreibt: eine autoritative Quelle, aus der Agenten lesen, schlussfolgern und handeln. Es ist kein isoliertes Produkt; es ist eine Plattformstrategie.

Der strukturelle Vorteil der Datenanbieter in diesem Rennen ist real: Sie besitzen bereits die Daten, die Governance-Kontrollen, die Herkunft und die Berechtigungen, die Agenten für einen sicheren Betrieb benötigen. Das versetzt sie in eine andere Position als einen Modellanbieter oder Orchestrierungstools. Aber dieser Vorteil hat eine weniger günstige Seite: Er macht sie auch davon abhängig, dass ihre Kunden ihre Daten bereits in Ordnung haben. Und für die meisten Unternehmen ist das noch nicht der Fall.

Chaturvedi bietet eine Heuristik an, die die Entscheidung für Teams vereinfacht, die diese Optionen heute evaluieren: Die Kontextschicht folgt der Schwerkraft der Daten. Wenn die Daten in Databricks liegen, ist Genie Ontology der natürliche Weg. Wenn sie in Snowflake sind, ist es Horizon Context. Wenn die Infrastruktur überwiegend Microsoft ist, ist die IQ-Familie der Weg. Bhupendra Chopra vom Beratungsunternehmen Kanerika bekräftigt dieses Argument: Über das Marketing jeder Plattform hinaus wird die eigentliche Entscheidung durch den Ort getroffen, an dem die Daten bereits liegen.

Snowflake versucht, sein Angebot zu differenzieren, indem es auf offene semantische Interoperabilität setzt, was theoretisch ermöglicht, dass Geschäftsdefinitionen sich zwischen Plattformen bewegen, ohne im Datenmodell eines einzigen Anbieters gefangen zu sein. Diese Wette zielt direkt auf das Risiko der semantischen Abhängigkeit ab – das Äquivalent zur Plattformbindung, aber angewendet auf das Unternehmensvokabular – in Umgebungen, in denen Unternehmen gleichzeitig auf mehreren Datensystemen operieren.

Der Wert wird dort erfasst, wo die Ausführung verifiziert wird

Die dominierende Narrative rund um diese Plattformen spricht von Kontext, Konsistenz und Vertrauen. All diese Dimensionen sind wichtig, aber eine hat in keinem der verfügbaren Vorschläge noch eine solide Antwort: wie verifiziert wird, dass das, was der Agent getan hat, korrekt war.

Das ist die eigentliche Grenze. Nicht die Qualität des Kontexts, mit dem der Agent eine Aufgabe beginnt, sondern die Fähigkeit, mit vollständiger Rückverfolgbarkeit zu prüfen, was der Agent getan hat, welche Definitionen er verwendet hat, welche Daten er verarbeitet hat, welche Logik er angewendet hat und ob das Ergebnis reproduzierbar ist. Walter fasst es ohne Mehrdeutigkeit zusammen: Das nächste Streitfeld in der Unternehmens-KI ist nicht der Kontext, sondern die verifizierbare Ausführung.

Das hat direkte Konsequenzen dafür, wo in diesem Rennen der wirtschaftliche Wert erfasst wird. Eine Ontologie, die die semantische Konsistenz verbessert, ist ein wertvolles Asset, aber nicht ausreichend, damit eine Organisation operative Entscheidungen mit realen Konsequenzen – finanziellen, regulatorischen, operativen – an autonome Agenten delegieren kann. Damit dieses Maß an Delegation stattfinden kann, muss die Plattform mehr bieten: ein prüfbares Register von Entscheidungen, Korrekturmechanismen, wenn der Agent einen Fehler macht, und Garantien darüber, was passiert, wenn sich der Kontext ändert und der Graph noch nicht aktualisiert wurde.

Databricks baut in diese Richtung, obwohl Genie Ontology allein diese Frage noch nicht beantwortet. Was die Gesamtheit der Ankündigungen des Data + AI Summit offenbart, ist eine kohärente Strategie auf dieses Ziel hin: Daten + Governance + Semantik + agentische Ausführung als integrierte Schichten innerhalb einer einzigen Plattform. Die Kohärenz der Vision ist klar. Der Stresstest kommt, wenn die Ontologie innerhalb von Organisationen präzise bleiben muss, die sich schneller verändern, als ein Graph sich allein aktualisieren kann.

Diese Spannung zwischen dem Ehrgeiz der Architektur und der operativen Realität der KMU und Großunternehmen, die sie einführen werden, ist der Ort, an dem sich entscheiden wird, ob diese Wette nachhaltigen Wert generiert oder ob sie zu ausgefeilter Infrastruktur auf Fundamenten wird, die noch nicht bereit sind, sie zu tragen.

Databricks setzt auf Ontologie und enthüllt, wer das Gehirn der KI-Agenten im Unternehmen kontrolliert

Databricks setzt auf Ontologie und enthüllt, wer das Gehirn der KI-Agenten im Unternehmensbereich kontrolliert

Vom Archiv zur Autorität

Das Risiko, das die Fortschrittsnarrative auslässt

Der Streit um die Unternehmenskontrollebene

Der Wert wird dort erfasst, wo die Ausführung verifiziert wird

Das könnte Sie auch interessieren

Die Amnesie von KI-Systemen ist kein Modellproblem, sondern ein Infrastrukturproblem

Indien entdeckte, dass es den Schalter seiner eigenen digitalen Wirtschaft nicht kontrolliert

Warum 95% der KI-Projekte in Unternehmen den Piloten nicht überleben

Hundert Milliarden Token und kein CFO weiß, was er gekauft hat

Die Schicht, die niemand gebaut hat und die KI nicht improvisieren kann

IBM setzt darauf, dass operative Souveränität das Schlachtfeld der Unternehmens-KI wird