Warum 95% der KI-Pilotprojekte scheitern, bevor sie ein einziges Ergebnis liefern

Warum 95% der KI-Pilotprojekte scheitern, bevor sie ein einziges Ergebnis liefern

Es gibt eine Szene, die sich in fast jedem mittelständischen Unternehmen wiederholt, das ich kenne. Das Technologieteam präsentiert ein KI-Pilotprojekt. Die ersten Zahlen sind vielversprechend. Der Vorstand genehmigt die Investition. Und sechs Monate später ist das Pilotprojekt immer noch ein Pilotprojekt.

Simón ArceSimón Arce19. Mai 20269 Min
Teilen

Warum 95 % der KI-Pilotprojekte scheitern, bevor sie ein einziges Ergebnis liefern

Es gibt eine Szene, die sich in fast jedem mittelständischen Unternehmen wiederholt, das ich kenne. Das Technologieteam präsentiert ein Pilotprojekt für künstliche Intelligenz. Die ersten Zahlen sind vielversprechend. Der Vorstand genehmigt die Investition. Und sechs Monate später ist das Pilotprojekt immer noch ein Pilotprojekt. Niemand beendet es offiziell. Aber es skaliert auch nicht. Es belegt einfach... Platz auf der Roadmap und in den Statusmeetings.

Dennis Woodside, Präsident und CEO von Freshworks, veröffentlichte vor einigen Tagen eine Analyse in Fortune, die diesem Phänomen einen Namen gibt. Und obwohl der Artikel auch als kommerzielle Positionierung für sein Unternehmen dient, verdient die darin enthaltene Diagnose aus einem einfachen Grund ernst genommen zu werden: Die externen Daten, auf die er verweist, sind unbequem für jeden C-Level-Manager, der seit mehr als einem Jahr seiner Geschäftsführung KI-Ergebnisse verspricht.

Das MIT stellte fest, dass 95 % der generativen KI-Pilotprojekte scheitern, bevor sie die Produktionsphase erreichen. Boston Consulting Group veröffentlichte im September 2025, dass 60 % der Unternehmen mit KI keinerlei materiellen Mehrwert generieren, und dieser Prozentsatz hat sich gegenüber dem Vorjahr verschlechtert – obwohl sich die Modelle verbessert haben und die gesammelte Erfahrung gestiegen ist. Freshworks fügt eine eigene Zahl hinzu: Ein Viertel des KI-Budgets in mittelständischen Unternehmen wird für Integration, Datenbereinigung und den Aufwand verbraucht, Systeme miteinander kommunizieren zu lassen, die niemals dafür ausgelegt wurden.

Was diese drei Zahlen gemeinsam haben, ist nicht das gewählte KI-Modell. Es ist der Zustand der betrieblichen Umgebung, in der die Implementierung versucht wird.

Die Entscheidung, die diejenigen trennt, die vorankommen, von denen, die stagnieren

Woodside beschreibt den Fall von Seagate Technology mit einer Präzision, die genau deshalb nützlich ist, weil sie keinerlei Glamour besitzt. Das IT-Team hatte drei Monate Zeit, um 30.000 Mitarbeiter auf eine neue Service-Management-Plattform zu migrieren – erzwungen durch den Ablauf eines Vertrags. Die naheliegende Entscheidung, die fast jede Organisation unter diesem Druck treffen würde, war es, die bestehenden Konfigurationen so wie sie waren zu übertragen und die Probleme danach zu lösen. Das ist der sicherste Weg kurzfristig. Es ist auch derjenige, der garantiert, dass jede KI-Schicht, die darüber aufgebaut wird, auf fehlerhaften Fundamenten operiert.

Das Team von Seagate entschied sich für das Gegenteil. Es baute von Grund auf neu: restrukturierte den Service-Katalog, etablierte konsistente Servicelevel zwischen Regionen, schrieb Kategoriehierarchien neu, damit Tickets sich selbst weiterleiten konnten, ohne dass ein Mitarbeiter raten musste. Das alles wurde im gleichen Zeitraum von drei Monaten erledigt. Ein Jahr später deflektiert der auf dieser Basis eingesetzte KI-Agent etwa ein Drittel der eingehenden Tickets, und die Erstlösungsrate liegt 27 % über dem Branchenstandard.

Diese Entscheidung – neu aufbauen statt replizieren – ist das Herzstück von Woodsides Argumentation. Und sie hat eine organisationale Lesart, die weit über die Technologie hinausgeht.

Was Seagate tat, erforderte, dass jemand irgendwann im Prozess ein Gespräch führte, das niemand führen wollte: dasjenige, das anerkennt, dass vererbte Prozesse nicht nur ineffizient sind, sondern ein aktives Hindernis für jede zukünftige Verbesserung darstellen. Dieses Gespräch hat einen politischen Preis. Zu sagen, dass die aktuellen Prozesse nicht übertragen werden, bedeutet zu sagen, dass jahrelange Konfigurations-, Anpassungs- und Feinabstimmungsarbeit nicht in die neue Umgebung mitgenommen wird. Es bedeutet, vergangene Entscheidungen zumindest teilweise zu entwerten. Wenige Organisationen haben under Zeitdruck einen Appetit dafür.

Was Seagate auszeichnet, ist nicht mehr Ressourcen oder mehr Zeit gehabt zu haben. Es ist die Klarheit – oder der unternehmerische Mut –, die Vergangenheit nicht in die Zukunft mitzuschleppen, als der Vertrag auslief. Das ist die Variable, die in keinem Implementierungshandbuch für KI auftaucht.

Die unsichtbare Steuer, die zahlt, wer seine Prozesse nicht betrachtet

Woodside führt das Konzept der „Komplexitätssteuer" ein, um zu beschreiben, was passiert, wenn ein Unternehmen versucht, KI auf einer fragmentierten Architektur zu implementieren. Das ist keine dekorative Metapher. Es ist eine konkrete finanzielle Mechanik.

Wenn 25 % des KI-Budgets in Integration und Datenbereinigung verloren gehen, bevor das Modell einen einzigen nützlichen Output produziert, kauft ein Unternehmen, das eine Million Dollar für KI einplant, in der Praxis 750.000 Dollar an Kapazität. Die verbleibenden 25 % absorbiert die angesammelte technische Schuld. Für ein großes Unternehmen mit Transformationsbudgets in Höhe von Hunderten von Millionen ist dieser Anteil tolerierbar. Für ein Unternehmen mit 500 bis 20.000 Mitarbeitern, mit kleineren IT-Teams und geringerem Handlungsspielraum, kann dieser Verlust der Unterschied sein zwischen einer Initiative, die gedeiht, und einer, die im nächsten Budgetzyklus still und leise eingestellt wird.

Woodsides Argument über „agile Unternehmen" – sein Begriff für diese Bandbreite mittelständischer Organisationen – hat eine Logik, die die großen Medien gewöhnlich ignorieren, weil das Segment nicht so fotogen ist wie die Geschichten digitaler Transformation bei den Fortune-500-Unternehmen. Aber es ist genau dort, wo die Produktivitätsschlacht, die KI verspricht, gewonnen oder verloren werden wird. KMU repräsentieren die Mehrheit des globalen Unternehmensgewebes. Wenn KI dort nicht funktioniert, materialisiert sich das versprochen aggregierte Produktivitätsversprechen nicht – unabhängig davon, was Google, Microsoft oder Amazon mit ihren eigenen Modellen tun.

Was die Analyse noch interessanter macht, ist, dass das Problem nicht in der Auswahl des Modells liegt. Es liegt in einer früheren und schwieriger zu lösenden Schicht: der Qualität der betrieblichen Umgebung. Daten verstreut in Systemen, die nicht miteinander kommunizieren. Arbeitsabläufe, die durch die Geschichte des Unternehmens definiert werden, mehr als durch ihre Logik. Taxonomien von Tickets, Servicekategorien oder Produkthierarchien, die niemand überprüft hat, weil sie immer „gut genug funktioniert" haben. Wenn man einen KI-Agenten bittet, auf dieser Infrastruktur zu operieren, scheitert er nicht, weil das Modell schlecht ist. Er scheitert, weil die Umgebung ihm mehrdeutige, unvollständige oder widersprüchliche Informationen liefert – und kein Modell das ausgleichen kann.

Robert Lyons, Technologieleiter von Katz Media Group – einer Geschäftseinheit mit 800 Mitarbeitern innerhalb eines 10.000-Mitarbeiter-Unternehmens – bietet in Woodsides Analyse das vielleicht praktischste Stück Rat des gesamten Artikels: Bevor sein Team irgendein KI-Tool einsetzte, reinigte und beschriftete es die Daten und führte ein KI-Einführungsseminar für alle Mitarbeiter des Unternehmens durch – veranstaltet nicht vom IT-Team, sondern von einer unabhängigen Forschungsfirma. Die Unterscheidung ist wichtig. Wenn IT die KI präsentiert, tut es das mit dem impliziten Vorurteil desjenigen, der ein Interesse am Ergebnis hat. Wenn es ein neutraler Dritter tut, kommt die Botschaft anders an, und der organisationale Widerstand sinkt.

Lyons beschreibt auch eine Wert/Aufwand-Matrix zur Priorisierung von KI-Projekten: Implementierungsleichtigkeit auf einer Achse, Geschäftswert auf der anderen. Er beginnt im Quadranten mit hohem Wert und geringem Aufwand. Seine Warnung – „fang nicht mit dem schlimmsten Problem an, du wirst keinen Wert generieren" – ist eine direkte Kritik an einem Muster, das ich häufig in Organisationen sehe, die KI als Gelegenheit betrachten, Probleme zu lösen, die keine andere Initiative lösen konnte. Diese Logik ist verständlich, aber kontraproduktiv. Die sichtbarsten und ambitioniertesten KI-Projekte sind auch die fragilsten, weil sie auf den ungeordnetsten Datenumgebungen und den am wenigsten strukturierten Arbeitsabläufen operieren.

Was Nucor und New Balance mit einem Stahlunternehmen gemeinsam haben

Woodside zitiert zwei Vergleiche, die gesonderte Aufmerksamkeit verdienen. Der erste ist zwischen Nike und New Balance. Nike operiert mit 80.000 Mitarbeitern; New Balance mit 9.000. Woodside argumentiert, dass New Balance Wettbewerbsboden gewinnt, indem es seine IT-Infrastruktur auf einer einzigen Plattform mit einer zentralisierten Quelle der Wahrheit konsolidiert, Teams von Wartungsarbeiten befreit und neu konfiguriert, wie das Unternehmen operiert. Der zweite Vergleich betrifft Nucor und Steel Dynamics, zwei der vier größten Stahlhersteller in den USA, die laut Woodside seit Jahrzehnten eine operative Disziplin pflegen, die Umgebungen schafft, die KI direkt optimieren kann.

Das Muster, das diese Fälle verbindet, ist dasselbe wie bei Seagate: KI funktioniert dort, wo die betriebliche Umgebung bereit war, sie zu empfangen. Nicht perfekt. Bereit. Konsolidierte Daten, definierte Arbeitsabläufe, Systeme, die Informationen ohne manuelle Eingriffe austauschen können, und ein messbares Ergebnis, das der KI-Agent verbessern soll.

Das hat eine Führungsimplikation, die nur wenige klar benennen. Die Unternehmen, die am meisten Schwierigkeiten haben, KI zu implementieren, sind nicht diejenigen, die das falsche Modell gewählt haben oder die falschen Berater eingestellt haben. Es sind diejenigen, die über Jahre hinweg Technologieentscheidungen getroffen haben, bei denen sie operative Kontinuität über architektonische Kohärenz stellten. Jedes Mal, wenn jemand sagte „fügen wir dieses System hinzu, weil es dieses Problem jetzt löst", ohne sich zu fragen, wie dieses System mit dem Rest integriert werden würde, häufte er eine Verbindlichkeit an, die heute in Form von KI-Budget verbraucht wird, das in die Integration fließt.

Diese Verbindlichkeit ist kein technisches Versagen. Es ist das angesammelte Ergebnis von Architekturgesprächen, die nicht stattfanden, von Bewertungen technischer Schulden, die verschoben wurden, weil das Quartal Geschwindigkeit forderte, von vererbten Konfigurationen, die niemand überprüfen wollte, weil der politische Preis, sie in Frage zu stellen, hoch war.

Was die erfolgreichen Fälle, die Woodside beschreibt, gemeinsam haben, ist, dass jemand irgendwann die Entscheidung traf, diese Verbindlichkeit zu bezahlen. Seagate tat es unter dem Druck eines ablaufenden Vertrags. New Balance tat es als Teil einer strategischen Wette auf Geschwindigkeit. Nucor und Steel Dynamics taten es über Jahrzehnte, ohne zu wissen, dass sie das Fundament für einen Wettbewerbsvorteil in KI legten.

Wer führt, muss den Preis zahlen, hinzusehen, was die Organisation vermeidet zu benennen

Es gibt ein Element in Woodsides Argumentation, das der Artikel nur am Rande berührt, das aber klar beim Namen genannt werden muss: Die Mehrheit der Organisationen, die in KI-Pilotprojekten feststecken, weiß das. Es ist kein technisches Unwissen. Vielmehr hat das Gespräch über den Zustand der betrieblichen Umgebung einen politischen Preis, den niemand zahlen möchte.

Zuzugeben, dass 25 % des KI-Budgets in Integration und Datenbereinigung verloren gehen, bedeutet zuzugeben, dass die architektonischen Entscheidungen der Vergangenheit kostspielig waren. Zuzugeben, dass vererbte Prozesse nicht in die neue Umgebung übertragen werden können, bedeutet zuzugeben, dass jahrelange Konfigurationsarbeit dem Wandel nicht standhält. Zuzugeben, dass die Daten in schlechtem Zustand sind, bedeutet zuzugeben, dass die Datenqualitätsinitiativen der letzten Jahre nicht geliefert haben, was sie versprachen.

Diese Eingeständnisse erfordern etwas, das die Dynamik vieler Aufsichtsräte und Vorstände hemmt: die Fähigkeit, ein strukturelles Problem zu benennen, ohne dass die Person, die es benennt, mit dem Versagen assoziiert wird, das sie beschreibt.

Die Aufgabe derjenigen, die in diesem Kontext führen, ist nicht technischer Natur. Es geht darum, die Bedingungen zu schaffen, unter denen diese Gespräche stattfinden können, ohne dass der Überbringer der Nachricht der Preis ist. Die Organisationen, die mit KI Ergebnisse erzielen – die Fälle, die Woodside beschreibt – haben keine perfekten Umgebungen. Sie haben Führungskräfte, die entschieden haben, den Preis der Klarheit zu zahlen, bevor sie den Preis der gescheiterten Implementierung zahlen.

Diese Reihenfolge ist unter Druck nicht intuitiv. Aber sie ist die einzige, die Ergebnisse erzeugt, die im nächsten Budgetüberprüfungszyklus nicht verschwinden.

Teilen

Das könnte Sie auch interessieren