KI-Autonomie und Kontrolle: Was AWS wirklich verspricht

Wenn Autonomie Aufpasser braucht, stimmt etwas an der Versprechen nicht

Es gibt einen bestimmten Moment, in dem Unternehmenssprache sich selbst verrät. Er tritt auf, wenn dasselbe Unternehmen, das ankündigt, seine Agenten für künstliche Intelligenz könnten alleine arbeiten, parallel, ohne Überwachung, und Ergebnisse liefern, bevor irgendjemand sie angefordert hat, auf derselben Veranstaltung eine ganze Reihe von Werkzeugen vorstellt, deren einzige Funktion darin besteht, diese Agenten zu überwachen, zu korrigieren und rückgängig zu machen, was sie falsch gemacht haben.

Genau das geschah auf dem AWS Summit in New York im Juni 2026. Amazon Web Services trat mit dem Versprechen des „Zeitalters der Agenten" vor den Unternehmensmarkt und verließ die Veranstaltung, nachdem es gleichzeitig sein ambitioniertestes System autonomer Agenten und seine bisher dichteste Kontrollinfrastruktur angekündigt hatte. Der Abstand zwischen beiden Dingen ist kein technisches Detail. Es ist eine Positionserklärung darüber, wo sich die Branche wirklich befindet.

Für jemanden, der eine Organisation leitet und entscheiden muss, wo Kapital, Talent und institutionelle Glaubwürdigkeit eingesetzt werden, verdient diese Spannung mehr Analyse, als sie üblicherweise erhält.

---

Das Angebot hat zwei Schichten, und nur eine wird verkauft

Das Herzstück der AWS-Ankündigung war Amazon Quick, eine Plattform, die es Nutzern ohne Programmierkenntnisse ermöglicht, autonome Agenten zu erstellen, indem sie deren Funktion in natürlicher Sprache beschreiben und sie in Sekunden einzusetzen. Das kursierende Beispiel: ein Agent, der nachts regulatorische Einreichungen überwacht, sie mit internen Richtlinien abgleicht und vor Tagesanbruch eine Folgenabschätzung liefert. Ohne menschliches Eingreifen. Ohne Code. Ohne Reibung.

Das Verkaufsargument ist klar. Und in bestimmten, begrenzten Kontexten funktioniert es wahrscheinlich. Aber dieselbe Präsentation enthielt weitere Elemente, die eine andere Geschichte erzählen.

Der AWS DevOps Agent erhielt Versionsverwaltungsfunktionen, die den von KI-Agenten generierten Code überprüfen, bevor er in die Produktion gelangt – denn, wie das Unternehmen selbst es formuliert, schreiben Coding-Agenten mit außerordentlicher Geschwindigkeit, während die menschliche Überprüfung nach wie vor langsam ist. Ebenfalls vorgestellt wurde AWS Transform, das auf der Prämisse aufbaut, dass je schneller Code generiert wird, desto schneller sich technische Schulden ansammeln, und dass diese Schulden kontinuierlich und autonom bereinigt werden müssen. Und es wurde AWS Continuum präsentiert, ein Sicherheitsdienst, der im „Lernmodus" startet und erst dann zu autonomem Enforcement übergeht, wenn das Vertrauen in das System gewachsen ist.

Jedes dieser Werkzeuge setzt im Design voraus, dass Agenten Fehler machen werden, dass diese Fehler die Produktion erreichen, wenn niemand sie abfängt, und dass das Tempo der Problemgenerierung die menschliche Fähigkeit, sie zu erkennen, übersteigen kann. Das ist keine Beschreibung von Autonomie. Es ist die Beschreibung eines Systems, das kontinuierliche Überwachung in großem Maßstab erfordert, weil ohne sie die Risiken unbeherrschbar werden.

Swami Sivasubramanian, Vice President für agentische KI bei AWS, wies die Lesart, dies sei ein Widerspruch, zurück. Sein Argument: Die Kontrollen schwächen die Autonomie nicht, sie ermöglichen sie erst. Manuelle Reibung bei jeder Entscheidung ist keine Garantie für gute Governance; sie ist ein Flaschenhals, der als Vorsicht verkleidet ist. Was AWS vorschlägt, ist, diese manuelle Reibung durch richtlinienbasierte Kontrollen zu ersetzen, die mit der Geschwindigkeit und dem Umfang arbeiten können, den moderne Organisationen benötigen.

Es ist ein kluges Argument. Und zum Teil hat es recht. Aber es weicht etwas aus.

---

Das Problem ist nicht technischer, sondern ungeklärter Governance-Natur

Die Behauptung, dass automatisierte Kontrollen der manuellen Reibung überlegen sind, funktioniert gut, wenn die Kontrollen korrekt kalibriert sind, wenn die Richtlinien, die die Agenten steuern, die Absichten der Organisation präzise widerspiegeln, und wenn die Fehler, die innerhalb des Systems gemacht werden, erkennbar und reversibel sind. Keine dieser drei Bedingungen ist selbstverständlich. Alle erfordern organisatorische Vorarbeit, die die meisten Unternehmen noch nicht geleistet haben.

Liz Miller, Vice President und Principal Analyst bei Constellation Research, sagt es ohne Umschweife: Governance, Risiko und Verantwortlichkeit sind systematisch die ersten Einschränkungen, die KI-Agentenprojekte in Unternehmen bremsen. Nicht die Technologie. Nicht das Budget. Die Unfähigkeit, klar zu beantworten, wer verantwortlich ist, wenn der Agent eine Entscheidung trifft, die niemand ausdrücklich genehmigt hat.

Das ist das Gespräch, das viele Organisationen vermeiden. Und sie vermeiden es, weil es interne politische Kosten hat. Zu definieren, was ein Agent ohne menschliche Validierung entscheiden kann, bedeutet, eine Position dazu einzunehmen, welche Prozesse standardisiert werden können, welche Ausnahmen es gibt, was passiert, wenn das System versagt, und wer das unterschreibt. Das sind keine technischen Fragen. Es sind Fragen über Macht, Verantwortung und Risikobereitschaft, die zunächst von jemandem in der Führungsebene benannt werden müssen.

Sivasubramanian hat dies im Interview mit Fast Company auf eine Weise anerkannt, die Aufmerksamkeit verdient: „Menschen genehmigen weniger individuelle Aktionen, bleiben aber verantwortlich für Entscheidungen auf Systemebene, die die Ergebnisse bestimmen. Die Verantwortlichkeit nimmt nicht ab." Das ist eine ehrliche Beschreibung dessen, was geschieht. Aber es ist auch ein Signal, dass das organisatorische Verantwortungsmodell, das viele Unternehmen heute haben – aufgebaut auf Einzelgenehmigungen und fallweiser Überprüfung –, nicht darauf ausgelegt ist, in diesem neuen Schema zu funktionieren.

Die Frage, die AWS nicht für seine Kunden beantworten kann, ist: Wie viele Organisationen haben die interne Reife, um zu unterscheiden, welche Art von Entscheidungen sie an einen Agenten delegieren können, welche weiterhin menschlich bleiben müssen, und wie sie die Grenze zwischen beiden gestalten sollen. Diese Grenze wird nicht durch die Technologie definiert. Sie wird durch die Führung definiert.

---

Was Gartner über die 40 % sagt und warum es wichtiger ist, als es scheint

Gartner prognostiziert, dass mehr als 40 % der KI-Agentenprojekte vor Ende 2027 abgebrochen werden. Die genannten Gründe sind drei: steigende Kosten, unklarer Geschäftswert und unzureichende Risikokontrollen. Diese Prognose ist kein Alarmismus. Es ist die statistische Beschreibung eines Musters, das bereits vor den Agenten existierte: Die technologische Unternehmensadoption scheitert häufiger an Governance-Problemen und unklarer Wertdefinition als an technischen Einschränkungen.

Was die Zahl in diesem Kontext relevant macht, ist, dass AWS durch den Aufbau einer so dichten Infrastruktur aus Kontrollen und Überwachung implizit anerkennt, dass Agenten ohne diese Infrastruktur eine für den Unternehmenseinsatz inakzeptable Fehlerquote aufweisen. Die Entscheidung, AgentCore mit eingebetteten Governance-Richtlinien zu starten, AWS Continuum im „Lernmodus" zu beginnen, Rollback-Mechanismen im DevOps Agent zu schaffen, ist kein Sicherheitsmarketing. Es ist defensive Architektur gegenüber einem realen Problem.

Das Problem, das dies für den Unternehmenskunden schafft, hat eine Natur, die nur wenige Organisationen benennen: Wenn der Wert von Agenten von der Qualität der sie steuernden Richtlinien abhängt, und diese Richtlinien davon abhängen, dass die Organisation genau weiß, was sie automatisieren will, wer dafür die Autorität hat und was einen inakzeptablen Fehler darstellt, dann ist die eigentliche Arbeit nicht technisch. Sie ist organisatorisch. Und diese Arbeit ist in keiner Softwarelizenz enthalten.

Miller warnt, dass Unternehmen, die die Automatisierung repetitiver Aufgaben mit echter Autonomie verwechseln – also mit Systemen, die zielorientierte Entscheidungen in sich verändernden Kontexten treffen –, am stärksten exponiert sind. Nicht weil die Technologie sie täuscht, sondern weil sie es sich selbst erlauben, die Fragen nicht zu stellen, die interne Reibung erzeugen würden, bevor sie sich zur Einführung verpflichten.

AWS trägt dieselbe Logik in das Produktdesign, wenn es erklärt, dass „Intelligenz nicht mehr der Flaschenhals ist, sondern der Kontext." Dieser Satz hat eine konkrete organisatorische Bedeutung: Agenten sind nur so gut wie die Qualität, Kohärenz und Zugänglichkeit der Daten, auf denen sie operieren. Und die meisten großen Unternehmen haben fragmentierte Daten, inkonsistente Historien und Systeme, die nicht miteinander kommunizieren. Das vor dem Einsatz von Agenten zu lösen ist keine technische Voraussetzung, die das IT-Team allein bewältigen kann. Es ist eine Entscheidung über Investitionsprioritäten, die die Führungsebene treffen und aufrechterhalten muss.

---

Die Plattformwette, die AWS nicht explizit benennt

Es gibt eine Dimension dieser Ankündigung, die eine gesonderte Analyse verdient, weil sie die Entscheidungsökonomie jedes Unternehmens beeinflusst, das die Einführung dieser Dienste in Betracht zieht.

AWS verkauft nicht nur Agenten. Es baut eine Architektur auf, in der Agenten von eigenen Komponenten abhängen: AWS Context für das Unternehmenswissen, Amazon S3 Annotations für strukturierte Daten, AgentCore für die Orchestrierung, Bedrock Guardrails für die Kontrolle von Ein- und Ausgaben. Jede Wertschicht, die eine Organisation innerhalb dieses Systems schafft – jede definierte Richtlinie, jeder kodierte Workflow, jeder auf eigenen, in dieser Infrastruktur gespeicherten Daten trainierte Agent –, vertieft die Ausstiegskosten.

Mit Einnahmen, die 104,9 Milliarden Dollar im Jahr 2024 überstiegen, hat AWS die nötige Größe, um diese Architektur so lange aufrechtzuerhalten, bis der Unternehmensmarkt für den Einsatz autonomer Agenten reif ist. Die Wette lautet nicht, dass die Agenten heute perfekt sind. Sie lautet, dass Organisationen, die ihre Abläufe auf dieser Infrastruktur aufbauen, einen hinreichend hohen Migrationsaufwand haben werden, sodass die Beziehung strukturell und nicht transaktional wird.

Das ist keine Kritik. Es ist eine Beschreibung, wie Plattformen im Bereich kritischer Infrastruktur konkurrieren. Microsoft tut etwas Analoges mit Copilot Studio und Azure AI Studio. Google Cloud hat seine eigene Version mit Vertex AI Agent Builder. Alle bieten dasselbe zentrale Argument: Die vertikale Integration zwischen Modellen, Daten, Orchestrierung und Governance ist der eigentliche Vorteil, nicht das Modell selbst.

Für den Führungskräfte, der bewertet, wo er sich binden will, lautet die Frage nicht, ob Agenten in einem Pilotprojekt funktionieren. Es ist, ob die Organisation die Prozessreife, die Datenklarheit und die Verantwortungskultur hat, die nötig sind, um in der von jedem Anbieter vorgeschlagenen Plattformarchitektur zu operieren. Diese Bewertung kann nicht an das Technologieteam delegiert werden. Sie erfordert, dass die Führungsperson versteht, was sie unterschreibt.

---

Autonomie mit Tutoren ist nicht das Ziel, sondern der Ausgangspunkt

Sivasubramanian verglich den aktuellen Widerstand gegen Agenten mit den Zweifeln, die in den ersten Jahren gegenüber der Cloud bestanden. Das Argument: Die Kontrollen reifen, und das Vertrauen wächst. Es ist eine vernünftige Analogie. Aber sie lässt etwas über die Natur des Delegierten aus.

Als ein Unternehmen in die Cloud migrierte, delegierte es Recheninfrastruktur. Die Fehler waren kostspielig, aber im Allgemeinen behebbar: ein ausgefallener Server, eine langsame Datenbank, ein nicht erreichbarer Dienst. Wenn ein Unternehmen einen autonomen Agenten in einem Entscheidungsprozess einsetzt, ändert sich die Fehlerkategorie. Ein Agent, der eine regulatorische Einreichung falsch interpretiert und um 6 Uhr morgens eine fehlerhafte Analyse liefert, auf deren Grundlage jemand Entscheidungen trifft, bevor irgendjemand sie überprüft hat, verursacht eine andere Art von Schaden. Die Reversibilität ist nicht durch die Geschwindigkeit des technischen Rollbacks garantiert.

Das von AWS vorgeschlagene Governance-Modell, bei dem Menschen Entscheidungen auf Systemebene genehmigen, während Agenten auf Aufgabenebene ausführen, ist konzeptionell kohärent. Aber es funktioniert nur, wenn die Unterscheidung zwischen „Systemebene" und „Aufgabenebene" innerhalb jeder Organisation präzise definiert ist, und wenn diejenigen, die an der Spitze agieren, tief genug verstehen, was sie steuern.

Das Autonomieversprechen, das AWS zum Summit mitbrachte, ist in seinem Anspruch aufrichtig. Die Grenzen, die es neben diesem Versprechen installierte, sind ebenfalls in ihrer Nützlichkeit aufrichtig. Was weder das eine noch das andere ersetzen kann, ist die Führungsarbeit, die stattfinden muss, bevor irgendeinen Agenten einen wichtigen Prozess berührt. Diese Arbeit ist nicht glamourös. Sie hat keine Keynote-Folien. Aber sie ist die Bedingung, auf der alles andere ruht.

Die Organisationen, die aus diesem Zyklus am besten positioniert hervorgehen, werden nicht diejenigen sein, die Agenten am schnellsten eingeführt haben. Es werden diejenigen sein, die vor dem Einsatz ehrlich benennen konnten, was sie noch nicht gelöst hatten.