Die Geschwindigkeit, die kein menschliches Team aufrechterhalten kann
Andrej Karpathy, Mitbegründer von OpenAI und ehemaliger KI-Direktor bei Tesla, veröffentlichte im März 2026 ein Open-Source-Repository namens autoresearch. Der Mechanismus ist täuschend einfach: Ein KI-Agent erhält ein Ziel in natürlicher Sprache, schlägt Änderungen an einer Trainingsdatei vor, führt in fünf Minuten Abständen auf einer NVIDIA H100 GPU Zyklen durch, misst die Ergebnisse gegen eine feste Metrik und wiederholt den Prozess ohne menschliches Eingreifen, bis jemand ihn stoppt. Innerhalb von zwei Tagen hat das System 700 Experimente abgeschlossen. In acht Stunden waren es 100. Das Repository sammelte innerhalb weniger Tage 8.000 Sterne auf GitHub.
Bevor man über Technologie spricht, muss man über operative Wirtschaft sprechen. Ein mittelständisches Softwareunternehmen, das ein eigenes Sprachmodell optimieren möchte, beauftragt ein Team von zwei oder drei Datenwissenschaftlern mit dieser Aufgabe. Dieses Team kann, wenn alles gut läuft, zehn bis fünfzehn Variationen pro Woche umsetzen, wenn es die Rechenzeiten, Dokumentationen und Überprüfungstreffen gut verwaltet. Autoresearch führt hundert Variationen aus, während dieses Team schläft. Es ist keine inkrementelle Steigerung der Produktivität: Es ist eine Änderung um Größenordnungen in der Iterationsgeschwindigkeit, und Größenordnungen werden selten von bestehenden Geschäftsmodellen absorbiert.
Was Karpathy gebaut hat, ist kein kommerzielles Produkt oder eine Unternehmensplattform. Es ist eine Demonstration aus 630 Zeilen Code, die ein Prinzip testet: Autonome, eingrenzbare und messbare Experimentationszyklen skalieren auf eine Weise, die der sequenzielle menschliche Arbeitsprozess nicht erreichen kann. Das ist der Grund, warum diese Nachrichten für ein KMU relevant sind, auch wenn es noch niemals ein Sprachmodell trainiert hat.
Das Muster, das zählt, ist nicht in den KI-Modellen
Der teuerste Fehler, den ein Manager eines mittelständischen Unternehmens machen kann, wenn er diese Geschichte liest, ist zu schlussfolgern, dass es sich um einen Fortschritt für Forschungslabore oder Unternehmen mit achtstelligen Rechenbudgets handelt. Die Logik des autonomen Zyklus von Karpathy, der einen Wechsel vorschlägt, diesen umsetzt, das Ergebnis gegen eine objektive Metrik misst und den Fortschritt in einem Versionsrepository festhält, ist nahezu unverändert auf Dutzende von Prozessen übertragbar, die heute qualifizierte Fachkräfte in Unternehmen jeder Größe Zeit kosten.
Denken Sie an eine Performance-Marketing-Agentur, die heute drei Tage in der Woche damit verbringt, Varianten von Anzeigen zu erstellen, diese in Pilotkampagnen zu testen, die Daten in einem Dashboard zu konsolidieren und zu entscheiden, was skaliert werden soll. Oder an ein Finanzdienstleistungsunternehmen, das manuell Hunderte von Dokumenten auf Anomalien überprüft, bevor es einen wöchentlichen Bericht an den Kunden übermittelt. Oder an ein E-Commerce-Unternehmen, das Preise und Produktpositionierungen anpasst, basierend auf Regeln, die ein Junior-Analyst mit einer Tabelle anwendet. In all diesen Fällen ist die Struktur der Arbeit identisch mit der von autoresearch: Es gibt eine objektive Metrik, es gibt Variablen, die systematisch verändert werden können, und es gibt einen Feedback-Zyklus, der heute von einem Menschen geschlossen werden muss.
Der Wettbewerbsvorteil wird nicht darin liegen, Zugang zur Technologie zu haben, sondern darin, als Erster zu identifizieren, welcher eigene Prozess eine ausreichend klare Metrik hat, um den Zyklus zu automatisieren. Unternehmen, die heute nicht innerhalb von dreißig Sekunden benennen können, welcher ihrer Prozesse am repetitivsten ist und ein messbares Ergebnis liefert, arbeiten mit einer Intransparenz, die der Markt ihnen nicht länger verzeihen wird, wenn ihr Mitbewerber dies kann.
Die Analyse von LeapLytics, die in den Berichten über das Projekt zitiert wird, weist direkt darauf hin: Die Business-Intelligence-Teams verschwenden einen unverhältnismäßig hohen Anteil ihrer Kapazität mit Aufgaben, die klare Metriken haben, die aber niemand als automatisierbaren Zyklus formalisiert hat. Berichterstattung, Anomaliedetektion, Leads-Bewertung. Prozesse, bei denen der Mensch nicht in jeder Iteration redaktionellen Input gibt, sondern einfach ein Protokoll ausführt, das bereits in seinen Entscheidungen impliziert ist.
Was zuerst eliminiert wird, verändert alles andere
Es gibt eine strukturelle Falle in der Art und Weise, wie die meisten mittelständischen Unternehmen planen, diese Werkzeuge zu übernehmen: Sie betrachten sie als eine zusätzliche Schicht über ihrem bestehenden Betrieb. Sie stellen jemanden ein, um die KI zu erkunden, fordern einen Pilotversuch an, fügen ein Budget für Werkzeuge hinzu und setzen den manuellen Prozess parallel als Sicherheitsnetz fort. Das Ergebnis ist, dass sie die Kosten während der Übergangszeit verdoppeln und die ursprüngliche Reibung nie beseitigen.
Die Logik von autoresearch deutet auf das Gegenteil hin. Das Projekt funktioniert, weil es auf absichtlichen Einschränkungen basiert: eine einzige editierbare Datei, genau fünf Minuten Trainingszeiten, eine einzige Bewertungsmetrik. Karpathy versuchte nicht, die Komplexität eines kompletten Forschungslabors zu reproduzieren. Er beseitigte alles, was nicht notwendig war, damit der Zyklus funktionierte, und diese Eliminierung macht die Geschwindigkeit möglich.
Für ein KMU lautet die operative Frage nicht, wie viel KI hinzugefügt werden kann, sondern welche Variablen des aktuellen Prozesses fixiert werden können, welche Variablen für die Iteration offen bleiben und welche die einzige Metrik ist, gegen die der Fortschritt gemessen wird. Diese Architektur von Einschränkungen wandelt einen chaotischen Prozess in einen skalierbaren Zyklus um. Und diese Architektur erfordert kein Forschungsbudget: Sie erfordert analytische Disziplin, um den Prozess zu diagnostizieren, bevor er automatisiert wird.
Die Gemeinschaft, die sich um das Repository von Karpathy gebildet hat, begann sofort, Varianten mit mehreren Agenten zu erkunden: einer, der Hypothesen generiert, ein anderer, der die Experimente durchführt, ein dritter, der die Ergebnisse synthetisiert. Dieses Muster modularer Spezialisierung ist genau das, was mittelständische Unternehmen beobachten sollten, denn es repliziert die Struktur eines effizienten Menschenteams, jedoch ohne die Koordinationsengpässe, die echte menschliche Teams verteuern und verlangsamen.
Die Führungsstärke, die eigene Nachfrage aufbaut, nicht die, die Bruchstücke optimiert
Die dominante Erzählung rund um Werkzeuge wie autoresearch neigt dazu, sich in Effizienzbegriffen zu fassen: dasselbe schneller und günstiger zu tun. Diese Lesart ist korrekt, aber unzureichend, und führt dazu, dass Führungskräfte diese Werkzeuge implementieren, um Kosten zu senken, ohne das Wertversprechen, das sie dem Markt anbieten, zu verändern.
Die tiefere Gelegenheit ist eine andere. Ein KMU, das hundert Variationen seines Wertversprechens in der Zeit umsetzen kann, in der sein Mitbewerber zwei testet, operiert nicht nur effizienter: Es arbeitet mit einer Lernrate, die es ihm ermöglicht, Kombinationen zu finden, die im Markt noch nicht erkundet wurden. Die Iterationsgeschwindigkeit, wenn sie an eine Metrik gekoppelt ist, die den tatsächlichen Wert für den Kunden misst, wird zum Mechanismus, um eine Nachfrage zu entdecken, die noch nicht bedient wird.
Das geschieht nicht automatisch. Es geschieht, wenn der Manager erkennt, dass das Werkzeug nichts wert ist, ohne eine gut durchdachte Anfangshypothese darüber, welche Prozessvariable den größten Einfluss auf das Kundenerlebnis hat. Karpathy liefert den Motor; die Unternehmensstrategie entscheidet über das Ziel. Die Führungskräfte, die weiterhin Budget für AI-Piloten ohne Ergebnisse verbrennen, sind diejenigen, die diese Werkzeuge suchen, um Abkürzungen zu finden, um in demselben Bereich zu konkurrieren, wo sie bereits verlieren. Die Führungsstärke, die dauerhafte Positionen aufbaut, ist die, die die Geschwindigkeit der Experimentation nutzt, um den Raum zu identifizieren und zu besetzen, den der Markt noch nicht weiß, dass er benötigt.









