Als die KI aufhörte, der Star zu sein, und zur Infrastruktur wurde
Es gibt einen genauen Moment, in dem eine Technologie aufhört, eine Neuheit zu sein, und beginnt, ein Werkzeug zu werden. Für generative künstliche Intelligenz im Bereich Inhalte geschieht dieser Moment gerade jetzt, und das klarste Signal kam nicht aus einem Labor im Silicon Valley, sondern von drei Kreativen auf einer Bühne in San Francisco.
Auf der Upscale Conference SF 2026, organisiert von der Plattform Magnific, sagten ein Fernsehregisseur, ein EDM-Musiker und eine Designerin von Animationsfiguren im Wesentlichen dasselbe aus völlig unterschiedlichen Blickwinkeln: Die erste Welle der generativen KI ist bereits vorbei. Diese Welle – die Welle des „Gib einen Prompt ein und erhalte Inhalte" – war nützlich, um Fähigkeiten zu demonstrieren, aber mittelmäßig darin, dauerhaften Wert zu erzeugen. Was danach kommt, ist komplexer, anspruchsvoller und für diejenigen, die wirklich verstehen, wie Technologieadoption in kreativen Märkten funktioniert, weitaus interessanter.
Goldman Sachs prognostiziert, dass die globale Creator-Economy sich 480 Milliarden US-Dollar im Jahr 2027 annähern wird, ausgehend von rund 250 Milliarden, als diese Schätzung 2023 veröffentlicht wurde. Ein Wachstum von 90 % in vier Jahren lässt sich nicht allein damit erklären, dass Influencer Follower anhäufen. Es erklärt sich dadurch, dass sich die Struktur der Inhaltsproduktion auf eine Weise verändert, die die meisten Organisationen noch immer nicht vollständig erkennen.
Das Problem mit der Magie des Prompts
In den vergangenen zwei Jahren drehte sich das vorherrschende Narrativ über KI und Kreativität um das, was aus der Box kommt: in Sekunden generierte Bilder, Videos aus Text, synthetische Musik. Es war ein Narrativ, das sich auf den Output konzentrierte, auf die rohe Produktionskapazität. Das Problem ist, dass dieses Narrativ Generierungsgeschwindigkeit mit Wert verwechselt.
Noah Wagner, Regisseur und ausführender Produzent mit Credits in Produktionen wie Westworld und Game of Thrones, der derzeit die KI-Innovation bei Echobend leitet, formulierte es auf der Konferenz mit klinischer Präzision: „Du und deine Kollaboratoren können ein Studio sein". Er sagte nicht, dass die KI ein Studio sein kann. Er sagte, dass der menschliche Kreative, ausgestattet mit KI, in der Lage ist, mit der Reichweite und Vielseitigkeit zu arbeiten, die früher ganze Teams erforderten.
Die Unterscheidung ist wichtig, weil sie die zentrale Variable verschiebt. Wenn die KI der Hauptakteur wäre, käme es darauf an, welches Modell man verwendet, wie viele Parameter es hat, welches Unternehmen es herstellt. Wenn aber der Kreative weiterhin der Hauptakteur bleibt, kommt es auf seine Regiefähigkeit an, auf sein ästhetisches Urteil, auf seine Fähigkeit zu entscheiden, was zu behalten und was zu verwerfen ist. Wagner veranschaulichte das mit einem Projekt, in dem ein Hund namens Lord Queso nicht das tat, was das Drehbuch verlangte. Das Team nutzte KI, um die fehlende Aufnahme zu generieren und sie in den Schnitt einzufügen. Seine Beschreibung dieser Arbeitslogik war die ehrlichste, die ich je über die Funktionsweise von KI in der professionellen Produktion gehört habe: „Die reale Action in der Mitte, die KI an den Rändern". Darin steckt keine Ideologie. Darin steckt Produktionspragmatismus.
Das definiert genau das, was der ernsthafte kreative Markt von generativer KI erwartet: keinen autonomen Inhaltsgenerator, sondern eine Infrastrukturschicht, die spezifische Probleme innerhalb eines von Menschen gelenkten Arbeitsablaufs löst. Der Fehler vieler Unternehmen, die 2023 und 2024 „KI einführten", bestand darin, sie als Ersatz für kreatives Urteilsvermögen zu behandeln, obwohl sie in den Fällen, in denen sie wirklich Wert generiert, als Verstärker dieses Urteilsvermögens funktioniert.
Die Konferenz prägte sogar einen Begriff für das entgegengesetzte Extrem: „AI Slop" – schnell, mühelos und ohne Absicht generierte Inhalte. Die These der Veranstaltung war, dass das, was Slop von ernsthafter kreativer Arbeit mit KI trennt, genau das ist: Intentionalität und Aufwand. Das ist kein moralisches Argument; es ist ein Marktargument. Zielgruppen und Marken entwickeln schnell Antikörper gegen generische Inhalte. Die Fähigkeit, fehlende Kriterien zu erkennen, skaliert genauso schnell wie die Fähigkeit, Inhalte ohne sie zu produzieren.
Der Remix als Geschäftsmodell und was das enthüllt
Curt Cameruci, bekannt als Flosstradamus, kam zur Konferenz mit einem Argument, das oberflächlich betrachtet wie die Romantik eines Musikers klingt, aber tatsächlich eine ziemlich präzise Marktmechanik beschreibt. Er begann damit, eine Sampler-Maschine zu zeigen, die er mit 15 Jahren bekommen hatte. Dieses Bild war kein Zufall.
Seine These: Alle Kreativen sind Remixer. Sie nehmen bestehende kulturelle Elemente, kombinieren sie auf neue Weise und erzeugen etwas, das vorher nicht existierte. Die Roland 808, die 909 und die 303 wurden nicht dafür entwickelt, Hip-Hop, House oder Acid House zu erschaffen. Sie wurden für etwas anderes entwickelt. Die Musiker benutzten sie falsch, zwangen sie über ihren ursprünglichen Zweck hinaus, und aus diesem Missbrauch entstanden ganze Genres mit eigenen Volkswirtschaften in Milliardenhöhe.
Cameruci zieht eine direkte Linie zwischen diesen Maschinen und den aktuellen generativen Modellen. Generative KI wurde ebenfalls nicht dafür entwickelt, die kulturellen Genres der Zukunft zu erschaffen. Aber die Kreativen, die sie dazu zwingen, sie auf unerwartete Weise mit anderen Werkzeugen kombinieren und sie in Territorien führen, für die sie nicht trainiert wurde, sind diejenigen, die wahrscheinlich die Formate definieren werden, die das nächste Jahrzehnt dominieren.
Er nennt dieses Territorium den „Latenzraum": die Zone zwischen etablierten Kulturformen, in der Hybride entstehen. Sein eigenes Genre, EDM Trap, entstand aus der Fusion von hochenergetischen Synthesizern mit Hip-Hop-Drums. Im KI-Bereich, sagt er, liegt das fruchtbare Terrain zwischen den Knotenpunkten: zwischen dem Visuellen und dem Musikalischen, zwischen dem kulturell Überlieferten und dem Synthetischen, zwischen einem Modell, das auf Daten der sechziger Jahre trainiert wurde, und einem, das auf zeitgenössischer Produktion trainiert wurde.
Die konkrete kommerzielle Anwendung, die er beschrieb, war der Einsatz von Stimmklonierung und mehrsprachigen Sängern, um Songs an Zielgruppen in anderen Sprachen anzupassen, mit menschlicher Überwachung in jedem Schritt des Prozesses. Das ist keine Anekdote eines Musikers. Es ist eine operative Beschreibung davon, wie Lokalisierung mit KI zum Marktzugang wird. ElevenLabs hat genau dieses Modell für Kreative, Marken und Studios aufgebaut, die ihre Reichweite auf Zielgruppen in anderen Sprachen ausweiten wollen, ohne die Kosten einer traditionellen Lokalisierung zu tragen. Spotify testet KI-Remixe, damit Fans Songs von Künstlern remixen können, die ihre Erlaubnis gegeben haben, mit dem expliziten Ziel, diese Interaktion in Einnahmen umzuwandeln.
Was das für Organisationen enthüllt, die über Marketing und Inhaltsverteilung nachdenken: Die Hürde, neue Sprachmärkte zu erreichen, ist nicht mehr hauptsächlich eine Budgetfrage. Es ist eine Frage des Urteilsvermögens. Die Technologie zur Lokalisierung ist verfügbar und ihre Kosten sinken. Was nicht im Überfluss vorhanden ist, ist die Fähigkeit, diesen Prozess mit ausreichend Intention zu begleiten, damit das Ergebnis nicht wie eine maschinelle Übersetzung mit menschlichem Gesicht klingt. Marken, die das zuerst verstehen, werden Märkte erschließen, die sie zuvor finanziell nicht rechtfertigen konnten.
Die versteckten Kosten, fünfmal schneller zu produzieren
Momo Wang, Gründerin von Bunny Galaxy und Schöpferin des Charakters Tuzki, brachte die unbequemste Perspektive der drei ein. Und die wertvollste für jeden, der darüber nachdenkt, KI in kreative Arbeitsabläufe zu integrieren, mit Erwartungen an automatische Effizienz.
Wang wuchs in einem Raum von 22 Quadratmetern auf. Sie gab die Ölmalerei auf, weil die Materialien zu teuer waren. Jahre später ermöglichte ihr die KI, zur Malerei zurückzukehren und in die Animationsproduktion im großen Maßstab einzusteigen. Ihr Satz über diesen Prozess hat die Dichte einer Feldbeobachtung: „Wenn Werkzeuge leicht und günstig zugänglich sind, muss niemand seinen Traum aufgeben". Das ist ein Demokratisierungsargument, aber das Interessante ist nicht die Aussage selbst, sondern das, was Wang danach beschrieb: was es in der Praxis bedeutet, mit KI zu produzieren.
Ein traditionelles 3D-Animationsprojekt hätte fünf bis sechs Jahre gedauert. Mit einem KI-gestützten Arbeitsablauf schloss das Team es in etwa einem Jahr ab. Das klingt nach massiver Effizienz. Aber Wang war explizit in Bezug auf das, was sich nicht verändert hat: „Du musst genauso viele kreative Entscheidungen wie zuvor treffen, aber gleichzeitig musst du fünfmal schneller sein".
Das ist keine Erleichterung. Das ist eine Verdichtung der Führungsarbeit. KI eliminiert keine Entscheidungen; sie komprimiert die Zeit, in der sie getroffen werden müssen, und multipliziert die Varianten, über die Urteilsvermögen ausgeübt werden muss. Operativ ausgedrückt: Früher hatte man sechs Jahre, um Probleme der Charakterkonsistenz, der Bewegungslogik und der stilistischen Kohärenz zu lösen. Jetzt hat man ein Jahr. Die KI generiert die Optionen schneller, aber jemand mit gutem Urteilsvermögen muss sie mit derselben Geschwindigkeit bewerten, genehmigen oder verwerfen.
Das System, das Wang beschrieb, um das zu bewältigen, ist kein technologisches. Es ist eines der kreativen Steuerung: Überprüfungssysteme mit farbcodierten Genehmigungen, Bild-für-Bild-Überprüfung der Charakterkonsistenz, Stil-Tests, Storyboards, Schichten menschlicher Überwachung in jeder Phase. KI senkt die Kosten der Versuche. Sie erhöht die Kosten des Urteils pro Versuch. Wang formulierte es anders, als sie beschrieb, was passiert, wenn die KI einen Charakter mit einzigartigen Eigenschaften nicht bewältigen kann: Die Komödien-Animation beginnt wie ein Horrorfilm auszusehen. Das Modell generiert, aber ohne präzise menschliche Führung generiert es in die falsche Richtung.
Die operative Schlussfolgerung für jedes Unternehmen, das darüber nachdenkt, „KI in die Kreativarbeit einzuführen", lautet: Die Rendite kommt nicht durch die Automatisierung der Produktion. Sie kommt davon, Menschen mit ausreichend Urteilsvermögen zu haben, um die automatisierte Produktion zu steuern. Wenn die Organisation dieses Urteilsvermögen nicht intern besitzt, beschleunigt das Hinzufügen von KI-Werkzeugen lediglich die Produktion mittelmäßiger Inhalte.
Wang schloss mit der Beobachtung, die am besten zusammenfasst, warum das Narrativ „KI ersetzt Kreative" weiterhin falsch ist: „Menschen investieren nicht in Technologie. Sie investieren in die Welt, an die sie glauben. Dein Leben, deine Perspektive, deine Geschichte. Das ist etwas, das kein Werkzeug generieren und kein Prompt ersetzen kann". Das ist keine romantische Aussage. Es ist eine Beschreibung dessen, was Zielgruppen konsumieren, wenn sie kreative Inhalte konsumieren. Und was sie konsumieren, ist keine Render-Qualität. Es ist Wiedererkennung, Perspektive, der Beweis, dass jemand mit etwas zu sagen hinter dem steckt, was sie sehen.
Das knappste Gut, wenn alle produzieren können
Lionsgate kündigte 2024 eine Allianz mit Runway an, um ein KI-Modell zu entwickeln, das auf ihrer proprietären Film- und Fernsehbibliothek trainiert wird. Das erklärte Ziel war, Vorproduktion und Nachproduktion zu unterstützen. Das implizite Ziel war etwas Umfassenderes: einen bestehenden Katalog in eine Generierungsinfrastruktur für die Entwicklung von Franchises, Marketing und die schnelle Visualisierung von Projekten zu verwandeln.
Das kehrt die Richtung des kulturellen Austauschs um. Jahrelang schauten unabhängige Kreative nach Hollywood, um Produktionsstandards zu verstehen. Jetzt schauen die Studios auf die Arbeitsabläufe kleiner Teams, die schnell testen, mit geringeren Kosten iterieren und Zielgruppensignale erhalten, bevor sie sich für große Budgets verpflichten.
Das Muster ist nicht neu. Es geschah mit der DSLR-Kamerarevolution, die es unabhängigen Filmemachern ermöglichte, in der Bildqualität mit größer angelegten Produktionen zu konkurrieren. Es geschah mit TikTok, das bewies, dass das native digitale Kurzformat die Aufmerksamkeit gewinnen konnte, die Nachrichtensendungen und traditionelle Sender verloren. Jedes Mal, wenn eine Produktionshürde fällt, ist das knappste Gut nicht mehr die Fähigkeit zu produzieren, sondern die Fähigkeit, etwas zu produzieren, das wichtig ist.
Der Unterschied zu diesem Zyklus ist die Geschwindigkeit, mit der die Hürde fällt, und das Volumen an Inhalten, das während des Falls generiert wird. Wenn es im YouTube-Zyklus mehrere Jahre dauerte, bis der Markt mit mittelmäßigen Inhalten gesättigt war und Filtermechanismen und Unterscheidungsmerkmale entstanden, könnte sich dieser Prozess im Zyklus der generativen KI auf Monate verdichten. Plattformen, Werbetreibende und Zielgruppen werden schneller Unterscheidungskriterien entwickeln, weil der Volumendruck größer ist.
Für Marketingteams hat das eine direkte Implikation: Das Fenster zur Differenzierung durch Qualität des Urteilsvermögens – nicht durch Produktionskapazität – ist kürzer, als es scheint. Organisationen, die heute investieren, um zu verstehen, wie man KI mit präziser Absicht steuert, bauen einen Vorteil auf, der schwer zu replizieren sein wird, wenn alle Wettbewerber Zugang zu denselben Werkzeugen haben. Diejenigen, die KI hauptsächlich nutzen, um schneller zu produzieren, ohne die Qualität ihrer kreativen Entscheidungen zu verbessern, beschleunigen auf dieselbe Wand zu, gegen die inhaltsarme Inhalte immer gestoßen sind: die Gleichgültigkeit des Marktes.
Was die drei Kreativen bei Upscale beschrieben – jeder aus seiner eigenen Ecke – ist ein Phasenwechsel. KI ist vom Gesprächsgegenstand zur Infrastruktur geworden, auf der das Gespräch stattfindet. Und in diesem Übergang ist das, was denjenigen auszeichnet, der Wert schöpft, gegenüber demjenigen, der nur Volumen produziert, genau das, was gute Regisseure immer von schlechten unterschieden hat: zu wissen, was einzuschließen, was zu verwerfen und warum.











