Siri wird von Grund auf neu gestaltet und Apple zeigt seine größte Schwäche
Apple baut Siri von Grund auf neu auf. Es handelt sich nicht um ein einfaches Update der Benutzeroberfläche oder eine neue Stimme: Laut mehreren aktuellen Berichten arbeitet das Unternehmen an einer völlig neuen Architektur, die es dem Assistenten ermöglicht, mehrere Befehle gleichzeitig zu verarbeiten und direkt auf dem Gerät mit Sprachmodellen zu arbeiten, ohne auf externe Server angewiesen zu sein. Der Druck ist spürbar: Die WWDC 2026 wird als die Bühne erwartet, auf der Apple konkrete Ergebnisse präsentieren muss, nachdem jahrelang eine KI versprochen wurde, die in der Praxis hinter den Markterwartungen zurückblieb.
Doch was mich interessiert, ist nicht der Zeitplan für die Produkteinführungen. Was mich interessiert, ist die architektonische Frage, die dieses Kapitel aufwirft: Wie kommt es, dass ein Unternehmen mit den Ressourcen von Apple zu spät in ein Rennen einsteigt, das es selbst hätte anführen können, und welche Art von organisatorischer Fragilität erklärt diesen Rückstand?
Wenn das Flaggschiffprodukt zum Beweis eines internen Problems wird
Siri existiert seit 2011. Es hat mehr als ein Jahrzehnt an Nutzerdaten, eine proprietäre Infrastruktur und eine installierte Basis, die kein Mitbewerber über Nacht replizieren kann. Und dennoch wird es heute von Grund auf neu gestaltet, während jüngere Wettbewerber mit weniger Ressourcen den Assistenten in seiner Gesprächsfähigkeit, im Umgang mit Kontexten und in der praktischen Nützlichkeit übertreffen.
Das ist kein technologisches Pech. Es ist das vorhersehbare Ergebnis eines Musters, das ich häufig bei leistungsstarken Unternehmen diagnostiziere: Die Homogenität in den Designteams produziert Produkte, die für die Designer gut funktionieren, aber bei einer vielfältigeren Marktgröße versagen.
Berichte deuten darauf hin, dass Apple eine Funktion testet, die es ermöglicht, mehrere Anweisungen in einer einzigen Interaktion zu verknüpfen. Für diejenigen von uns, die die Entwicklung von Sprachassistenten schon seit einiger Zeit verfolgen, ist diese Funktion keine Neuigkeit: sie ist eine grundlegende Notwendigkeit, die Nutzer mit unterschiedlichen Nutzungsmustern bereits vor Jahren identifiziert haben. Dass Apple sie erst jetzt testet, deutet darauf hin, dass das Unternehmen es versäumt hat, Signale von der Peripherie seiner Nutzerbasis zu hören, nicht aus dem Zentrum.
Hier ist der eigentliche Mechanismus: Wenn das Team, das ein Werkzeug entwirft, denselben Nutzungshorizont, dieselben Akzente, dieselben alltäglichen Bedürfnisse und dasselbe Level an technologischem Verständnis teilt, entsteht ein optimales Produkt für dieses spezifische Profil. Das Problem zeigt sich, wenn dieses Produkt auf den Markt kommt und auf Nutzer trifft, die mit unterschiedlichen Akzenten sprechen, die Sprachen mischen, mehr Accessibility benötigen und in Kontexten leben, in denen die Konnektivität instabil ist. Siri hat historisch gesehen in all diesen Fällen schlechter abgeschnitten.
Die Architektur auf dem Gerät als Zeichen eines verspäteten strategischen Wandels
Der Fokus auf Modelle der Sprache, die direkt auf dem Gerät laufen, ist technisch anspruchsvoll und strategisch sinnvoll: Sie schützt die Privatsphäre des Nutzers, reduziert die Latenz und macht den Assistenten im Offline-Modus funktional. Es ist ein differenzierter Wertvorschlag im Vergleich zu Mitbewerbern, die auf Cloud-Dienste angewiesen sind.
Das Problem ist der Zeitpunkt. Apple erreicht diese Position, nachdem der Markt bereits seine Erwartungen mit anderen Produkten gesetzt hat. Der Vergleich hat bereits stattgefunden. Der Nutzer weiß bereits, was er von einem modernen Sprachassistenten verlangen kann, und Siri hat nicht den ersten Schritt in dieses Gespräch gemacht.
Aus der Perspektive der Netzwerkarchitektur, die ich in meinen Audits anwende, war das Versagen nicht die Ingenieursfähigkeit von Apple, die unbestritten ist. Es ging vielmehr um die verteilte Intelligenz innerhalb der Organisation: die Fähigkeit, schwache Signale von der Peripherie des Systems zu erfassen, wo Nutzer mit unkonventionellen Nutzungsmustern leben, und diese in Designentscheidungen umzuwandeln, bevor sie zu dringenden PR-Anliegen werden.
Organisationen mit zu stark zentralisierten Strukturen haben ein verborgenes Kostenproblem: Sie filtern die Informationen, bevor sie nach oben gelangen. Daten, die gegen die dominante interne Erzählung sprechen, werden tendenziell entschärft, nicht priorisiert oder schlichtweg ignoriert. Das Ergebnis ist, dass der Vorstand Entscheidungen auf der Grundlage von Informationen trifft, die bereits durch Schichten verarbeitet wurden, die die gleichen Annahmen teilen.
Das ist kein Talentproblem. Es ist ein Problem der sozialen Architektur.
Was die WWDC 2026 wirklich auf die Probe stellt
Der Markt wird die WWDC 2026 als ein Produkt-Event lesen. Ich werde es als einen Test der organisatorischen Fähigkeit lesen. Wenn Apple zu dieser Veranstaltung mit einer Version von Siri kommt, die wirklich Interaktionsmodi für Nutzer mit unterschiedlichen sprachlichen Mustern integriert, mit robustem Support für mehrere Sprachen in gemischten Kontexten, und mit Zugänglichkeitsfunktionen, die nicht nebensächlich sind, sondern Teil des Designkerns, dann wird es einen Beweis dafür geben, dass sich etwas am Design-Tisch geändert hat – nicht nur im Code.
Wenn es hingegen mit einem Assistenten kommt, der flüssiger für das Nutzerprofil ist, das bereits seine Stärke war, hat es das Produkt verbessert, ohne die strukturelle Fragilität zu lösen, die es zuerst angreifbar machte.
Der Umbau von Siri ist teuer. Die Schätzungen der Branche belaufen die Kosten für den Umbau einer KI-Architektur dieser Größenordnung auf Hunderte Millionen Dollar, ohne die Opportunitätskosten der Jahre, in denen der Assistent nicht das Potenzial seiner installierten Basis erfasst hat. Das ist der wahre Preis, den man für das Betreiben mit systemischen blinden Flecken zahlt: Er wird nicht im Quartal gezahlt, in dem der Fehler gemacht wird, sondern im darauffolgenden Erholungszyklus, wenn die Wettbewerber bereits Loyalität aufgebaut haben und die Kosten für den Verlust dieser Loyalität exponentiell höher sind.
Unternehmen, die mit Teams designen, die die Diversität ihrer Märkte widerspiegeln, tun dies nicht aus philanthropischen Gründen. Sie tun dies, weil sie Reibungen früher erkennen, weil ihre Produkte in der Produktion weniger fehleranfällig sind, weil ihre Korrekturzyklen kürzer sind. Das schlägt sich in Gewinnmargen, Retention und Iterationsgeschwindigkeit nieder. Apple zeigt mit seiner gesamten finanziellen Kapazität, dass diese drei Vermögenswerte nicht automatisch sind: Sie werden mit bewussten Entscheidungen darüber, wer im Raum sitzt, während das Problem definiert wird, was es wert ist, gelöst zu werden.
Der Rückstand von Siri ist kein Ingenieurproblem
Das nächste Mal, wenn der Vorstand von Apple den Fortschritt dieser Rekonstruktion überprüft, wird die wichtigste Diskussion nicht darüber sein, welche Funktionen in die nächste Version aufgenommen werden sollen. Es wird darum gehen, warum sie so lange gebraucht haben, um zu sehen, was der Markt ihnen bereits gezeigt hat, und ob die Zusammensetzung der Teams, die heute Produktentscheidungen treffen, ausreichend unterschiedlich ist von der, die das Problem geschaffen hat.
Die Führungskräfte, die zu dieser Sitzung kommen und feststellen, dass alle im Raum dasselbe Profil, die gleiche Nutzungskontext und die gleichen Annahmen darüber teilen, wie ein Nutzer mit Sprachtechnologie interagiert, sehen genau den Mechanismus, der die Kosten verursacht hat, die nun behoben werden müssen. Die Fragilität liegt nicht im Code von Siri. Sie liegt in der Homogenität derjenigen, die zu lange entschieden haben, dass der Code in Ordnung sei.










