Vor etwas mehr als einem Jahr lieferte der bekannte Apple-Kommentator John Gruber ein vernichtendes Urteil über die KI-Strategie des iPhone-Herstellers. Apple habe für die neue Siri nichts weiter gezeigt als Konzeptvideos – Features, die nicht einmal unter streng kontrollierten Laborbedingungen funktionierten. Ein schwerer Vorwurf für ein Unternehmen, das sonst für ausgereifte Produkte steht.
Auf der diesjährigen Google I/O zeigte der Suchgigant, wie man es besser macht: Statt vorab produzierter Videos präsentierte Google Live-Demos seines neuen agenteischen KI-Systems Gemini Spark auf der Bühne. Ein massiver Unterschied, denn der Weg von einer inszenierten Demo zur echten Nutzung im Alltag ist traditionell weit. Doch kann Spark halten, was Google verspricht?
Der Realitätscheck: „Scarily good“
Jay Peters von The Verge hat genau das getestet und Gemini Spark mit realen Aufgaben aus seinem eigenen Leben konfrontiert. Ein besonders aussagekräftiges Beispiel: Er bat die KI, eine E-Mail an seine Frau zu verfassen, die die durchschnittlichen monatlichen Lebensmittelausgaben für das Jahr 2026 zusammenfasst.
Diese vermeintlich einfache Anfrage verlangt der KI enorm viel ab:
- Sie muss wissen, wer die Ehefrau des Nutzers ist (ohne dass ihr Name genannt wurde).
- Sie muss das richtige Budget-Dokument in Google Drive finden (obwohl die Datei nicht „Budget“ im Namen trägt).
- Sie muss die Daten extrahieren, den Durchschnitt berechnen und eine E-Mail in Gmail entwerfen.
Das Ergebnis? Peters war schlichtweg verblüfft. Spark fand die E-Mail-Adresse der Ehefrau, lokalisierte die Tabelle, zog die korrekten Summen – inklusive der unvollständigen Daten für den noch laufenden Mai – und verfasste einen Entwurf in Gmail. Noch beeindruckender: Die KI adressierte die Frau bei ihrem Vornamen, obwohl dieser nicht in der E-Mail-Adresse stand, und verwendete sogar die persönliche Grußformel, die das Paar untereinander nutzt. Peters beschrieb das Erlebnis als „scarily good“ und war „floored by the results, though they were imperfect“. Die KI machte also Fehler, aber die Gesamtleistung war überwältigend.
Was bedeutet das für Apple Intelligence?
Warum ist dieser Test für die Apple-Welt so relevant? Ganz einfach: Genau diese Art von tief integrierten, kontextbezogenen Aktionen hat Apple in seinen umstrittenen Konzeptvideos für die neue Siri gezeigt. Die neue Siri, die sich aktuell viel Zeit lässt, bis sie endlich in vollem Umfang verfügbar ist, soll genau das können: Quer über Apps hinweg agieren, persönlichen Kontext verstehen und Aufgaben selbstständig erledigen.
Dass Google diese Funktionen nun in der Praxis (weitgehend) nachweisen kann, ist ein wichtiges Signal. Es beweist, dass Apples Vision keine Science-Fiction ist, sondern technisch machbar. Noch spannender wird es durch den Umstand, dass Apple genau diese Modelle von Google nutzen wird, um die neuen Siri-Funktionen anzutreiben. Wenn Google die agenteische KI im Griff hat, ist die Wahrscheinlichkeit hoch, dass Apple diese Fähigkeiten über die Partnerschaft ebenfalls zuverlässig liefern kann – auch wenn die Versprechen dann ironischerweise von Googles Infrastruktur erfüllt werden.
Eigenständige Einordnung: Das Paradox der Abhängigkeit
Aus journalistischer Sicht ergibt sich hier ein faszinierendes Paradox. Apple hat jahrelang die Souveränität seiner Hardware und Software betont. Datenschutz und On-Device-Processing waren die heiligen Grails der Unternehmensphilosophie. Doch bei der agenteischen KI zeigt sich: Ohne die Cloud-Infrastruktur und die Modelle von Google (und OpenAI) wäre Apple Intelligence in weiten Teilen auf der Stelle tretend.
Der Erfolg von Gemini Spark zeigt gleichzeitig die größte Herausforderung für Apple auf: Privacy vs. Convenience. Damit eine KI so „scarily good“ arbeiten kann wie bei Jay Peters, muss sie tiefen Zugriff auf das digitale Leben haben – Drive, Gmail, Kontakte, Gewohnheiten. Google hat dieses Geschäftsmodell (Daten gegen Dienste) perfektioniert. Apple hingegen muss seinen Nutzern versprechen, dass dieser tiefe Zugriff durch Privacy-Technologien wie Private Cloud Compute sicher ist. Ob die Nutzer diesem Kompromiss im gleichen Maße vertrauen wie bei Google, bleibt abzuwarten.
Zudem zeigt der Test, dass „Agentic AI“ – also KI, die nicht nur plaudert, sondern handelt – den Höhepunkt der aktuellen KI-Hype-Zyklen darstellt. Die Fehlerquote ist noch nicht bei null, wie Peters anmerkt. Aber der Sprung von Konzept zu brauchbaren Alltagsergebnissen ist vollzogen. Für Apple bedeutet das: Der Druck wächst. Wenn Google diese Features breit ausrollt, wird der Vergleich mit der aktuellen, oft noch frustrierend dummen Siri gnadenlos ausfallen. Apples Zeit läuft ab, bis die eigenen Versprechen von der Bühne auch auf den Geräten der Nutzer ankommen – ob nun mit oder ohne Googles Hilfe.
Quelle: 9to5Mac