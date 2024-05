Die Google I/O sei wie Taylor Swifts ausverkaufte Eras-Tour, aber mit wenigen Kostümwechseln. Ein hinkender Vergleich, aber fest steht: Feuerwerke hat Google gezündet. Das gesamte Produktportfolio wird neu aufgestellt. Die KI ist überall. An ihr kommt keiner mehr vorbei.

Die Entwicklerkonferenz von Google startet am Dienstagabend traditionell mit einer Keynote. Im Mittelpunkt: Alles, was Google an Neuerungen so weit fertig hat, dass man sie im kleinen (vor Ort) und großen Rahmen (via Livestream) zeigen kann. Besonders heuer spannend, da Google versucht, sich neu zu erfinden. Das Setting wirkt wie bei Google gewohnt: bunt. Und ungewöhnlich.

Zu Beginn an den Mischpulten der Sänger Marc Rebillet, der in Ruderleiberl und farbenfrohem Bademantel mit psychedelischer Musik „begeistert“. Bis zum Beginn des Events wirkte es trotzdem wie eine LSD-inspirierte Neuauflage von AmDamDes.

Aber zum Glück begann dann die eigentliche Keynote mit Google-Chef Sundar Pichai. „Die Google I/O ist so was wie unsere Eras-Tour (von US-Sängerin Taylor Swift, Anm.), aber mit weniger Kostümwechsel“, wagt sich der 51-Jährige mit einem Eisbrecher zu Beginn, um dann die „Gemini Ära“ näher zu erläutern.

Es war Pichai, der gleich zu Beginn seiner Übernahme als CEO die Richtung vorgab und die lautete: Künstliche Intelligenz. Acht Jahre später zeigt sich, die Arbeit hat sich gelohnt. Auch wenn der Suchmaschinen-Riese in seinen Kernkompetenzen Konkurrenz bekommen hat, fürchten muss er sich nicht. Google kommt im neuen Online-Zeitalter an. Das gesamte Google-Universum ist auf KI getrimmt.

Mit Gemini wird alles besser, sagt Google

Kurz zusammengefasst: Alles, was Google bisher konnte, kann es jetzt besser - und das mithilfe von Gemini AI, sagt Google. Zum Beispiel Gmail, das jetzt lange E-Mail-Konversationen mit einem Klick zusammenfassen kann. Grundsätzlich wäre eine bessere Suche innerhalb der App wünschenswert. Vielleicht bringt Gemini das gleich automatisch mit.

Doch die Neuerungen reichen bis hin zu Fotos, die künftig nach der eigenen Nummerntafel durchsucht werden können. Oder Bildern und Videos, die nun mithilfe von KI erstellt werden können. Hierfür hat sich Google namhafte Künstler geholt, die die neuen Funktionen unterstützen.

Gemini, Googles KI, war erst der Startschuss. Gemini 1.5 wurde massiv ausgebaut und das Kontextverständnis auf eine Million Token erweitert. Das ist sehr beachtlich und ermöglicht trotz großer Datenmengen spezifische Fragestellungen. Doch Google will noch einen Schritt weitergehen und das auf zwei Millionen erhöhen. Zum Vergleich: ChatGPT schafft aktuell 125.000 Token.

Google hat sich am Dienstagabend viel Zeit genommen, um das eigene Produktportfolio - und es ist in den vergangenen 25 Jahren massiv gewachsen - einzeln zu präsentieren und die neuen KI-Funktionen zu zeigen. Generell gilt: Es ist der Anfang und alles wird mit KI besser.

Google Lens, Notebook LM und eine völlig neue Suche

Die ersten Live-Demos sind vielversprechend und machen Lust auf mehr. Hierzulande wird man sich bei einigen Dingen aber gedulden müssen. Hervorzuheben sind auf jeden Fall Google Lens: Mit der aufgemotzten Version kann ein Video aufgenommen und gefragt werden, warum zum Beispiel der Tonheber beim Plattenspieler nicht einhakt. Und weil Gemini eben diese Videos in so viele Einzelteile (Token) zerlegt, kann es das Modell erkennen, den Kontext und das Problem, weswegen es binnen zwei, drei Sekunden passende Lösungsvorschläge und Webseiten liefert.

Aber auch NotebookLM: Es ermöglicht interaktives Lernen. So gestaltet sich anhand von eingegebenem Text ein virtuelles Gespräch, bei dem sich die Menschen zuschalten können. Auch hier sind die Stimmen sehr natürlich und angenehm. Fraglich bleibt, wie gerade beim Thema Lernen geachtet wird, dass die KI nicht zu sehr halluziniert und ganz eigene Lerninhalte präsentiert.

Aus all diesen einzelnen Puzzlesteinen, die Googles Kerngeschäft ausmachen, wird ein mächtiges Instrument, das eine Antwort auf die Frage liefert, wie Suche in Zukunft aussehen wird. Google macht seine Suche zu einer sprechenden, sehenden und hörenden Maschine. Wie auch schon am Montagabend bei OpenAI wird die KI zu einem smarten Assistenten. Einer, der Jahre nach der Einführung von Siri und Alexa auch tatsächlich den Namen verdient.

Ausblick: Mit Project Astra zeigte Google auch eine kleine Vorschau, wie der Assistent in der Zukunft aussehen und was er können wird. Dabei eine Datenbrille, womit die KI das sieht, was ihr Träger sieht. Sie erkennt Probleme in einer mathematischen Gleichung und kann Zeichnungen deuten (zwei Katzen und eine Box…). Noch handelt es sich um ein Experiment, aber die Deepmind-Abteilung hat bereits viele davon in der Vergangenheit realisiert.

Betrugswarnung - während eines Anrufs

Natürlich zieht die KI nicht spurlos an Android vorbei. Eines der Highlights ist, dass mithilfe von Gemini direkt eigene Memes erstellt werden können. Ein netter Spaß. Aber wirklich hilfreich könnte die integrierte Betrugswarnung sein, die bei Anrufen kommt. So könnten in Zukunft viele Menschen davor bewahrt werden, viel Geld zu verlieren.

Der Preis: Gemini 1.5 gibt es in drei verschiedenen Preiskategorien zur Verfügung stehen, je nachdem wie detailliert die KI arbeiten soll:

Eine Million Token: sieben Dollar

128.000 Token (mehr als bei Chat GPT 4.0): 3,50 Dollar

Die Preise sind – typisch in den USA – ohne Steuern, weswegen sie teurer sein werden in Euro. Sie sind auch nicht als monatliche Gebühr zu verstehen. Es wird wohl im Nachhinein verrechnet: Jede Interaktion verbraucht Token.

Technologie und Gesellschaft – eine neue Abteilung

Ethik in der Entwicklung von Künstlicher Intelligenz ist auch eine Frage, mit der sich Google beschäftigt. Immerhin wissen wir schon jetzt, dass die KI gerne halluziniert. Doch die Risiken reichen viel weiter. Bei Google führt James Manyika diese neu gegründete Abteilung, in der die KI gegen die KI antritt, an. Dort sollen „problematische Inhalte“ ausgemerzt bzw. auf ein geringes Maß reduziert werden.

Für Imagen 3 (Bild) und Veo (Video) soll es Mechanismen geben, um Desinformation zu verhindern. Einmal mehr wird hier das Wasserzeichen ins Feld geführt.

Zu guter Letzt: Wer sich während der Keynote gefragt hat, wie oft AI gesagt wurde: Google hat die KI mitzählen lassen: 121 Mal.