Gestern Abend lief die Eröffnungsveranstaltung der diesjährigen Google I/O 2023 und weit über eine Stunde sprach der Suchmaschinengigant über Software. Wobei dies nicht ganz korrekt ist, es ging vielmehr um Künstliche Intelligenz. Und wenn Cupertino nicht aufpasst, könnte im Nachgang betrachtet dieses Event zu Apples ganz persönlichem Nokia-Moment werden.
Android 14 – ein erster Ausblick
Künstliche Intelligenz war das zentrale Thema, wovon auch Android 14 profitieren soll. Das Unternehmen zeigte jedoch nur eine erste Preview und konzentrierte sich dabei auf drei Themen: Messaging, Konfiguration und Sicherheit. So zeigte man das neue Nachrichtenformat RCS. Dank der K.I. lassen sich dann bei Antworten verschiedene Ausdrucksweisen auswählen. Bei der Konfiguration wird das Material Design fortgesetzt. Das Hintergrundbild beeinflusst nun auch die Farbgebung der Schalter und Regler. Außerdem wurde die „Wiederfind“-Funktion optimiert, bietet die kombinierte Suche von mehreren Dingen, die man verlegt hat. Dazu integriert man die „unknown tracker“-Funktion, die davor warnt, wenn man einen fremden Tracker etwa im Koffer hat.
wearOS 4
Apple ist im Bereich Smartwatches führend, was primär an watchOS liegt. Mit der Pixel Watch und wearOS, in Kooperation mit Samsung entwickelt, möchte Google die Vormachtstellung angreifen. Ob das gelingt, bleibt abzuwarten. Die Ankündigung von WhatsApp für die Smartwatch ist aber ein Anfang. wearOS 4 basiert auf Android 13, soll die Akkulaufzeit deutlich verbessern und noch im Laufe des Jahres ausgerollt werden. Zudem wird nun eine Sicherungskopie-Funktion eingeführt, mit dessen Hilfe sich eine neue Smartwatch ohne Datenverlust in Betrieb nehmen lässt. Google ließ jedoch offen, wann genau wearOS 4 zur Verfügung gestellt wird.
Google Bard – der Angriff auf ChatGPT
Die erste Vorstellung von Google Bard lief gehörig schief, doch Google hat in den vergangenen Wochen und Monaten enorme Ressourcen in das Projekt gesteckt und es zahlt sich aus. Beispielsweise wurde Bard auf ein fortschrittlicheres Modell, PaLM 2, umgestellt, was zu vielen Verbesserungen geführt hat, darunter fortgeschrittene Mathematik- und Programmierfähigkeiten. Wie gut das funktioniert, lässt sich demnächst in 180 Ländern feststellen – und zwar ohne Einladung.
Bard wird zudem deutlich visueller. Das bedeutet, dass bei Anfragen neben Textinformationen auch Bilder ausgegeben werden. Es wird möglich sein, Bilder in eigenen Anfragen zu verwenden und ausführliche visuelle Ergebnisse zu erhalten. So können Nutzer unter anderem Bilder von ihren Hunden hochladen und Bard bitten, eine lustige Geschichte über sie zu schreiben.
Künstliche Intelligenz wird auch in der Google Suche, in Google Docs, Google Photos oder Gmail eingesetzt. In Gmail wird die Satzvervollständigung beim Schreiben neuer E-Mails stark ausgebaut: Mithilfe von künstlicher Intelligenz können Nutzer sich ganze E-Mails vorschreiben lassen. Auf der Keynote wurde dies auf eine Flugabsage einer Airline demonstriert – die K.I. antwortete auf diese Mail inklusive der korrekten Bankdaten für die Rückerstattung. Bei den Bildern bedeutet K.I., dass wir die zweite Version des Magic Radieres sehen werden. Auf der Demo wurden nicht nur Objekte und Personen retouchiert, man kann auch den Himmel austauschen.
Den größten Nutzen von K.I. dürften wir bei der Google Suche bekommen: Endlich werden Ergebnisse bei natürlich gestellten Fragen ausgeliefert. Wie bei Microsofts KI-unterstützter Bing-Suche werden Informationen aus der Websuche eingebunden, die dabei verwendeten Webseiten werden als Links visualisiert. Bei Produktsuchen gibt die Google-Suche neben den bisherigen Shopping-Vorschlägen KI-generierte Hinweise und Tipps – etwa, worauf bei einem Fahrradkauf zu achten ist. Die Shopping-Anzeigen werden ebenfalls mit KI-Erklärungen ergänzt.
Universal Translator – ein Spiel mit dem Feuer
Die mit Abstands kontroverseste Vorstellung dürfte der „Universal Translator“ sein, besonders in den heutigen Zeiten mit Fake News und Deep Fakes. Der Universal Translator nimmt ein Ausgangsvideo, transkribiert die Sprache, übersetzt sie, erzeugt einen neuen Sprach-Track in der gewählten Sprache. Dabei ahmt er den ursprünglichen Stil und Tonfall nach und passt dann das Video so an, dass die Lippenbewegungen des Sprechers mit dem neuen Ton übereinstimmen – vom Original also nicht mehr zu unterscheiden.
Google betont hier, dass der Dienst aktuell noch im Versuchsstadium ist und man sich der Kontroverse bewusst ist. Es ist ein schmaler Grat, zwischen Kühnheit und Sicherheit gibt. Als wichtigste Sicherheitsmaßnahme soll Google diese Funktion nur für registrierte und verifizierte Entwickler bereitstellen. Auf der Vorstellung wurde die University of Arizona als Beispiel genannt. Auch wenn es hier nicht üblich ist, sind wir bei diesem Feature eher zwiegespalten und uns nicht sicher, ob K.I. diesbezüglich in diesen Zeiten den richtigen Weg einschlägt.
Gleichwohl ist die Entwicklung beeindruckend und Apple bietet als intelligenten Assistenten Siri an. Wobei Siri nicht wirklich smart, clever oder intelligent ist. (Leichte) Abweichungen bei einfachen Sprachkommandos führen bereits zum Scheitern des Sprachbefehls. Auf Fragen, die eine ausführlichere Antwort verlangen, werden mit dem Verweis auf eine Websuche abgehandelt. Eine syntaxbasierte Folgeantwort zu bekommen, ist unmöglich. Die Liste der eklatanten Mängel lässt sich endlos weiterführen und Google Bard sowie ChgatGPT zeigen auf dramatische Art und Weise an, wie groß der Rückstand für Apple und Siri mittlerweile ist.
Duet AI
Nutzer und Kunden der Google Cloud können bei der Entwicklung ihrer Anwendungen künftig auf Duet AI zurückgreifen, das eine Art Pair-Programming mithilfe eines KI-Bots liefern soll. Das hat Google im Rahmen seiner Entwicklerveranstaltung Google I/O angekündigt. Duet AI „gibt Code-Empfehlungen während der Eingabe in Echtzeit, generiert vollständige Funktionen und Code-Blöcke, identifiziert Schwachstellen und Fehler im Code und schlägt deren Behebung vor“, heißt es dazu.
2 Gedanken zu „Google I/O 2023: Künstliche Intelligenz überall“
Die Kommentare sind geschlossen.