Wie üblich, Google I/O 2024 ist ein regelrechter Wirbelsturm aus Neuigkeiten und Ankündigungen. Anstatt sich dieses Jahr auf Hardware, Android oder Chrome zu konzentrieren, verbrachte Google den größten Zeitraum der diejährigen Entwicklerkonferenz damit, uns davon zu überzeugen, dass es KI-Funktionen sind es wert, Priorität zu haben. Eines dieser Projekte ist das Projekt Astra, ein multimodaler KI-Assistent, mit dem Sie eine Halb-Konversation führen können und der die Kamera gleichzeitig zum Identifizieren von Objekten und Personen verwenden kann.
Ich sage „halb“, weil nach der Demo klar ist, dass dieser Teil von Gemini noch in den Kinderschuhen steckt. Ich habe ein paar Minuten mit Project Astra am Pixel 8 Pro um zu sehen, wie es in Echtzeit funktioniert. Ich hatte nicht genug Zeit, es in vollem Umfang zu testen oder zu versuchen, es auszutricksen, aber ich habe ein Gefühl dafür bekommen, wie sich als Android-Nutzer die Zukunft anfühlen könnte.
Stellen Sie ihm fast alles
Der Sinn von Project Astra besteht darin, wie ein Assistent zu sein, der Sie auch in der realen Welt führt. Es kann Fragen zu Ihrer Umgebung beantworten, indem es Objekte, Gesichter, Stimmungen und Textilien identifiziert. Es kann Ihnen sogar dabei helfen, sich zu erinnern, wo Sie zuletzt etwas hingelegt haben.
Für Project Astra standen vier verschiedene Demonstrationen zur Auswahl. Dazu gehörten der Storyteller-Modus, in dem Gemini auffordert wird, eine Geschichte basierend auf verschiedenen Eingaben zu erfinden, und Pictionary, im Wesentlichen ein Ratespiel mit dem Computer. Außerdem gab es einen Alliterationsmodus, in dem die KI ihr Können beim Finden von Wörtern mit demselben Anfangsbuchstaben unter Beweis stellte, und Free-Form ermöglichte das Hin- und Her-Chatten.
Die Demo, die ich bekam, war eine Version von Free-Form auf dem Pixel 8 Pro. Ein anderer Journalist in meiner Gruppe hatte sie direkt angefordert, daher konzentrierte sich der Großteil unserer Demonstration auf die gemeinsame Verwendung des Geräts und dieses assistentenähnlichen Modus.
Als die Kamera auf einen anderen Journalisten gerichtet war, konnten Pixel 8 Pro und Gemini erkennen, dass es sich bei dem Motiv um eine Person handelte. Wir sagten ihnen ausdrücklich, dass es sich bei der Person um einen Mann handelte. Dann erkannte das Gerät korrekt, dass er sein Telefon bei sich trug. In einer Folgefrage antworteten sie: Unsere Gruppe fragte nach seiner Kleidung. Sie gab die verallgemeinerte Antwort, dass „er lässige Kleidung zu tragen scheint“. Dann fragten wir, was er mache, woraufhin Project Astra antwortete, dass es so aussehe, als würde er eine Sonnenbrille aufsetzen (was er tat) und eine lässige Pose einnehmen.
Ich habe das Pixel 8 Pro kurz in die Hand genommen. Ich habe Gemini dazu gebracht, einen Topf mit Kunstblumen richtig zu identifizieren. Es waren Tulpen. Gemini bemerkte, dass sie auch bunt waren. Von da an wusste ich nicht mehr, was ich ihm sonst noch sagen sollte, und dann war meine Zeit um. Ich ging mit mehr Fragen, als ich vorher hatte.
Angesichts der KI von Google scheint dies ein Vertrauensvorschuss zu sein. Ich kann mir vorstellen, dass die Identifizierung einer Person und ihrer Aktionen ein Hilfsmittel sein könnte, um blinden oder sehbehinderten Menschen bei der Orientierung in der sie umgebenden Welt zu helfen. Aber darum ging es bei dieser Demonstration nicht. Sie sollte die Fähigkeiten von Project Astra und unsere Interaktion damit demonstrieren.
Meine größte Frage lautet: Wird so etwas wie Project Astra den Google Assistant auf Android-Geräten ersetzen? Immerhin kann sich diese KI merken, wo Sie Ihre Sachen hinlegen, und Nuancen erkennen – das wurde zumindest in der Demo vermittelt. Von den wenigen Google-Leuten, die ich gefragt habe, konnte ich keine Antwort bekommen. Aber ich habe das starke Gefühl, dass es in der Zukunft von Android weniger darum gehen wird, zur Interaktion mit dem Telefon zu tippen, sondern vielmehr darauf, mit ihm zu sprechen.
Eine Version dieses Artikels erschien ursprünglich auf Gizmodo.
Dieser Inhalt wurde maschinell aus dem Originalmaterial übersetzt. Aufgrund der Nuancen der automatisierten Übersetzung können geringfügige Unterschiede bestehen. Für die Originalversion klicken Sie hier