Schauen Sie sich Project Astra an, Googles KI-Assistent der Zukunft

Warum sollten Sie Ihr Gerät ständig berühren, wenn Sie einfach mit ihm sprechen und ihm Dinge zeigen können?

Von
Für die Links auf dieser Seite können wir eine Provision verdienen.
Ein Foto eines Projekt Astra Schildes
Das Project Astra meldet sich in der Google I/O AI -Sandbox an.
Foto: Florence Ion / Gizmodo

Wie üblich, Google I/O 2024 ist ein regelrechter Wirbelsturm aus Neuigkeiten und Ankündigungen. Anstatt sich dieses Jahr auf Hardware, Android oder Chrome zu konzentrieren, verbrachte Google den größten Zeitraum der diejährigen Entwicklerkonferenz damit, uns davon zu überzeugen, dass es KI-Funktionen sind es wert, Priorität zu haben. Eines dieser Projekte ist das Projekt Astra, ein multimodaler KI-Assistent, mit dem Sie eine Halb-Konversation führen können und der die Kamera gleichzeitig zum Identifizieren von Objekten und Personen verwenden kann.

Werbung

Ich sage „halb“, weil nach der Demo klar ist, dass dieser Teil von Gemini noch in den Kinderschuhen steckt. Ich habe ein paar Minuten mit Project Astra am Pixel 8 Pro um zu sehen, wie es in Echtzeit funktioniert. Ich hatte nicht genug Zeit, es in vollem Umfang zu testen oder zu versuchen, es auszutricksen, aber ich habe ein Gefühl dafür bekommen, wie sich als Android-Nutzer die Zukunft anfühlen könnte.

Stellen Sie ihm fast alles

Der Sinn von Project Astra besteht darin, wie ein Assistent zu sein, der Sie auch in der realen Welt führt. Es kann Fragen zu Ihrer Umgebung beantworten, indem es Objekte, Gesichter, Stimmungen und Textilien identifiziert. Es kann Ihnen sogar dabei helfen, sich zu erinnern, wo Sie zuletzt etwas hingelegt haben.

Werbung
Ein Foto, das den Pictionary-Modus auf Project Astra zeigt
Eine Vorschau auf den Pictionary-Modus von Project Astra, ein weiteres Angebot im Demoraum.
Foto: Florence Ion / Gizmodo

Für Project Astra standen vier verschiedene Demonstrationen zur Auswahl. Dazu gehörten der Storyteller-Modus, in dem Gemini auffordert wird, eine Geschichte basierend auf verschiedenen Eingaben zu erfinden, und Pictionary, im Wesentlichen ein Ratespiel mit dem Computer. Außerdem gab es einen Alliterationsmodus, in dem die KI ihr Können beim Finden von Wörtern mit demselben Anfangsbuchstaben unter Beweis stellte, und Free-Form ermöglichte das Hin- und Her-Chatten.

Werbung

Die Demo, die ich bekam, war eine Version von Free-Form auf dem Pixel 8 Pro. Ein anderer Journalist in meiner Gruppe hatte sie direkt angefordert, daher konzentrierte sich der Großteil unserer Demonstration auf die gemeinsame Verwendung des Geräts und dieses assistentenähnlichen Modus.

Werbung
Ein Foto einer Person, die das Pixel 8 Pro und das Project Astra hochhält und erkennt, dass die Person ein Telefon in der Hand hat.
Gemini hat das Telefon in der Hand der Person korrekt identifiziert.
Foto: Florence Ion / Gizmodo
Werbung

Als die Kamera auf einen anderen Journalisten gerichtet war, konnten Pixel 8 Pro und Gemini erkennen, dass es sich bei dem Motiv um eine Person handelte. Wir sagten ihnen ausdrücklich, dass es sich bei der Person um einen Mann handelte. Dann erkannte das Gerät korrekt, dass er sein Telefon bei sich trug. In einer Folgefrage antworteten sie: Unsere Gruppe fragte nach seiner Kleidung. Sie gab die verallgemeinerte Antwort, dass „er lässige Kleidung zu tragen scheint“. Dann fragten wir, was er mache, woraufhin Project Astra antwortete, dass es so aussehe, als würde er eine Sonnenbrille aufsetzen (was er tat) und eine lässige Pose einnehmen.

Ich habe das Pixel 8 Pro kurz in die Hand genommen. Ich habe Gemini dazu gebracht, einen Topf mit Kunstblumen richtig zu identifizieren. Es waren Tulpen. Gemini bemerkte, dass sie auch bunt waren. Von da an wusste ich nicht mehr, was ich ihm sonst noch sagen sollte, und dann war meine Zeit um. Ich ging mit mehr Fragen, als ich vorher hatte.

Werbung
Ein Foto einer Person, die ein Pixel 8 Pro hochhält
Gemini hat richtig erkannt, dass es sich bei den Kunstblumen um Tulpen handelte.
Foto: Florence Ion / Gizmodo

Angesichts der KI von Google scheint dies ein Vertrauensvorschuss zu sein. Ich kann mir vorstellen, dass die Identifizierung einer Person und ihrer Aktionen ein Hilfsmittel sein könnte, um blinden oder sehbehinderten Menschen bei der Orientierung in der sie umgebenden Welt zu helfen. Aber darum ging es bei dieser Demonstration nicht. Sie sollte die Fähigkeiten von Project Astra und unsere Interaktion damit demonstrieren.

Werbung

Meine größte Frage lautet: Wird so etwas wie Project Astra den Google Assistant auf Android-Geräten ersetzen? Immerhin kann sich diese KI merken, wo Sie Ihre Sachen hinlegen, und Nuancen erkennen – das wurde zumindest in der Demo vermittelt. Von den wenigen Google-Leuten, die ich gefragt habe, konnte ich keine Antwort bekommen. Aber ich habe das starke Gefühl, dass es in der Zukunft von Android weniger darum gehen wird, zur Interaktion mit dem Telefon zu tippen, sondern vielmehr darauf, mit ihm zu sprechen.

Eine Version dieses Artikels erschien ursprünglich auf Gizmodo.

Dieser Inhalt wurde maschinell aus dem Originalmaterial übersetzt. Aufgrund der Nuancen der automatisierten Übersetzung können geringfügige Unterschiede bestehen. Für die Originalversion klicken Sie hier

Werbung