
In einem Demonstrationsvideo von Google DeepMind faltet ein Roboterarm vorsichtig Origami, packt Snacks in Ziploc-Beutel und manipuliert Objekte mit überraschender Präzision. Rutscht ihm ein Gegenstand aus der Hand, korrigiert der Roboter die Position schnell und setzt seine Aufgabe fort. Dabei handelt es sich nicht um ruckartige, vorprogrammierte Bewegungen, sondern um etwas Flüssigeres und Anpassungsfähigeres – das Ergebnis eines neuen KI-Modells namens Gemini Robotics, das das Unternehmen Anfang des Monats vorgestellt hat.
Während sich die Präsentation auf Roboterarme und nicht auf vollständig humanoide Roboter konzentriert, ist die zugrunde liegende Technologie dieselbe, die die nächste Generation menschenähnlicher Maschinen antreiben wird. Laut Google ist sein Modell Gemini Robotics so konzipiert, dass es sich „leicht an verschiedene Robotertypen anpassen“ lässt und bereits mit dem humanoiden Roboter Apollo von Apptronik getestet wird.
„Damit KI für Menschen im physischen Bereich nützlich und hilfreich sein kann, muss sie über ‚verkörpertes‘ Denken verfügen – die menschenähnliche Fähigkeit, die Welt um uns herum zu verstehen und darauf zu reagieren“, sagt Carolina Parada, Leiterin des DeepMind-Robotikteams. sagte in einer Erklärung.
Die Demonstration ist Teil einer neuen Welle humanoider Roboter von Technologiegiganten wie Google und Meta sowie von Startups wie Figure AI und Agility Robotics. Sie werden als die Zukunft der Logistik und der Hausarbeit angepriesen. Außer fliegenden Autos hat uns wohl keine andere Science-Fiction-Technologie so sehr fasziniert und solange das Versprechen von Roboterhelfern, die uns endlich von der Plackerei des Abwaschens und Wäschewaschens befreien würden, noch Bestand hat (OK, diese Geschichten haben uns auch manchmal Angst gemacht). Jetzt, da sie mit fortschrittlichen KI-Modellen ausgestattet sind, unternehmen diese mechanischen Arbeiter ihre ersten zaghaften Schritte aus unserer Vorstellungskraft in die Realität.
Doch während die Technologie voranschreitet, bleibt eine grundlegende Frage offen: Sollten wir Roboter für unsere Welt bauen oder unsere Räume für einfachere Maschinen anpassen?
Die Hersteller dieser humanoiden Roboter drängen auf Ersteres. Sie argumentieren, dass die Welt schließlich für den menschlichen Körper konzipiert sei, mit Treppen, Regalen auf Schulterhöhe und wichtigen Dingen auf Augenhöhe. Befürworter humanoider Roboter argumentieren, dass dies die menschliche Form zum logischsten Design für Maschinen mache, die sich in bestehende Umgebungen wie unsere Küchen integrieren lassen sollen.
Sie kämpfen einen harten Kampf gegen die bislang einzigen erfolgreichen Roboter. Dabei handelt es sich meist um nicht-humanoide Roboter in Lagerhallen, in denen Regalsysteme für Kommissionierroboter auf Rädern konzipiert sind oder abgesperrte Bereiche existieren, die ausschließlich für Roboter vorgesehen sind. Diese speziell konzipierten Umgebungen ermöglichen wesentlich einfachere Roboterkonstruktionen.
Doch Unternehmen, die sich mit humanoider Robotik beschäftigen, verfügen über ein leistungsstarkes neues Tool, von dem sie überzeugt sind, dass es alles verändern wird: KI-Systeme wie Gemini von Google und GPT von OpenAI, die menschliche Sprache verstehen und erzeugen. Dank dieser Technologie könnten Menschen ganz einfach mit Robotern sprechen, wie sie mit einem Menschen sprechen würden – etwa „das Hemd zusammenlegen“ oder „das Geschirr wegräumen“ – ohne dass dafür spezielle Programmierkenntnisse oder technisches Wissen erforderlich wären. Noch vielversprechender ist, dass diese KI-Modelle Robotern helfen könnten, sich an neue Situationen anzupassen, für die sie nicht speziell trainiert wurden. Dies könnte möglicherweise eine der hartnäckigsten Herausforderungen der Robotik lösen.
Trotz beeindruckender Demos und himmelhoher Versprechungen ist die aktuelle Realität bescheidener. Die Roboter sind im Vergleich zu uns immer noch langsam und haben Probleme mit empfindlichen oder formbaren Gegenständen, die beim Greifen ihre Form verändern. Das unvorhersehbare Chaos eines Haushalts mit herumrennenden kleinen Kindern, auf dem Boden verstreutem Spielzeug oder unerwarteten Situationen wie dem Finden der Schlüssel im Kühlschrank – was in vielen Haushalten ein ganz normaler Dienstag sein könnte – sind nach wie vor weitgehend ungetestete Szenarien, die weit über die aktuellen Möglichkeiten hinausgehen.
Diese Probleme halten Unternehmen nicht davon ab, es zumindest zu versuchen. Meta baut Berichten zufolge eine Plattform für humanoide Roboter, die …“das Android der Androiden„Elon Musk, der mit seinen vielen, vielen Projekten bereits am Limit ist, hat dennoch Zeit gefunden, weiterhin über Teslas humanoiden Roboter Optimus zu posten. Kürzlich kündigte er auf X an, dass mindestens einer seiner Roboter bis … auf dem Weg zum Mars sein wird.“Ende des nächsten Jahres„und ist den Menschen um mindestens ein paar Jahre voraus.“
Doch bevor diese Roboter flächendeckend eingesetzt werden können, müssen noch weitere erhebliche Hürden überwunden werden. Forscher im Bereich der Mensch-Roboter-Interaktion haben festgestellt, dass Menschen Roboterfehlern gegenüber typischerweise eine wesentlich geringere Toleranz zeigen als menschlichen Fehlern. Studien in diesem Bereich zeigen, dass wir einem menschlichen Kollegen verzeihen können, wenn er gelegentlich Gegenstände fallen lässt, aber ein Roboter der auch einen einzigen grossen Fehler macht, kann das Vertrauen der Benutzer dauerhaft verlieren.
Dieses Vertrauensproblem wird noch komplizierter, da Roboter große Sprachmodelle integrieren, die dafür bekannt sind, gelegentlich zu „halluzinieren“ oder falsche Informationen zu generieren. Ein Roboter, der aufgrund einer LLM-Halluzination einen Befehl falsch interpretiert, könnte in physischen Umgebungen gefährliche Situationen schaffen. Während der Fehler eines KI-Chatbots lediglich frustrierend sein kann, könnte ein Roboter, der auf halluzinierte Anweisungen reagiert, Eigentum beschädigen oder Menschen verletzen.
Ungeachtet dessen fließen weiterhin Milliarden von Dollar in die humanoide Robotik, und zwar von Technologieführern, die mit Science-Fiction aufgewachsen sind und ihren Traum nicht aufgeben wollen. Auf der jährlichen Entwicklerkonferenz von Nvidia in dieser Woche stellte CEO Jensen Huang eine neue Software vor, die seiner Aussage nach humanoiden Robotern helfen soll, sich leichter in unseren Räumen zu bewegen. Auf die Frage, wann wir wissen werden, dass KI allgegenwärtig geworden ist, antwortete er: er sagte, es wäre wenn humanoide Roboter „herumwandern“. Und er sagte, das werde bald passieren.
„Das ist kein Problem, das erst in fünf Jahren auftritt“, sagte er. „Das ist ein Problem, das erst in ein paar Jahren auftritt.“
—Jackie Snow, beitragende Redakteurin
Dieser Inhalt wurde maschinell aus dem Originalmaterial übersetzt. Aufgrund der Nuancen der automatisierten Übersetzung können geringfügige Unterschiede bestehen. Für die Originalversion klicken Sie hier