Wenn Sie eingeschaltet haben für Google I/O, OpenAIs Frühlingsupdate, oder Microsoft Build in diesem Monat haben Sie den Begriff KI-Agenten wahrscheinlich ziemlich häufig gehört. Sie entwickeln sich schnell zum nächsten großen Ding in der Technologie, aber was genau sind sie? Und warum spricht plötzlich alle über sie?
Google-CEO Sundar Pichai beschrieb ein System künstlicher Intelligenz, das ein Paar Schuhe in Ihrem Namen zurückgeben auf der Bühne bei Google I/O. Bei Microsoft kündigte das Unternehmen Copilot KI-Systeme an, die unabhängig wie virtuelle Mitarbeiter handeln könnten. Unter der Zeit enthüllte OpenAI ein KI-System, GPT-4 Omni, das sehen , hören und sprechen kann. Zuvor erklärte OpenAI-CEO Sam Altman MIT Technology dass Hilfreiche Agenten bergen das beste Potenzial der Technologie. Systeme dieser Art sind die neuen Maßstäbe, die alle KI-Unternehmen erreichen wollen, aber das ist leichter gesagt als getan.
Einfach ausgedrückt sind KI-Agenten lediglich KI-Modelle, die unabhängig voneinander etwas tun. Es ist wie Jarvis aus Iron Man, Teer aus Interinstaller, oder HAL 9000 von Odyssee im Weltraum. Sie gehen einen Schritt weiter als nur eine Antwort zu erstellen wie die uns bekannten Chatbots – es gibt Aktion dazu . Zunächst versuchen Google, Microsoft und OpenAI Agenten zu entwickeln, die digitale Aktionen ausführen können. Das bedeutet dass sie KI-Agenten beibringen, mit verschiedenen APIs auf Ihrem Computer zu arbeiten. Im Ideal können sie Knöpfe drücken, Entscheidungen treffen, autonom Kanäle überwachen und Anfragen senden.
„Ich stimme zu, dass die Zukunft den Agenten gehört“, sagt Alexander Kvamme, Gründer und CEO von Echo AI. Sein Unternehmen entwickelt KI-Agenten, die die Gespräche eines Unternehmens mit Kunden analysieren und Erkenntnisse darüber liefern, wie dieses Erlebnis verbessert werden kann. „Die Branche spricht seit Jahren darüber, aber bisher ist nichts daraus geworden. Es ist einfach ein so schwieriges Problem.“
Kvamme sagt, dass ein wirklich agentenbasiertes System Dutzende oder Hunderte von Entscheidungen unabhängig voneinander treffen muss, was sich nur schwer automatisieren lässt. Um beispielsweise ein Paar Schuhe zurückzugeben, muss ein KI-Agent, wie Pichai von Google erklärte, möglicherweise Ihre E-Mails nach einer Quittung durchsuchen, Ihre Bestellnummer und Adresse abrufen, ein Rücksendeformular ausfüllen und in Ihrem Namen verschiedene Aktionen ausführen. In diesem Prozess gibt es viele Entscheidungen, über die Sie nicht einmal nachdenken, die Sie jedoch unbewusst treffen.
Wie wir gesehen haben, sind große Sprachmodelle (LLMs) selbst in kontrollierten Umgebungen nicht perfekt. Altmans neue Lieblingsbeschäftigung ist das Aufrufen von ChatGPT. „unglaublich dumm“, und damit liegt er nicht ganz falsch. Wenn man von LLMs verlangt, unabhängig im offenen Internet zu arbeiten, dann machen sie Fehler unvermeidlich. Aber daran arbeiten zahllose Start-ups wie Echo AI sowie größere Unternehmen wie Google, OpenAI und Microsoft.
Wenn Sie Agenten digital erstellen können, steht der Erstellung von Agenten, die auch mit der physischen Welt zusammenarbeiten, nichts mehr im Wege. Sie müssen diese Aufgabe lediglich einem Roboter programmieren. Dann sind Sie wirklich im Science-Fiction-Bereich angelangt, denn KI-Agenten bieten die Möglichkeit, Robotern Aufgaben wie „Bestellung für diesen Tisch aufnehmen“ oder „Alle Dachschindeln auf diesem Dach montieren“ zuzuweisen. Davon sind wir noch weit entfernt, aber der erste Schritt besteht darin, KI-Agenten einfache digitale Aufgaben beizubringen.
In der Welt der KI-Agenten gibt es ein oft diskutiertes Problem: sicherzustellen, dass man einen Agenten nicht dafür entwirft, eine Aufgabe zu erledigen. zu Nun. Wenn Sie einen Agenten zum Zurückgeben von Schuhen bauen müssen Sie sicherstellen, dass er nicht alle Ihre Schuhe zurückgibt oder vielleicht alle Dinge, für die Sie Quittungen in Ihrem Gmail-Posteingang haben. Auch es albern klingt, gibt es eine kleine aber laute Gruppe von KI-Forschern, die befürchten, über entschlossene KI-Agenten könnten den Untergang der menschlichen Zivilisation bedeuten. Ich nehme an, wenn man Stoff für Science-Fiction baut, ist das eine berechtigte Befürchtung.
Auf der anderen Seite des Spektrums stehen Optimisten wie Echo AI, die glauben, dass diese Technologie uns alle stärken wird. Diese Divergenz in der KI-Community ist ziemlich krass, aber die Optimisten erwarten von KI-Agenten eine befreiende Wirkung, die mit der eines Personal Computers vergleichbar ist.
„Ich bin fest davon überzeugt, dass ein Großteil der Arbeit, die [Agenten] erledigen werden, Arbeit ist, die Menschen lieber nicht machen würden“, sagte Kvemme. „Und sie haben eine sinnvollere Verwendung für ihre Lebenszeit. Aber sie müssen sich auch hier anpassen.“
Ein weiterer Anwendungsfall für KI-Agenten sind selbstfahrende Autos. Tesla und Waymo sind derzeit die Spitzenreiter dieser Technologie, bei der Autos KI-Technologie nutzen, um durch Stadtstraßen und Autobahnen zu navigieren. Obwohl es sich bei der selbstfahrenden Technologie um eine Nische handelt, handelt es sich um einen ziemlich entwickelten Bereich von KI-Agenten, in dem wir KI bereits in der realen Welt im Einsatz sehen.
Was bringt uns also in diese Zukunft, in der KI Ihnen Ihre Schuhe zurückgeben kann? Erstens müssen die zugrunde liegenden KI-Modelle wahrscheinlich besser und genauer werden. Das bedeutet, dass Updates für ChatGPT, Gemini und Copilot wahrscheinlich voll funktionsfähigen Agentensystemen vorausgehen werden. KI-Chatbots müssen ihre enormen Herausforderungen noch meistern. Halluzinationsproblem, für das viele Forscher keine Lösung sehen. Aber auch die Agentensysteme selbst müssen aktualisiert werden. Derzeit ist der GPT-Store von OpenAI der ausgereifteste Versuch, ein Netzwerk von Agenten zu entwickeln, aber selbst dieser ist noch nicht sehr weit fortgeschritten.
Obwohl es fortgeschritte KI-Agenten definitiv noch nicht gibt, ist das Ziel vieler großer und kleiner KI-Unternehmen heutzutage das Ziel. Das könnte das sein, was KI in unserem Alltag deutlich nützlicher macht. Auch es klingt wie Science-Fiction, aber es werden Milliarden von Dollar ausgegeben, um Agenten noch zu unseren Leben zu realisieren. Für KI-Unternehmen jedoch ist das große Versprechen viel als gewagt, damit Chatbots zu verlässlich auf grundlegende Fragen beantworten können.
Eine Version dieses Artikels erschien ursprünglich auf Gizmodo.
Dieser Inhalt wurde maschinell aus dem Originalmaterial übersetzt. Aufgrund der Nuancen der automatisierten Übersetzung können geringfügige Unterschiede bestehen. Für die Originalversion klicken Sie hier