OpenAI hat am Montag einen neuen Chatbot mit einigen beeindruckenden – oder, je nach Perspektive, verrückten – Fähigkeiten vorgestellt. Mithilfe seiner Fähigkeit, wie ein echter Mensch zu sehen, zu hören und zu sprechen, demonstrierten Führungskräfte von OpenAI, wie der neueste ChatGPT Live-Gespräche übersetzen und Gutenachtgeschichten mit verschiedenen Stimmen erzählen kann.
Mark Chen, Leiter der Grenzforschung bei OpenAI, bat den Chatbot, „eine Gutenachtgeschichte über Roboter und Liebe“ zu erzählen.
„Oh, eine Gutenachtgeschichte über Roboter und Liebe? Da habe ich was für Sie!“, antwortete eine begeisterte weibliche Stimme sofort. „Es war einmal, in einer Welt, die sich nicht allzu sehr von unserer unterschied, ein Roboter namens Byte. Byte war ein neugieriger Roboter. Immer auf Entdeckungsreise.“
Chen unterbrach ihn: „Ich möchte ein bisschen mehr Emotion in Ihrer Stimme, ein bisschen mehr Drama.“
„Verstanden. Lass uns etwas Drama hinzufügen“, sagte ChatGPT-4o und begann seine Geschichte erneut, aber dieses Mal mit tieferer Stimme und mehr Spannung.
Chen mischte sich noch einmal ein: „Nein, nein, nein, ChatGPT, ich möchte wirklich maximale Emotionen, also maximale Ausdruckskraft, viel mehr als du vorher getan hast.“
„Verstanden. Lasst uns das Drama verstärken“, antwortete es und wiederholte seinen Eröffnungssatz erneut mit viel lauterer, noch dramatischerer Stimme. Mira Murati, Technologiechefin von OpenAI, bat den Chatbot, mit Roboterstimme zur Geschichte zu wechseln; er gehorchte. Dann warf sein Forscherkollege Barret Zoph ein und bat um eine singende Stimme. ChatGPT seufzte und begann zu singen.
Murati Chen und Zoph zeigten, wie ChatGPT-4o ein Live-Gespräch zwischen Italienisch und Französisch übersetzen kann und wie es Ihnen beim Atmen zuhören und Sie durch Atemübungen führen kann. Der Chatbot ist doppelt so schnell wie GPT-4 Turbo und für kostenlose Benutzer verfügbar.
„In den letzten paar Jahren haben wir uns sehr darauf konzentriert, die Intelligenz dieser Modelle zu verbessern, und sie sind ziemlich gut geworden“, sagte Murati. „Aber dies ist das erste Mal, dass wir in Bezug auf die Benutzerfreundlichkeit wirklich einen großen Schritt nach vorne machen.“
Vielleicht noch beeindruckender als seine Fähigkeiten zur Echtzeit-Konversation sind die visuellen Fähigkeiten von ChatGPT. Der Chatbot kann über eine Telefonkamera in das Gesicht einer Person schauen und ihr anhand ihres Gesichtsausdrucks sagen, wie sie sich seiner Meinung nach fühlt. Er kann über die Bildschirmfreigabe auf den Computerbildschirm eines Benutzers schauen und bei der Lösung eines Matheproblems helfen.
Sicherheitsbedenken
Murati sagte, dass die Fähigkeiten des Chatbots zwar eine erhebliche Verbesserung darstellten, uns aber „in puncto Sicherheit vor neue Herausforderungen stellten“.
„Unser Team hat hart daran gearbeitet, herauszufinden, wie man Maßnahmen gegen Missbrauch einbauen kann“, sagte sie und fügte hinzu, dass OpenAI mit Regierungen und Unternehmen „aller Branchen“ zusammenarbeite, um seine Ziele zu erreichen. Konkretere Angaben zu Sicherheitsbedenken, OpenAIs Plan oder der Art seiner Partnerschaften machte sie nicht.
Dieser Inhalt wurde maschinell aus dem Originalmaterial übersetzt. Aufgrund der Nuancen der automatisierten Übersetzung können geringfügige Unterschiede bestehen. Für die Originalversion klicken Sie hier