OpenAI und Google begannen die Woche mit der Veröffentlichung konkurrierender multimodaler künstlicher Intelligenzprodukte. Am Montag kündigte OpenAI sein Flaggschiff-Modell ChatGPT-4o — ein multimodaler Chatbot, der sehen, hören und Gespräche in Echtzeit führen kann. Kurz danach enthüllte Google ein Prototyp seines KI-Assistenten dass es heißt, dass es durch das Telefon und andere Objekte eines Benutzers sehen kann .
Lesen Sie diese und weitere Geschichten aus den KI-Nachrichten dieser Woche.