Google sagte in einer Pressekonferenz am Mittwoch, sein neuestes KI-Modell , Gemini 1.5 Flash, sei 20 Prozent schneller als der neueste Bot von OpenAI, ChatGPT-4o.
Google gab am Donnerstag bekannt, dass Gemini 1.5 Flash jetzt für die breite Öffentlichkeit verfügbar ist. Der KI-Chatbot wurde erstmals angekündigt bei Google I/O im Mai und war im letzten Monat als öffentliche Vorschau verfügbar – das so war, dass Kunden das Produkt testen und Feedback geben konnten. Gemini 1.5 Flash kann eine Stunde Videomaterial analysieren, 11 Stunden Audio oder mehr als 700.000 Wörter in einer Abfrage, anstatt dass Benutzer ihre Fragen in Abschnitte aufteilen müssen. In einer Präsentation vor Journalisten zeigte Google, wie der Bot ein 14-minütiges Video in einer Minute analysieren konnte.
Google sagte, der neueste KI-Bot sei auch 40% schneller als ChatGPT-3.5-turbo und verfüge über eine höhere Kapazität für Informationen. Mit anderen Wörtern können Benutzer in ihren Fragen an Gemini 1.5 Flash viel mehr Kontext – sei es Audio, Video, Code oder Text – einbeziehen und erhalten dafür anscheinend präzisere Antworten.
„Es ist das schnellste Modell mit dem besten Preis-Leistungs-Verhältnis auf dem Markt“, sagte Thomas Kurian, CEO von Google Cloud. Gemini 1.5 Flash ist für Entwickler verfügbar. in begrenzter Kapazität kostenlos und darüber hinaus zu variablen Preisen, abhängig von der Datenmenge, die der Benutzer eingeben möchte.
Gemini 1.5 Pro ist etwa zehnmal so teuer, wird von Google jedoch als dessen „insgesamt bestes Modell“ bezeichnet. Es kann sogar noch mehr Kontext verarbeiten: 22 Stunden Audio und 1,5 Millionen Wörter. „Sie können mit einer einzigen Abfrage die gesamte Unternehmensgeschichte durchgehen, was Finanzberichte von zehn Jahren umfassen kann“, sagte Kurian.
Google gab an, dass sein KI-Softwarepaket mit den jüngsten Updates für Gemini 1.5 Flash, sein Flaggschiffmodell Gemini 1.5 Pro und seinen Bildgenerator Imagen 3 „die unternehmenstauglichste generative KI-Plattform“ auf dem Markt sei. Das Unternehmen nannte mehrere Unternehmenskunden, die seine Produkte verwenden, darunter UberEats, Moody’s und Shutterstock.
Diese Kunden wenden sich unter anderem aufgrund eines neuen Updates der KI von Google an Google: die am Donnerstag angekündigten beschleunigten „Grounding“-Fähigkeiten. Gemini-Modelle zeigen jetzt Antworten an, die mit einer Quelle über einen Link verknüpft sind (d. h. angehängt sind). Diese Antworten erhalten außerdem eine Grounding-Bewertung (d. h. Vertrauenswürdigkeit).
„...diese Elemente sollen die Sachlichkeit verbessern und Halluzinationen deutlich reduzieren.“ — Google Cloud-CEO Thomas Kurian über die neuen Faktenprüfungs- bzw. „Grounding“-Funktionen des Unternehmens.
Nick Reed, Chief Product Officer von Moody’s Analytics, sagte gegenüber Reportern: „Die Grundlagen sind ein ziemlich grundlegender Prozess, um generative KI für Entscheidungsprozesse nutzen zu können, insbesondere im Finanzdienstleistungsbereich.“ Das Finanzdienstleistungsunternehmen ist Kunde von Google Gemini 1.5 Flash.
Google sagte, dass es im dritten Quartal auch ein neues branchenspezifisches Basierungstool auf den Markt bringen wird, das es beispielsweise Finanzanalysten ermöglichen wird, ihre KI-Abfragen auf Daten von Moody’s zu untermauern oder Rechtsexperten die Untersuchungen auf Quellen von Thomson Reuters zu untermauern.
In Zahlen
60 %: Ungefähr um den Gewinnanstieg von Google im ersten Quartal teilweise dank KI.
22: Gemini 1.5 Pro kann stundenlanges Audio analysieren.
1: Minuten benötigt Gemini 1.5 Flash um ein 14-minütiges Video zu analysieren.
20 %: Wie viel schneller ist Gemini 1.5 Flash im Vergleich zu ChatGPT-4o laut Google.
Dieser Inhalt wurde maschinell aus dem Originalmaterial übersetzt. Aufgrund der Nuancen der automatisierten Übersetzung können geringfügige Unterschiede bestehen. Für die Originalversion klicken Sie hier