KI-Video wird real

Aber was als Nächstes kommt, wird nicht so sein.

Für die Links auf dieser Seite können wir eine Provision verdienen.
Bild für Artikel mit dem Titel KI-Video wird real
Illustration: Getty (Getty Images)

Will Smiths Spaghetti-Essen ist zur seltsamsten Erfolgsgeschichte der Technologiebranche geworden.

Werbung

Im Jahr 2023 wurde ein KI-generiertes Video des Schauspielers Das Schlürfen von Nudeln ging aus den falschen Gründen viral. Der Clip, der von einem frühen KI-Modell namens ModelScope erstellt wurde, zeigte eine alptraumhafte Gestalt, die vage an Smith erinnerte und mit unmöglichen Handbewegungen und Gesichtsverzerrungen grotesk Nudeln zerstückelte. Es war so offensichtlich unecht und beunruhigend, dass Smith selbst parodierte es fast ein Jahr später machte er das KI-Versagen zu einem Meme.

Dieser schreckliche Pasta-Clip ist seitdem zu einem informellen Maßstab für den Fortschritt bei KI-Videos geworden – ein Standardtest, mit dem Entwickler und Forscher messen, wie weit die Technologie fortgeschritten ist. Er ist das KI-Video-Äquivalent dazu, einen Chatbot zu bitten, den LSAT-Test zu absolvieren oder eine Matheaufgabe zu lösen.

Werbung

Schneller Vorlauf zum letzten Monat, als Google stellte Veo 3 vor, sein neuestes Text-zu-Video-Modell, das eine überzeugende, sanft wirbelnde Linguine im Stil eines Will Smith-Doppelgängers erzeugen kann – komplett mit Kaugeräuschen. Das einzige Problem? Die KI denkt, Spaghetti würden Knirschgeräusche machen, wie das Essen von Kartoffelchips. Es ist ein kleiner Fehler, der verrät, wie weit wir in weniger als zwei Jahren gekommen sind, von der digitalen Horrorshow zur nahezu perfekten Nachahmung mit nur geringfügigen Audio-Macken.

Werbung

Die Entwicklung vom Spaghetti-Albtraum zum überzeugenden Deepfake erfolgte durch eine Reihe rasanter Durchbrüche im Jahr 2024. OpenAIs SORA, das Anfang des Jahres veröffentlicht wurde, könnte flüssige, filmische Aufnahmen, aber blieben stumm — im Wesentlichen hochwertige GIFs. Meta’s Movie Gen gefolgt von besserer Charakterkonsistenz über längere Clips. Googles Veo 2 verbessert auf beiden konnte aber immer noch keinen Ton erzeugen. Jedes Modell stellte einen schrittlichen Fortschritt dar, aber keines bereitete die Beobachter auf die plötzliche Integration von synchronisiertem Audio, realistischen Dialogen und Ambient-Soundeffekten in Veo 3 vor.

Werbung

Dies ist nicht der stetige technologische Fortschritt, den wir gewohnt sind. Es ist ein steiler Abgrund, der Experten, Filmemacher und die Gesellschaft vor große Schwierigkeiten stellt, zu verstehen, was gerade passiert ist. Der plötzliche Sprung von offensichtlich gefälschten KI-Videos zu nahezu ununterscheidbaren synthetischen Inhalten stellt einen der dramatischsten Fähigkeitssprünge der jüngeren Technologiegeschichte dar.

Ein Ort, an dem es angenommen wird, ist Hollywood. Medienmanager, die noch vor wenigen Jahren nervös im Konferenzpublikum saßen und sich Notizen über KI-Experimente machten, sind jetzt öffentlich über ihren aktiven Einsatz diskutiert dieser Tools. Amazon Studios sprach vor kurzem offen über die Integration generativer KI in seine kreativen Pipelines und zeichnete damit einen „Moment der Erkenntnis“, in dem die Technologie zu nützlich wurde, um sie zu ignorieren. Diese Veränderung macht Sinn: Wenn die täglichen Drehkosten in Los Angeles 200.000 Dollar erreichen und traditionelle VFX-Studios schließen, ist KI nicht nur Innovation – sie ist eine Überlebensfrage.

Werbung

Doch der eigentliche Umbruch findet nicht in den Vorstandsetagen der Studios statt. Er liegt in der vollständigen Demokratisierung der anspruchsvollen Videomanipulation. Was früher Teams von VFX-Künstlern, teure Software und Hollywood-Budgets erforderte, kann heute jeder mit 1,50 Dollar und einem Internetanschluss schaffen. Die Preisstruktur von Veo3 macht die Erstellung überzeugender Fake-Videos für praktisch jeden erschwinglich und reißt Barrieren nieder, die zuvor als natürlicher Schutz gegen weit verbreitete Medienmanipulation dienten.

Die Bedrohung für Bilder war bereits spürbar. Ab 2023 Tom Hanks hat wiederholt gewarnt Seine Instagram-Follower berichteten von KI-generierten Videos, in denen sein Bild fälschlicherweise verwendet wurde, um für Wunderheilmittel und Wundermittel zu werben. Das Heimatschutzministerium hat Folgendes identifiziert: Deepfakes als „zunehmende Bedrohung“, Er merkte an, dass synthetische Medien nicht besonders fortschrittlich sein müssen, um wirksam zu sein – sie müssen lediglich „die natürliche Neigung der Menschen ausnutzen, zu glauben, was sie sehen“. Dieser jüngste Sprung in der Videoqualität wird das Problem nur noch beschleunigen und Täuschungen billiger, schneller und zugänglicher machen.

Werbung

Die Technologie weist noch immer Einschränkungen auf. Während die im Internet kursierenden viralen Demos einwandfrei aussehen, tiefere Experimente offenbaren Veo3 hat Probleme mit der Konsistenz und ignoriert Eingabeaufforderungen oft vollständig. Die besten Modelle verfügen über Sicherheitsvorkehrungen, die es Ihnen nicht ermöglichen, Videos mit erkennbaren Personen zu erstellen. Doch das Tempo der Weiterentwicklung lässt darauf schließen, dass selbst aktuelle Macken bald überholt sein werden. Und Sicherheitsvorkehrungen können jederzeit abgebaut werden, sodass wir KI-generierte Inhalte erhalten, die funktional nicht mehr von der Realität zu unterscheiden sind.

Die Frage ist nicht, ob wir dem, was wir sehen und hören, noch vertrauen können, sondern ob wir demjenigen vertrauen können, der es uns zeigt. In einer Zeit, in der anspruchsvolle Videomanipulation weniger kostet als ein Kaffee, wird Glaubwürdigkeit nicht mehr im Medium, sondern im Überbringer verankert. Die plötzliche Reifung der KI-Videotechnologie hat das, was viele als eine jahrzehntelange gesellschaftliche Anpassung erwartet hatten, zu einer unmittelbaren Verifizierungskrise komprimiert und zwingt uns, Vertrauenssysteme neu aufzubauen, die davon ausgingen, dass Sehen Glauben bedeutet.

Werbung

—Jackie Snow, beitragende Redakteurin

Dieser Inhalt wurde maschinell aus dem Originalmaterial übersetzt. Aufgrund der Nuancen der automatisierten Übersetzung können geringfügige Unterschiede bestehen. Für die Originalversion klicken Sie hier

Werbung