OpenAI mit einem gemeinsamen Problem konfrontiert für KI-Bildgeneratoren als es eine breite Veröffentlichung einer neue Bearbeitungsfunktion für ChatGPTs DALL-E diesen Monat. Oftmals verstehen KI-Bildgeneratoren falsch, was Sie erstellen möchten. Daher ermöglicht das neue Tool von OpenAI Ihnen , Abschnitte Ihres Bildes hervorzuheben und sie nach Ihren Vorgaben zu ändern. Das Tool klingt in der Theorie großartig, aber in der Praxis lässt es zu wünschen zu lassen.
Gizmodo hat ein paar Tests mit dem neuen Editiertool von DALL-E durchgeführt, das sehr ähnlich ist zu Generative Füllfunktion von Adobe Photoshop, Firefly. Obwohl DALL-E von OpenAI einer der besten KI-Bildgeneratoren auf dem Markt ist, ist das Bearbeitungstool etwas enttäuschend. Idealerweise sollte ein Fotobearbeitungstool es Ihnen ermöglichen, die Dinge in einem Bild zu ändern, die falsch sind. Wir haben überwiegend festgestellt, dass das Bearbeitungstool von DALL-E das Gewünschte weigert oder einfach nicht liefert. In einigen Fällen ruiniert es das Foto komplett.
Das Tool hebt einen wichtigen limitierenden Faktor für KI-Bildgeneratoren hervor: Sie haben keine Ahnung, was zum Teufel sie machen. Als ich einmal die Bearbeitungsfunktion von DALL-E verwendete, teilte mir ChatGPT mit: „Leider kann ich Bilder nicht direkt bearbeiten oder bestimmte Elemente darin ändern.“ Das liegt daran, dass die KI nicht weiß, was sie gemacht hat. Sie kann nicht erkennen, ob es einen Vordergrund, einen Hintergrund gibt oder was ein von ihr erstelltes Zeichen aussagt.
Die Bearbeitungsfunktion „bearbeitet“ das Foto also überhaupt nicht wirklich. Tatsächlich bearbeitet sie Ihre Eingabeaufforderung und generiert jedes Mal in dem von Ihnen angegebenen Bereich ein neues Foto. Das Ergebnis ist, dass die Bearbeitungsfunktion von DALL-E Ihnen nicht die Präzision und Kontrolle ermöglicht, die Sie von einem Bearbeitungstool erwarten würden.
Sie müssen die Einschränkungen von DALL-E verstehen, um das Bearbeitungstool verwenden zu können. Um das Optimum daraus herauszuholen, müssen Sie wirklich klare Anweisungen verwenden und nur um relativ einfache Änderungen fordern. Jemandem eine Geburtstagsmütze aufzusetzen, eine Szene von Tag auf Nacht zu verwandeln oder andere einfache Änderungen funktionierten in unseren Tests regelmäßig, kompliziertere Änderungen jedoch nicht.
Fairerweise muss man sagen, dass dies derzeit bei allen Bearbeitungstools von KI-Bildgeneratoren der Fall ist. Sie generieren jedes Mal etwas Neues, und das kann Ihr Bild verzerren. Obwohl der Editor unter eingeschränkten Umständen funktioniert, bietet er nicht die Anpassungsmöglichkeiten, die Sie sich vielleicht wünschen. Hier sind unsere Testläufe mit dem Bildeditor von DALL-E.