Der Mathematiker Clive Humby zuerst gesagt 2006 sagte man , „Daten sind das neue Öl“: wertvoll, aber unbrauchbar, wenn sie nicht raffiniert werden. Ähnlich wie Öl haben auch Daten ein synthetisches Gegenstück, das die Zukunft der künstlichen Intelligenz antreiben wird, so Gretel-Mitbegründer und CTO John Myers.
„Ich denke, synthetische Daten werden im Grunde der Treibstoff sein, der die Entwicklung von KI-Systemen und insbesondere der darin enthaltenen Daten vorantreibt“, sagte Myers in der neuesten Folge von Quartz AI Factor, einer Videoserie, die auf der Nasdaq MarketSite spielt (NDAQ).
Gretel stellt Unternehmen synthetische Daten zur Verfügung, um KI- und Maschinelles-Lernen-Modelle zu verbessern. Daten bilden die Grundlage für die Entwicklung von Systemen und das Training von Modellen, um KI bei jeder Verwendung intelligenter und effektiver zu machen.
„Ich betrachte synthetisches Öl sehr ähnlich“, sagte er. „Jeder, der heute ein Auto fährt, verwendet synthetisches Öl. Sie wissen einfach, dass es ein bisschen wie echtes Öl ist, aber es wird hergestellt und verfügt über garantierte Eigenschaften, die sicherstellen, dass der Motor reibungslos läuft.“
Synthetische Daten funktionieren auf ganz ähnliche Weise. Es gibt zwei Möglichkeiten, synthetische Daten zu erstellen. Die erste besteht darin, vorhandene Daten zu nehmen und sie für die Verwendung sicher zu machen – das heißt, das Volumen zu reduzieren, sie portierbar zu machen und Datenschutzrisiken auszuschließen, erläuterte Myers. Die andere besteht darin, sie „von Grund auf“ zu erstellen, sagte er, und Daten zu generieren, die nicht existieren, um Probleme zu lösen und neue Produkte zu entwickeln.
Das Beratungsunternehmen Gartner hat geschätzt dass bis 2024 60% der für KI und Analyse verwendeten Daten synthetisch generiert werden werden. Der Markt für die generierung synthetischer Daten ist prognostiziert Laut BCC Research soll von 381,3 Millionen Dollar im Jahr 2022 auf 2,1 Milliarden Dollar im Jahr 2028 ansteigen.
Datenschutz ist eines der größten Verkaufsargumente für synthetische Daten, insbesondere in stark regulierten Sektoren wie dem Finanzdienstleistungs- und Gesundheitssektor, in denen viele sensible persönliche Informationen verarbeitet werden. Synthetische Daten können aber auch dabei helfen, Lücken zu schließen, wo es an Daten aus der realen Welt mangelt, und organisch produzierte Daten zu ergänzen, die veraltet oder von schlechter Qualität sind.
Myers geht jedoch nicht davon aus, dass synthetische Daten die Rohdaten ersetzen werden. Vielmehr werden sie als Ergänzung zu realen Daten und Aufzeichnungen dienen.
„Ich denke, Sie werden feststellen, dass es eine ziemlich große Grenze geben wird, die besagt: Wenn wir Anwendungen erstellen oder diese Daten nutzen möchten, nehmen wir eine synthetische Version dieser Daten und verwenden diese“, sagte Myers. „Und dort werden dann Ihre Anwendungen auf Unternehmensebene erstellt, während die Rohdaten verwendet werden, um sie zu synthetischen Daten zu verfeinern.“
Sehen Sie sich oben die neueste Folge von Quartz AI Factor an.
Dieser Inhalt wurde maschinell aus dem Originalmaterial übersetzt. Aufgrund der Nuancen der automatisierten Übersetzung können geringfügige Unterschiede bestehen. Für die Originalversion klicken Sie hier