Bilder mit KI erstellen – ein Kinderspiel?
Schon heute sind KI-generierte Bilder keine Seltenheit mehr. Doch wie gut sind solche Text-zu-Bild-Generatoren tatsächlich? Unsere Versuchsreihe mit Adobe Firefly zeigt, wie sich das KI-Tool im letzten Jahr verbessert hat – und was ihm nach wie vor Probleme bereitet.
Künstliche Intelligenz (KI) hat in den letzten Jahren enorme Fortschritte erzielt. Schon heute hilft KI uns bei der effizienten Verarbeitung grosser Datenmengen und löst selbst komplexe Aufgaben schneller und (oft) genauer als der Mensch. Egal, ob im Bereich Medizin, Verkehr, Bildung oder Unterhaltung: KI eröffnet uns in praktisch allen Branchen zahlreiche neue Möglichkeiten.
Eine davon ist die Verarbeitung von Bildern. So hat künstliche Intelligenz auch zu bedeutenden Fortschritten in der Bilderkennung, -klassifizierung und -bearbeitung geführt. Doch auch die Erstellung einzigartiger Bilder kann heute KI-Tools überlassen werden: Auf Basis von Textbefehlen und -vorgaben – sogenannten Prompts – kreieren sie für den Anwender neuartige Bilder, die sich oft kaum von tatsächlich geschossenen Fotografien unterscheiden lassen.
Foto vs. KI-Bild
Doch was ist überhaupt nötig, um solche Resultate zu erzielen? Wir wollten es herausfinden und mithilfe von KI ein Bild kreieren, das möglichst nahe an eine bereits bestehende Fotografie herankommt – nur durch die Eingabe von Prompts. Hierzu setzten wir auf die KI-gestützte Software «Firefly» von Adobe, mit der wir denselben Versuch schon im Juli 2023 unternommen hatten. Unser jetziger Test soll zeigen, wie sich die Möglichkeiten bei der textbasierten Bilderstellung in kurzer Zeit deutlich verbessert haben – und dass KI heute schon bessere und schnellere Ergebnisse liefert als noch vor knapp einem Jahr.
Als Vorlage für den Versuch diente uns folgendes Bild einer Alpen-Kuhschelle:
Sehen Sie nun in der Galerie, wie wir uns mit Textbefehlen in Adobe Firefly schrittweise an diese Fotografie angenähert haben – sowohl im Versuch vom letzten Jahr als auch im neuen Test:
Das Ergebnis
Das Endergebnis kann sich sowohl im letzten Jahr, als auch heute, nach dem nochmaligen Versuch, durchaus sehen lassen. Die mit Adobe Firefly erzeugten Bilder weisen schon eine verblüffende Ähnlichkeit zum Foto-Original auf.
Unser Versuch zeigt: Es ist tatsächlich möglich, bestehende Fotografien mit einem KI-Tool nachzubauen – mit realistisch anmutenden Resultaten. Auch sind die heutigen Ergebnisse mit Adobe Firefly schon deutlich besser als noch vor einem Jahr. Gerade einfach ist die Anwendung solcher Tools aber immer noch nicht: Um das gewünschte Resultat zu erzielen, müssen Anwender*innen der Software sehr viele und genaue Anweisungen und Begriffe liefern. Sonst hat das Tool einen zu grossen Interpretationsspielraum bei der Bildgenerierung.
Mit Risiken verbunden
Natürlich gibt es auch Risiken im Zusammenhang mit KI und Bildern. So können Algorithmen etwa voreingenommen sein, wenn die zugrundeliegenden Trainingsdaten eine Verzerrung aufweisen. Dies kann zu Diskriminierung oder Ungerechtigkeit in den Resultaten führen, insbesondere wenn die Tools in Bereichen wie Bewerbungsauswahl oder Strafverfolgung eingesetzt werden.
Ein weiteres Risiko besteht in der Fälschung von Bildern. Wie wir gesehen haben, kann KI durchaus verwendet werden, um gefälschte Inhalte zu erstellen, die für den Betrachter kaum von echten Bildern zu unterscheiden sind. Auch die Manipulation von bestehenden Bildern ist mit KI-gestützten Tools einfacher als je zuvor.
Wir sehen: Insgesamt birgt Künstliche Intelligenz im Bereich der Bildverarbeitung und -generierung grosses Potenzial – sofern man sich intensiv mit den entsprechenden Tools auseinandersetzt. Gleichzeitig müssen jedoch die Risiken und Herausforderungen, insbesondere in Bezug auf Voreingenommenheit und Fälschungen, sorgfältig angegangen werden, um sicherzustellen, dass KI verantwortungsvoll und ethisch eingesetzt wird.