Bilder, vom Roboter gemalt!
Wir haben für diesen Text ein mit KI generiertes Bild erstellt und hierfür unser Wahrzeichen, den Stuttgarter Fernsehturm, durch den Eiffelturm ersetzt. Aus einem kurzen Beschreibungstext, einigen voreingestellten Bild-Parametern, dem gewünschten Stil oder einer Fotovorlage wird in kürze ein völlig neues Bild gezaubert, ohne die Drohne aus dem Schrank holen zu müssen und in Photoshop stempeln zu müssen. Das Bild wurde erstellt mit beta.dreamstudio.ai
Zwei sehr gelungene Beispiele für KI generierte Bilder sind unserer Meinung nach „a photograph of an astronaut riding a horse“ oder „A Shiba Inu dog wearing a beret and black turtleneck“. Und im Instagram-Kanal von Dall-E sind spannende Ergebnisse zu sehen: https://www.instagram.com/openaidalle
KI lernt und lernt und lernt
Wie bei allen KI-Systemen (siehe Chat GPT) liegt ihr Geheimnis vor allem darin, dass sie unglaublich lange, schnell und viel lernen. Das zeigen die Projekte von Dall-E, Midjourney oder Stable Diffusion. Sie durchforsten Internet-Datenbanken, analysieren Bilder und deren Metadaten, Instagram-Profile, Twitter, Stockphoto-Datenbanken, Blogs usw.
Wenn der/die Fotograf:in zu einem Bild geschrieben hat, dass es am Stuttgarter Fernsehturm mit der Kamera einer Drohne aufgenommen wurde, dann nimmt die KI diese Information zur Kenntnis und wertet sie aus.
Je nachdem, wie aussagekräftig und korrekt die Metaangabe ist, hilft es der KI später bei der Erstellung der KI-Kunst. Der Schwachpunkt ist, dass die Information auch falsch sein kann. Wenn das Bild tatsächlich in Paris und nicht in Stuttgart aufgenommen wurde, kann es sein, dass die KI später ein Bild produziert, das Stuttgart darstellen soll, aber tatsächlich den Eiffelturm zeigt. Aber das ist sicher nicht das größte Problem dieser Technik.
Probleme und Fragen
Zum Thema „Urheberrecht“ und „Copyright“ wird es sicherlich noch viele Gerichtsurteile geben müssen, um hier Rechtssicherheit zu bekommen. Einerseits sagen die Juristen, solange die Quelle, also wie in unserem Artikel die Website beta.dreamstudio.ai, genannt wird, ist alles in Ordnung. Aber was würde der Ersteller des verwendeten Stils sagen, wenn man diesen in einem neuen Bild einfach „kopiert“? Bei den Bildagenturen herrscht derzeit Wildwest-Stimmung. Die einen klagen gegen KI-Projekte, die anderen wollen damit Geld verdienen. Wahrscheinlich ist beides möglich…
Wieder andere sehen das „Ende der Kunst“ gekommen. Gerät der Anspruch an eine kreative Bildsprache verloren oder werden Illustratoren gar arbeitslos? Wird Fotografie durch KI ersetzt? Prognosen sind wie immer schwierig, vor allem, wenn sie die Zukunft betreffen.
Wer mit den bestehenden Systemen spielt, stellt jedoch schnell fest, dass die Ergebnisse nicht selten fragwürdig, seltsam oder schlicht falsch sind. Unser Stuttgarter Eiffelturm weißt zum Beispiel den ein oder anderen Konstruktionsfehler auf, und so manches Element wird wild im Bild angeordnet. In anderen Fällen haben Menschen zu viele oder zu wenige Hände oder Tiere haben mehrere Köpfe. In den folgenden, auch mit beta.dreamstudio.ai erstellten Bildern, werden solche Schwachstellen deutlicher. Die Bilder wurden mit den selben Beschreibungstexten, aber unterschiedlichen Stilen gerendert.
Außerdem interpretiert die KI meinen Text oft anders, als ich es mir vorgestellt habe. Ich kann einen bestehenden Vorschlag der KI beispielsweise (noch) nicht verändern, indem ich Aspekte hinzufüge oder wegnehme. Die KI interpretiert immer wieder neu. Das macht die Ergebnisse derzeit zu beliebig.
Interessant finde ich einen Hinweis im unten genannten Artikel von Heise: Für die Artikelserie zum Thema habe man sich für die Arbeit eines menschlichen Illustrators entschieden, weil man 4 Bilder im gleichen Stil und inhaltlichen Zusammenhang verwenden wollte. Eine solche „Serie“ ist mit KI derzeit nicht machbar. Natürlich können die Regeln und Möglichkeiten morgen schon anders sein. Aber im Moment scheinen wir weit davon entfernt.
Und Adobe?
Adobe verfügt über eine eigene „künstliche Intelligenz“ namens „Sensei“. Diese wird allerdings nur zur Unterstützung von Bearbeitungsschritten, und nicht zur Erzeugung von Bildern eingesetzt. Es gibt jedoch PlugIns, beispielsweise für Photoshop, mit denen man die entsprechenden Portale direkt aus dem Programm heraus ansteuern kann.
Die tolle, informative Artikelreihe in der c´t Ausgabe 25/2022 findest du hier oder im dazu passenden Podcast von Heise.
Auch automatisierte Lösungen sind denkbar
Ein automatisierter, Hotfolder-basierter Flow speziell für Deine Zwecke wäre natürlich möglich. Unsere „künstliche Intelligenz“ maxi.satzkiste.de könnte solche Bilder erstellen, und direkt in Bilddatenbanken einspeisen. Interesse?
FAZIT
Wir finden das Thema natürlich hochinteressant. Auch in der Satzkiste möchten wir die Technik zukünftig mehr und mehr zum Einsatz bringen. Vorerst sollen Blogbeiträge verstärkt durch Bilder, die von KIs erstellt wurden, angereichert werden, und weniger durch die nichtssagenden Bilder aus der Stock-Photo-Hölle unterfüttert werden. Damit wollen wir illustrative Bilder nutzen, die den Beitrag nicht nur grafisch aufbereiten, sondern auch besser zum Thema führen.
Welche Relevanz diese Technik für uns gesellschaftlich haben wird, wird man wie immer erst im Rückspiegel sehen.
Christoph Steffens