Swissfuture Magazin “Augmented Creativity – KI im kreativen Prozess”

Artikel

 
 

Artikel

swissfuture «Design»

Die aktuelle Ausgabe des swissfuture Magazins widmet sich dem Thema Design. Grit hat dazu den Artikel «KI im kreativen Prozess» beigesteuert.

Besonderer Dank an diese Stelle an Cedric Kiefer von onformative für die Bereitstellung der Videostills.

swissfuture Magazin für Zukünfte 01-02/23
Chefredakteurin: Larissa Holaschke

 
 

 
 

Keywords: Künstliche Intelligenz, KI, Kreativwirtschaft, Kreativität, Algorithmen

Augmented Creativity: KI im kreativen Prozess

Grit Wolany

Künstliche Intelligenz entwickelt sich zur omnipräsenten Schlüsseltechnologie. Auch in der Kreativbranche haben die smarten Algorithmen bereits Einzug gehalten. Die Anwendungen sind vielseitig. KI automatisiert nicht nur bestehende Arbeitsabläufe, sondern ermöglicht völlig neue Formen der kreativen Zusammenarbeit zwischen Mensch und Maschine. Algorithmen werden zu co-kreativen Sparring-Partnern, die Kreativschaffende tatkräftig im Kreations- und Produktionsprozess unterstützen. Sie sorgen nicht nur für schnellere Abläufe, textliche Inputs oder neue visuelle Welten, sondern machen auch Stereotypen, Biases und unzureichende Datenqualität sichtbar.

 

In den vergangenen Wochen und Monaten verging kaum ein Tag, an dem nicht über erstaunliche Entwicklungen auf dem Gebiet der Künstlichen Intelligenz (KI) berichtet wurde. Nun sind Automatisierung und der Einsatz von Machine-Learning-Algorithmen an sich nichts Neues. «Artificial Intelligence» als akademisches Forschungsgebiet existiert seit 1956. Überraschend ist jedoch die Geschwindigkeit, mit der KI gerade auch in kreativen Bereichen Einzug hält. Hiess es vor ein paar Jahren noch, kreative Tätigkeiten wären vor der Automatisierung sicher, so sieht die Realität mittlerweile anders aus.

KI ist längst auch im Kreativumfeld angekommen. Sie generiert Bilder, Sounds, Code, Videos, Animationen und 3D-Texturen. Sie bearbeitet Fotos und ändert Parameter wie Jahreszeiten, Alter, Frisuren oder Gesichtsausdrücke auf Knopfdruck. Sie verfolgt Augen-, Hand- oder Körperbewegungen. Sie passt Basis-Layouts an verschiedenste Formate an und ermöglicht Bildoptimierungen. Sie übersetzt lange und kurze Texte in unzählige Sprachen, schreibt Blogbeiträge, Headlines und Texte für Suchmaschinen; manchmal sogar Schulaufsätze. Sie spielt Werbeanzeigen aus und empfiehlt uns Filme, Podcasts und Musik. Und als Deepfake sorgt sie dafür, dass synthetische Bilder täuschend echt wirken und wir unseren Augen und Ohren nicht mehr trauen können. Das Spektrum von KI-basierten Anwendungen ist so breit und vielseitig wie die Kreativwirtschaft selbst (Abb. 1). Bei dieser Vielzahl wird schnell klar, dass man nicht von «der KI» im Allgemeinen sprechen kann. Im Gegenteil: Es gibt unzählige unterschiedliche KIs, die jeweils in ganz spezifischen Aufgabenbereichen eingesetzt werden.

 
 

Abbildung 1: Übersicht von auf KI-basierenden kreativen Anwendungen nach Anantrasirichai und Bull (2021), Darstellung: Grit Wolany

 
 
 

Aber warum ist KI plötzlich so omnipräsent? Auf technologischer Seite verdanken wir die sprunghaften Entwicklungen der letzten Jahre vor allem der gesteigerten Leistungsfähigkeit der Computer, den verbesserten und erschwinglich gewordenen Grafikprozessoren sowie den enormen Datenmengen, welche durch Internet und Digitalisierung mittlerweile vorhanden sind. Dank dieser Voraussetzungen konnte das Deep Learning – eine spezielle Form des Machine Learnings, bei welcher Algorithmen dynamisch nach dem «Trial & Error»-Prinzip lernen – erstaunliche Fortschritte machen (Abb. 2).

 
 
 

Abbildung 2: KI wird rasant besser. Der Prompt «An illustrative portrait of Barack Obama» – links Snowpixel AI im September 2021, rechts Midjourney AI im November 2022. Bilder: Grit Wolany

 
 
 

Auf der soziokulturellen Seite haben wir eine digitalisierte und vernetzte «Always On»-Gesellschaft, in welcher Menschen täglich Unmengen an Informationen ausgesetzt sind. Prägend für diese «Attention Economy» sind die stark bildlastigen Kommunikationsformen – plakative Visuals on- und offline, Videos, Memes, Stories, Image-Posts. Schnell erfassbar und einfach konsumierbar führt der Visual Zeitgeist zu einer wahren Bilderflut. Diese Informationsüberpräsenz verlangt nach neuen Technologien, Services und Produkten – entweder um das Informations-Chaos überhaupt bewältigen zu können oder um mit dem Wachstum an medialen Kanälen und dem dadurch zunehmenden Content-Hunger Schritt zu halten. In kürzerer Zeit müssen regelmässig viel mehr Inhalte produziert werden, oft mit viel geringerem Budget.

Deshalb kommen immer häufiger KI-basierte Tools zum Einsatz. Aber um diese überhaupt entwickeln zu können, müssen Arbeitsprozesse zunächst standardisiert und systematisiert werden.

 

Die Standardisierung und Systematisierung von Arbeit

Richard und Daniel Susskind untersuchten diese Entwicklung in ihrem Buch The Future Of Profession (2015) genauer und entwickelten das evolutionäre Modell der «Commodation of Professional Work» (Abb. 3). Es geht davon aus, dass «professionelle Routine-Tätigkeiten in den meisten Disziplinen auf eine Reihe von Standardpraktiken reduziert werden können. [Das bedeutet, dass] Aufgaben, die früher menschliche Expert:innen erforderten, jetzt von weniger sachkundigen Personen, sogar Laien, mit Unterstützung geeigneter Prozesse und Systeme durchgeführt werden können» (Susskind & Susskind 2015: 196).

Am Ende dieser Evolution stehen oft smarte Tools oder Services, die gratis oder nur für geringe finanzielle Beträge Aufgaben übernehmen, für die es früher professionell ausgebildeter Fachpersonen bedurfte.

Auch in der Kreativwirtschaft ist diese Entwicklung bereits in vollem Gange. War beispielsweise der Film- und Videoschnitt vor einiger Zeit nur mit entsprechender Ausbildung und Zugang zu teurem Equipment möglich, kann heute jede:r mit einem Smartphone nach Belieben Filme machen und schneiden. Gleiches gilt für Fotografie, Bildbearbeitung oder Designleistungen. Es gibt immer mehr Automatisierungstools auf dem Markt, die auch von Laien bedient werden können und professionell anmutende Ergebnisse liefern.

 
 
 

Abbildung 3: Die Evolution der professionellen Arbeit nach Susskind & Susskind (2015), Darstellung: Grit Wolany

 
 
 

Besserkönner statt Besserwisser

Doch nicht nur Amateure profitieren von dieser Entwicklung. Beinahe 75 % der Arbeitszeit verbringen Kreative mit nicht-kreativen Tätigkeiten (Pfeiffer 2020). Es verwundert nicht, dass KI-Applikationen, welche sie bei Administration und eintönigen Routineaufgaben unterstützen, willkommen sind. Sogenannte «Smart Assistants» helfen bei Administration und Projektmanagement genauso wie bei automatischen Transkriptionen und Übersetzungen von Texten. Schreibprogramme prüfen Grammatik, Satzbau sowie Tonalität eines Textes und unterbreiten Verbesserungsvorschläge. KI hilft aber auch beim Recherchieren, Sammeln, Kategorisieren und Analysieren von Informationen.

«Creative Co-Bots» sind algorithmusbasierte Co-Worker, die uns «hands-on» im Kreations- und Produktionsprozess unterstützen. KI-Tools, die beispielsweise für Text-, Bild- oder Soundgenerierung eingesetzt werden oder die in Produktionsprozessen Aufgaben wie Bildverbesserung, Resizing, Kolorierung, Inpainting, Animation oder Special Effects (VFX) übernehmen. Die Firma Colourlab.ai, die KI-basierte Lösungen für Film- und Videoediting herstellt, verwendet die Formulierung «Timeline Intelligence». Der Begriff zeigt, dass es sich weniger um «künstliche Besserwisser» als um «praktische Besserkönner» handelt. Es sind unsichtbare Helfer, die klar definierte Aufgaben übernehmen, so Zeit einsparen, das Arbeiten angenehmer machen und kreative Workflows optimieren – ganz nach dem Motto «Work smarter, not harder».

 
 
 

Prompt-Crafting und künstliche Musen

Als «Künstliche Musen» bezeichne ich eine Sonderform der Creative Co-Bots. Es sind KI-Programme, die bewusst als Inspirationsmaschinen zu Beginn des kreativen Prozesses eingesetzt werden und mit ihrem Output die Kreativität und das Denken ihres menschlichen Gegenübers anregen sollen. So kann eine Text-KI mögliche Storylines vorlegen oder mit einigen vorgeschriebenen Zeilen die Angst vor dem leeren Blatt nehmen. Bild-KIs können unerwartete und ungesehene Visuals liefern, welche als Sprungbretter für den weiteren Kreationsprozess dienen. Wenige Wörter reichen, um völlig neue Bildwelten zu erschaffen.

Die sogenannten «Prompts» – kurze «KI-Briefings» in Text- oder Bildform – sind der Schlüssel zur Generierung von Bildern, Texten, Sounds, Videos, Animationen, Color Gradings oder Code. Prompts werden diskutiert, geteilt, verkauft, gestohlen. Ob dieser neue Prozess des «Prompt Craftings» (auch Prompt Engineering oder Prompt Design genannt) überhaupt als eine kreativ-schöpferische Tätigkeit gesehen werden kann, wird in den sozialen Medien lebhaft diskutiert. Für die einen ist es klar eine Form von Creative Direction, ähnlich den Regieanweisungen in Kunst oder Film. Man bestimmt die kreative Stossrichtung und formuliert, was ausgedrückt werden soll. Nur sind es eben nicht Schauspieler:innen oder Assistierende von Künstler:innen, welche die kreative Vision zum Leben erwecken, sondern Computeralgorithmen. Die zweifelnden Stimmen argumentieren, dass die Maschinen auf Knopfdruck bereits Bestehendes nur neu kombinieren und deshalb einzelne, schnell eingegebene Stichwörter einer «echten» künstlerischen Tätigkeit nicht gerecht werden. Klar ist jedoch, Wissen ist Macht und verschafft in der neuen Remix- Culture der Künstlichen Intelligenz wesentliche Vorteile. Wer mehr weiss, kann bessere Inputs geben. Sprache wird zu einem Werkzeug, welches neue visuelle Welten gestaltet (Abb. 4).

Es wird deutlich, dass der Mensch ein unersetzlicher Teil des kreativen Prozesses bleibt, auch wenn die Kreation teilweise von Algorithmen übernommen wird. Die kreative Vision und Idee, die bewusste Auswahl der KI-Tools, teilweise auch der Trainingsdaten, die Vorgabe des Inputs, die Auswahl und Weiter-Optimierung der ersten generierten KI-Ergebnisse sowie auch die finale Beendigung des generativen Kreationsprozesses liegen beim Menschen. Er trifft die Entscheidungen und lässt sich dabei von seiner Neugier, seinem Wissen und seiner Intuition leiten.

 
 
 

Abbildung 4: Beispiele aus dem aktuellen AI Design Research Projekt der Autorin.

 
 
 

KI als Spiegelbild der Gesellschaft

Ein Blick in die sozialen Kanäle lohnt sich. Auf Discord, Reddit, Instagram, Twitter, TikTok und LinkedIn teilen KI-Begeisterte ihre Werke. In kürzester Zeit bilden sich regelrechte Subkulturen; Communities, die Wissen austauschen, kollektiv die Möglichkeiten und Grenzen der KI-Modelle austesten und diese so gemeinsam mit den IT-Expert:innen weiterentwickeln. Dieser globale Austausch, die co-kreative Zusammenarbeit über Länder- und Sprachgrenzen sowie Zeitzonen hinweg, das bereitwillige Teilen von Wissen sind faszinierend zu beobachten und eröffnen einen Blick auf morgen.

Die user-generierten Bildwelten (Abb. 5) verraten aber auch viel über unsere Gesellschaft. Gamifizierung, Hypersexualisierung, Jugendwahn. KI hält unserer Gesellschaft im wahrsten Sinne des Wortes den Spiegel vor. Sie entlarvt eiskalt die Lücken in Trainingsdaten und Weltbildern. Plötzlich werden systemische Vorurteile, statistische Verzerrungen und menschliche Biases (Schwartz et al. 2022) wahrnehmbar gemacht (Abb. 6).

Diese Sichtbarkeit – oder eher Unsichtbarkeit – fällt auf und kann dadurch benannt und verändert werden. So finden sich im Midjourney-Kommunikationstool Discord neben Themenkanälen wie «Monster/creatures», «Cyberpunk» und «Gods and Goddesses» plötzlich auch «Black, Indigenous & People of Color» oder «Awesome Old Women» mit dem entsprechenden Bildmaterial.

 
 
 

Abbildung 5: Crowd-Kitsch – Galerie der Webseite Arthub.ai (2022), auf welcher Stable Diffusion Anwender ihre Kreationen teilen.

 
 
 

Abbildung 6: Screenshots aus einem Video, in welchem untersucht wurde, wie KI Alter interpretiert. Es zeigte sich eine deutliche Lücke im Bereich 40 bis 50 Jahre (onformative, 2022)

 
 
 

KI-Kompetenz wird Pflicht

Der Boom von Generative Tech etabliert neue Formen co-kreativer Zusammenarbeit. Einerseits zwischen Menschen, aber auch zwischen Menschen und Maschinen. Jeder wird früher oder später mit KI-generierten Medien interagieren. Bewusst oder unbewusst. Als Creator oder als Konsument:in. Es ist daher für alle wichtig, «AI Literacy», also ein Grundverständnis über die Funktionsweise, Möglichkeiten und Gefahren von KI zu erlangen. Eine verantwortungsvolle Nutzung dieser Tools bedingt auch die Auseinandersetzung mit ethischen Aspekten der KI, denn die Gefahren von Manipulation und Missbrauch sind gegeben.

Und doch möchte ich die Leser:innen dazu ermutigen, sich spielerisch, frei und ungezwungen mit den neuen technologischen Möglichkeiten auseinanderzusetzen. Statt sich in endlosen Diskussionen über die Schöpfungskraft von KI zu verlieren, warum nicht gemeinsam mit den Algorithmen etwas erschaffen? Oder ganz einfach langweilige Routinetätigkeiten an die Maschinen delegieren?

 
 
 

KI ändert alles – und KI ändert nichts

KI wird, wie einst Elektrizität, alle Lebensbereiche durchdringen. Und natürlich wird diese Entwicklung auch das kreative Schaffen beeinflussen – mit neuen Werkzeugen, neuen Arbeitsprozessen, neuen Tätigkeiten und neuen Beteiligten. Zentral bleiben weiterhin der Mensch und die unbändige Stärke seiner Kreativität. Diese Kreativität öffnet neue Räume, verschiebt Grenzen und fordert den Status Quo heraus. Das bedeutet, sich auf Neues, Unbekanntes oder Ungewohntes einzulassen. Zu experimentieren. Zu entdecken. Zu scheitern. Und weiterzumachen.

Eine KI ist ein Werkzeug – und immer nur so gut wie der Mensch, der sie bedient.

 
 
 
 

Starthilfe für KI-Neugierige: Wer jetzt selbst mit Künstlicher Intelligenz experimentieren möchte, bekommt auf diesem Research Board einen Überblick zu Kursen, Text- und Bild-KI-Tools und Artikelsammlungen: tinyurl.com/SwissfutureKI

 
 
 

Referenzen

Anantrasirichai, N. & Bull, D. (2021): Artificial intelligence in the creative industries: a review, in: Artificial Intelligence Review, 55(1), 589–656. https://doi.org/10.1007/s10462- 021-10039-7

Onformative [@onformative]. (2022, 7. August): Further exploration of AI-generated portraits.  [Tweet]. Twitter. https://twitter.com/onformative/status/1556271736357883907

Pfeiffer, A. (2018, November): Creativity and technology in the age of AI. Pfeiffer Report. https://www.pfeifferreport.com/essays/ creativity-and-technology-in-the-age-of- ai/ (abgerufen am 29. März 2022).

Schwartz, R., Vassilev, A., Greene, K., Perine, L., Burt, A. & Hall, P. (2022): Towards a Standard for Identifying and Managing Bias in Artificial Intelligence. NIST. https://doi.org/ 10.6028/nist.sp.1270

Susskind, R. & Susskind, D. (2015): The Future of the Professions: How Technology Will Transform the Work of Human Experts. Oxford University Press.

 

Abbildungen:


Abb. 1, 2, 3, 4 Grit Wolany

Abb. 5 Screenshot https://arthub.ai, abgerufen am 13. November 2022

Abb. 6 Videostills «Further exploration of AI-generated portraits.» onformative & Stable Diffusion [Tweet]. Twitter. https:/twitter.com/onformative/status/1556271736357883907

 

Anmerkung: Aus Platzgründen konnten im gedruckten Magazin leider nur die Abb. 1 und 3 integriert werden.