Artificial Intelligence
Künstlich intelligente Bilderwelt
Andreas Müller-Pohle
[English | Polish | Slovenian| Chinese]
Die größte Transformation unserer Zeit ist die von der natürlichen zur künstlichen Intelligenz – ein epochaler Vorgang, in dessen Zentrum ein ebenso altvertrautes wie vertrauenswürdiges Medium steht: die Fotografie.
Es war eine drastische Warnung, mit der das Center for AI Safety, eine gemeinnützige Forschungseinrichtung mit Sitz in San Francisco, die Öffentlichkeit aufschreckte: Der Gefahr der „Auslöschung durch künstliche Intelligenz“ müsse weltweit die gleiche Priorität eingeräumt werden wie Pandemien oder einem Atomkrieg. Hunderte renommierte Fachleute schlossen sich der Erklärung an, darunter Geoffrey Hinton, einer der Pioniere des Deep Learning, der kurz zuvor seine langjährige Zusammenarbeit mit Google beendet hatte, um fortan frei über die existentiellen Gefahren der künstlichen Intelligenz sprechen zu können. Das war im Mai 2023.
Mahner und Beschwichtiger
Hinton ist einer der profiliertesten Mahner vor den Bedrohungen einer Technologie, die im Gewand harmloser Text- und Bildschöpfungen daherkommt – und die doch das Zeug hat, so ziemlich alles auf den Kopf zu stellen, was unser abendländisches Wertesystem ausmacht. Man muss dazu gar nicht in die ferne Zukunft blicken, es genügt, sich die Dynamik der Gegenwart vor Augen zu führen. Und die ist verwirrend genug. Hier stehen den Mahnern die Beschwichtiger gegenüber, die alles für einen Hype, eine vorübergehende Welle oder auch nur einen Rülpser der digitalen Revolution halten, die doch schon mehr als drei Jahrzehnte zurückliege und uns keine Angst mehr zu machen brauche.
Wieso sollten wir sie auch fürchten? Künstliche Intelligenz steckt schon jetzt in fast jedem Gerät, in jeder anspruchsvollen Softwareanwendung, sie ist aus kaum einem technologisch relevanten Bereich der Gesellschaft mehr wegzudenken. Ob in der medizinischen Diagnostik, in der Sprachverarbeitung oder in der Industrierobotik – sie hilft uns im Alltag wie im Arbeitsleben, doch sie ist getarnt, wie ein Virus, das sich schleichend ausbreitet und nicht ruht, bis es den befallenen Körper vollständig unter Kontrolle hat.
Weltweites Aufsehen erregte Ende 2022 die Veröffentlichung von ChatGPT, einem Programm, das aus Myriaden vorhandener Trainingsdaten Sprache erzeugen kann – nicht im Sinne eines wie immer gearteten semantischen Verstehens, sondern rein formal und statistisch entlang gelernter syntaktischer Strukturen. Seither schießen künstlich intelligente Texte wie Pilze aus dem Boden, wobei Mail- oder Geschäftsanwendungen noch die am wenigsten interessanten sind. Schon werden Romane damit geschrieben oder Gedichte. Ja, sogar Theaterstücke.
Die Welt der Bilder war Monate zuvor von intelligenten Generatoren wie DALL-E 2, Midjourney und Stable Diffusion erschüttert worden, mit denen sich Bilder durch Texteingaben, so genannten Prompts, erzeugen lassen. Und auch Video- und Soundgeneratoren sind unterwegs, das Universum der Sinne zu erobern – Dutzende Programme und Tools, verblüffend und verstörend schon jetzt und doch erst in den ersten Stadien ihrer Entwicklung.
Dass die künstliche Intelligenz, deren Geschichte bis in die Mitte des vorigen Jahrhunderts zurückreicht, erst jetzt und mit aller Wucht über uns hereinbricht, hat vor allem mit drei Faktoren zu tun: der Verfügbarkeit gigantischer Datenmengen (Big Data) als Produkte der sozialen Medien, des Onlinehandels und anderer Bereiche; der rasanten Steigerung der Hardwareleistung, ermöglicht durch neue Grafikprozessoren und Speichertechnologien; und den Fortschritten im Bereich des maschinellen Lernens, insbesondere des Deep Learning.
Super-Black-Box
Es sind vor allem die Fortschritte der selbstlernenden Systeme, denen sich die derzeitige exponentielle Entwicklung der künstlichen Intelligenz verdankt, Systeme, die ihre Leistung aufgrund ihrer Erfahrungen ständig verbessern können und sich dadurch selbst beschleunigen, mit unabsehbaren Folgen für die Beherrschbarkeit der in Gang gesetzten Prozesse.
Die schier grenzenlose Komplexität neuronaler Netze und das eskalierende Tempo der sie antreibenden Forschung machen die künstliche Intelligenz zu einer Black Box neuer Qualität. Schon ihr Prototyp, der Fotoapparat, war eine nur mit technologischem Wissen verständliche Camera obscura. Der Computer, die nächste Stufe, verdunkelte sein Inneres im Schatten von Codes, die allein von ihren Programmierern, dieser neuen Klasse von Literaten und Schriftgelehrten, beherrscht wurde. Und die künstliche Intelligenz? Sie funktioniert, doch selbst ihre Schöpfer verstehen nicht mehr gänzlich, wie und warum: eine Super-Black-Box.
In vielen Bereichen spielt dies keine Rolle, in anderen eine existentielle, etwa beim autonomen Fahren. Entscheidungen über Leben und Tod, im Dunkel einer Black Box getroffen – diese Vorstellung erfüllt uns zu Recht mit Grausen. Und hier liegt auch die ethische Crux der künstlichen Intelligenz: Ohne die Durchdringung ihrer Prozesse, ohne ihre Planbarkeit und Nachvollziehbarkeit ist an wirksame Regeln und Gesetze zu unserem Schutz nicht zu denken.
Solche Regeln und Gesetze werden in der Fotografie, der angewandten Fotografie im Besonderen, heftig diskutiert und stehen paradigmatisch für eine Vielzahl von Berufsgruppen, denen durch die neuen Potentiale der künstlichen Intelligenz der Boden unter den Füßen weggezogen wird. Im Fadenkreuz steht ein Berufsstand, dessen Kompetenz, das Herstellen von Kamerabildern, in vielen Anwendungsbereichen absehbar nicht mehr benötigt wird und dessen Kapital, das Bild- und Autorenrecht, in Windeseile zerrinnt.
Simulierte Fotografie
Zwei Bildwelten stehen sich gegenüber: auf der einen Seite die Fotografie mittels Kamera, auf der anderen die Bilderzeugung mittels Computer, hier das Lichtbild, dort das Datenbild. Es sind zwei höchst ungleiche Geschwister. Denn jene Daten, die nun von den Algorithmen der künstlichen Intelligenz gefressen und verdaut werden, sind die bis heute geschätzten über 12 Billionen Fotos (sowie alle sonstigen Arten von Bildern), die sich im Speicher der Geschichte angesammelt haben und dort als sedimentierte Datenmasse zur Verfügung stehen.
So anders ist das neue, künstlich intelligente Bild, dass wir es nicht mehr „Fotografie“ nennen können. Die Fotografie, wie wir sie kennen, ob analog oder digital, ob mit der Kamera oder dem Smartphone aufgenommen, ist das Produkt eines festgehaltenen Lichtereignisses, ein optischer Abdruck der äußeren Welt, basierend auf der Sinneswahrnehmung eines menschlichen Akteurs und seiner direkten, primären, authentischen Beziehung zu ihr. Fotografien sind zweidimensionale Ausschnitte aus einer vierdimensionalen Raumzeit; sie sind per se analytisch.
Demgegenüber ist das künstlich intelligente Bild das Produkt neuronaler Algorithmen und statistisch prozessierter Daten. Seine Beziehung zur äußeren Welt ist indirekt, sekundär, abgeleitet. Es kann Fotografie simulieren, aber nicht verkörpern: ein Bild basierend auf mentalen Eingaben eines menschlichen Akteurs und seiner inszenierten Beziehung zur Welt. Künstlich intelligente Bilder sind zweidimensionale Montagen aus Daten anderer zweidimensionaler Flächen; sie sind per se synthetisch.
Noch ist ein neues Vokabular nicht etabliert. Der Fotografie Merkmale wie intelligent, generiert oder algorithmisch hinzuzufügen, führt in die Sackgasse, denn auch ein richtiges Attribut kann ein falsches Substantiv nicht retten. „Synthografie“ und „Promptografie“ wurden als Alternativen vorgeschlagen – warten wir ab, welche sich letztlich durchsetzen wird.
Mit dem Übergang vom Lichtbild zum Datenbild geht die Abschaffung des Autors, der Autorin einher – wieder einmal, und diesmal endgültig. Denn wenn jedes neue Bild ein Kompositum aus bereits existierenden Bildwerken ist, wird jeder ihrer Schöpfer zum potentiellen Autor – wenn auch nur infinitesimal, wenn auch homöopathisch verdünnt wie ein Tropfen Blut im Ozean.
Wahrheit und Wahrscheinlichkeit
Die Bildwelt der künstlichen Intelligenz markiert eine qualitativ neue Stufe der Digitalisierung. Bereits zu deren Beginn in den 1990er Jahren zeichnete sich ab, welch eminente Schlüsselrolle der Fotografie in diesem Prozess zukommen würde.
Die gesellschaftlich weitreichendste Folge ist der Niedergang der Wahrheit, jener Bastion, die die Fotografie einst Auge in Auge und Hand in Hand mit den Naturwissenschaften errichtet hat. Es war die Fotografie, die uns über anderthalb Jahrhunderte lang konditioniert hat, dem Auge zu vertrauen. All unsere Skepsis, all unsere theoretische Einsicht in den artifiziellen, konstruierten, inszenierten Charakter des Fotobildes hat nicht die Vorstellung zerstören können, mit der Kamera einen Wahrheitsautomaten zur Verfügung zu haben, der uns verlässliche und vertrauenswürdige Dokumente und Beweise lieferte.
Dieser naive Wahrheitsglaube ist mit der Digitalisierung der Fotografie zerbrochen. Die analogen Fäden, die die Fotografie einst mit der Welt dort draußen verbunden hatten, wurden in Bits zerhackt und konnten beliebig neu zusammengesetzt, computiert werden. Wahrheit kam nicht mehr automatisch, nicht mehr qua Technik ins Bild, sondern wurde zu einer Frage der Integrität publizistischer Instanzen – bestimmter Medien, Agenturen und Personen mit untadeliger Reputation.
Ein neues gesellschaftliches Kalkül war fortan gefordert, das Wahrheit durch Wahrscheinlichkeit ersetzte und das uns heute, angesichts der künstlichen Intelligenz, vor gänzlich neue Herausforderungen stellt. Denn wenn die Fotografie, wie wir sie kennen, erst einmal erodiert, wenn sie marginalisiert und zerrieben wird, wenn unser Bild von der Welt durch immer mehr erfundene, fiktive, erlogene Konstrukte entstellt wird, gerät auch die freiheitliche Zivilisation in Gefahr. Deren Zusammenhalt basiert auf einem doppelten Konsens: der Glaubwürdigkeit der Bilder und der Glaubwürdigkeit der Wissenschaft. Fällt die Glaubwürdigkeit der Bilder aus, leidet darunter auch die Wissenschaft, wie wir exemplarisch an der Klimakrise erleben: Erst seit es die Bilder von Dürren, Überschwemmungen und schmelzenden Gletschern gibt, existiert sie überhaupt.
Die künstlich intelligenten Bilder, um es noch einmal zu sagen, sind keine Fotografien. Sie können vortäuschen, Fotografien zu sein, so wie einst Fotografien vortäuschten, Realität zu sein. Das ist ein qualitativer Sprung, der es nicht nur rechtfertigt, sondern erfordert, von etwas revolutionär Neuem zu reden.
Ästhetischer und politischer Kitsch
Ein Blick in die Stätten und Kanäle der künstlich intelligenten Bilder lässt einen bisweilen schaudern. Es blubbert und brodelt wie in der Hexenküche. Gruselige Monstergestalten neben athletischen Superleibern, Pferde, die durch Wohnzimmer rennen, Hunde so groß wie Elefanten . . . ein endloser Strom von Kitsch und Nonsens, perfekt gestylt und dabei so uniform und redundant, dass man sich fragt, wo die viel beschworene Expansion der fotografischen Kreativität denn genau zu finden ist. Man muss sie derzeit noch suchen wie die Nadel im Heuhaufen. Denn die Verkitschung der Bildsphäre resultiert geradezu zwangsläufig aus dem amalgamischen Wesen der künstlichen Intelligenz, die – das scheint ihr Paradoxon zu sein – mit all den leeren und verbrauchten Bildern vor allem künstliche Dummheit erzeugt.
Das Pendant zum ästhetischen Kitsch ist der politische, der den gesellschaftlichen Diskurs verkleistert und überformt, zu finden in den ideologischen Bunkern, den Blasen und Echokammern, in denen halluzinierte, alternative, frei erfundene Wirklichkeiten zirkulieren. Es mag auf den ersten Blick nicht zusammenhängen, aber beide Formen des Kitsches haben eine gemeinsame – wenn auch nicht alleinige – Ursache: den Verfall von Gewissheit und Wahrheit in ihrem ursprünglichen und elementaren Sinne als Übereinstimmung von Aussage und Wirklichkeit, wie sie theoretisch abstrakt von den Wissenschaften und sinnlich konkret von den technischen Bildmedien etabliert wurden.
Erkenntnisrückschritt
Ästhetischer und politischer Kitsch – das klingt harmlos und ist doch der Sumpf, aus dem heraus auch jenen Gesellschaften Gefahr droht, die bislang freiheitlich und demokratisch organisiert sind. Eine Gesellschaft ohne Kompass und ohne Anker gerät leicht auf Abwege. „Muddying the water“ heißt die Strategie, Gewissheiten zu unterwandern, Zweifel zu säen und Lügen hoffähig zu machen. Künstlich intelligente Bilder, die vorgeben, Fotografien zu sein, sind dafür das Instrument der Wahl. Denn sie sind bestens geeignet, unser angestammtes Vertrauen in die Fotografie – und mehr noch in das bewegte Bild – auszubeuten und zu missbrauchen. Und wir stehen, man muss es immer wieder betonen, erst am Anfang dieses Prozesses. Die noch vorherrschende Imperfektion der künstlichen Bilder, sei es der Papst im Daunenmantel oder Trump im Handgemenge mit Polizisten, wird bald vergehen. Der große piktorale Horror steht uns noch bevor.
Schon macht sich eine eigentümliche Nostalgie breit, eine Sehnsucht nach den glücklichen Tagen, als wir glaubten, der Beweiskraft des Fotos trauen zu können. Und in der Tat gibt es bei aller Faszination für die künstliche neue Intelligenz eines zu verteidigen: das authentische, im Lichte der Wirklichkeit entstandene Kamerabild. Technische Ansätze dazu gibt es bereits, etwa die Content Authenticity Initiative, die darauf abstellt, Foto-, Video- und Tonaufnahmen mit fälschungssicheren Metadaten über ihre Herkunft und Bearbeitung zu versehen.
Doch scheint es, als sei die in den vergangenen Jahrzehnten heftig geführte Debatte um die Fotografie und ihr Verhältnis zur Wirklichkeit zusehends entrückt. Deren ontologischer Status, gestern noch als subjektiv und programmiert beschrieben, scheint sich angesichts des künstlich intelligenten Bildes erneut in eine Zone vermeintlich objektiver Authentizität verschoben zu haben. Daten können lügen, Licht nicht? Das wäre ein fataler Schluss. Seien wir gefeit vor solchen Rekursen, die uns in die Debatten von gestern und vorgestern zurückwerfen.
Künstlerische Strategien
Die Ästhetikgeschichte der Fotografie kann als ein Spiegelbild ihrer technologischen Entwicklung betrachtet werden: Stets eröffneten technische Innovationen neue künstlerische Gestaltungsräume, und je bedeutender die Innovation, desto gewaltiger die darauf folgende kreative Expansion. Noch ist es zu früh, um die immensen Umwälzungen der künstlichen Intelligenz in einem adäquaten Szenario vorzuzeichnen, doch lassen sich einige Ansätze und Strategien benennen, wie Künstlerinnen und Künstler die Herausforderung mit ihr heute annehmen.
Sie widerstehen zuvorderst der Verführung, sie als bloßes Spielzeug zu benutzen, naiv mit ihr, statt gegen sie zu spielen. Sie ungefiltert ihren Kitsch ausspucken zu lassen. Stattdessen entwickeln sie Erzählungen und Konzepte, in denen Reflexion und Kritik schwingen. Ihre Perspektive ist eine theoretische, eine Metasicht.
Die vielversprechendsten Ansätze, die wir hier sehen, haben oft eine auffallende Ähnlichkeit mit jenen der Konzept- und Aneignungskunst. Für die heutige digitale Avantgarde steht alles von Neuem zur Disposition: die Geschichte, die Medien, Wissenschaft und Politik, Philosophie und Kunst. Kein Dogma und keine noch so eherne Erkenntnis bleiben von ihnen unangetastet.
Aber die neuen künstlich intelligenten Strategien werden nicht nur die Vergangenheit umschreiben und die Gegenwart erhellen, sie werden vor allem Schneisen in die Zukunft schlagen, Prognosen, Modelle, Sinnbilder für das Leben und Überleben von morgen liefern. Es werden integrierte Strategien sein, in denen sich die Kreise der Kunst mit denen der Natur- und Geisteswissenschaften, der Architektur und Stadtplanung, der Ökologie und vieler anderer Bereiche überschneiden. Eine crossmediale Kunst, eine Kunst der Interfaces, bei der das stehende Bild zu einer Funktion des bewegten und zu einem Element des erweiterten, immersiven Raumes wird.
Es wird an uns liegen, den bedrohlichen Potentialen der künstlichen Intelligenz entgegenzuwirken und sie stattdessen zu einem Erkenntnis- und Sinnesinstrument zu entwickeln. Die Intelligenz, die wir dafür brauchen, ist und bleibt unsere eigene. Denn die künstlich intelligenten Bilder der Zukunft werden nur dann einen Sinn haben, wenn sie menschliche Bilder bleiben.
Berlin, Oktober 2023
© Andreas Müller-Pohle. Erstveröffentlichung: European Photography, Berlin, Nr. 114, Jg. 44, Winter 2023/2024