Artificial Intelligence

Świat Obrazów Sztucznej Inteligencji

Andreas Müller-Pohle

[German | English | French | Slovenian | Chinese ]

Największą przemianą naszych czasów jest przejście od inteligencji naturalnej do sztucznej, epokowy proces, w centrum którego znajduje się medium równie znane, jak i godne zaufania: fotografia.

Niedawno opinia publiczna została zaskoczona niezwykle groźno brzmiącą przestrogą, wydaną przez Centrum ds. Bezpieczeństwa Sztucznej Inteligencji (Center for AI Safety) z siedzibą w San Francisco: ryzyko wyginięcia gatunku ludzkiego „z powodu sztucznej inteligencji” powinno być traktowane na równi z globalnymi priorytetami, jak pandemie czy wojna nuklearna. Pod tak sformułowaną deklaracją podpisały się setki uznanych ekspertów, w tym Geoffrey Hinton, jeden z pionierów deep learningu, który niedawno zakończył wieloletnią współpracę z Google, aby móc swobodnie wypowiadać się na temat egzystencjalnych zagrożeń związanych ze sztuczną inteligencją. Wydarzyło się to w maju 2023 roku.

Upominający i Uspokajający

Hinton to jeden z najwybitniejszych głosów ostrzegających przed zagrożeniami stwarzanymi przez technologię występującą pod przykrywką nieszkodliwych tekstów oraz sztucznie wykreowanych obrazów, posiadających jednocześnie potencjał wywracania do góry nogami niemal wszystkiego, co składa się na nasz zachodni system wartości. Analizując ten problem nie musimy już sięgać w odległą przyszłość, wystarczy wziąć pod uwagę dynamikę teraźniejszości, która sama w sobie jest już wystarczająco zagmatwana. Tego typu postawy ostrzegające konfrontowane są jednak z poglądami łagodzącymi napięcie. Tłumaczą aktualną sytuację jako szum medialny, przemijającą falę, a nawet beknięcie rewolucji cyfrowej, która wydarzyła się ponad trzydzieści lat temu i nie powinna nas już przerażać.

Dlaczego powinniśmy się jej obawiać? Sztuczna inteligencja jest już obecna w niemal każdym urządzeniu, w każdym zaawansowanym oprogramowaniu i trudno wyobrazić sobie bez niej jakikolwiek technologicznie istotny obszar życia społecznego. Niezależnie od tego, czy jest to diagnostyka medyczna, przetwarzanie języka, czy robotyka przemysłowa, pomaga nam w życiu codziennym i zawodowym – jest jednak zakamuflowana, jak wirus, który rozprzestrzenia się podstępnie i nie spocznie, dopóki nie uzyska całkowitej kontroli nad zakażonym organizmem.

Pod koniec 2022 roku ogólnoświatową sensację wywołało uruchomienie ChatGPT, programu, który może generować język na podstawie niezliczonych istniejących danych szkoleniowych – nie w sensie jakiegokolwiek zrozumienia semantycznego, ale czysto formalnie i statystycznie, według wyuczonych struktur syntaktycznych. Od tego czasu gwałtownie wzrosła liczba tekstów zawierających sztuczną inteligencję, przy czym najmniej interesujące są zastosowania obsługujące pocztę elektroniczną czy aplikacje biznesowe. Powstają już powieści i wiersze. Tak, nawet sztuki teatralne.

Kilka miesięcy wcześniej, światem mediów wizualnych wstrząsnęły inteligentne generatory takie jak DALL·E 2, Midjourney i Stable Diffusion, które potrafią generować obrazy na podstawie wprowadzonego tekstu, tak zwanych podpowiedzi. Na podbój wszechświata zmysłów wyruszają także generatory wideo i dźwięku – dziesiątki programów i narzędzi już dziś tworzących równie zdumiewające co niepokojące efekty, mimo ich wczesnego stadium rozwoju.

Fakt, że sztuczna inteligencja, której historia sięga połowy ubiegłego wieku, dopiero teraz atakuje nas ze zdwojoną siłą, ma związek z trzema głównymi czynnikami: dostępnością gigantycznych ilości danych (big data) jako produktu mediów społecznościowych, handlu online i innych obszarów; szybkim wzrostem wydajności sprzętu komputerowego, możliwym dzięki nowym procesorom graficznym i technologiom pamięci masowej oraz postępami w uczeniu maszynowym (machine learning), zwłaszcza w uczeniu głębokim (deep learning).

Super Black Box

Aktualne, zawrotne tempo rozwoju sztucznej inteligencji zawdzięczamy przede wszystkim postępom w systemach samouczących się, które w oparciu o swoje doświadczenie mogą stale doskonalić własne działania, a tym samym przyspieszać. Wiąże się to z nieobliczalnymi konsekwencjami pozbawienia nas możliwości kontrolowania uruchomionych już procesów.

Niemal nieograniczona złożoność sieci neuronowych i rosnące tempo badań, które je napędzają, sprawiają, że sztuczna inteligencja jest czarną skrzynką nowej jakości. Nawet jej prototyp, aparat fotograficzny był kiedyś camerą obscurą, którą można było zrozumieć tylko dzięki wiedzy technicznej. Komputer, będący kolejnym etapem, ukrył swoje wewnętrzne działanie w cieniu kodów, rządzonych wyłącznie przez jego programistów, tę nową klasę literatów i skrybów. A sztuczna inteligencja? Działa, ale nawet jej twórcy nie do końca już rozumieją, jak i dlaczego: super black box.

W wielu obszarach jest to nieistotne; w innych jednak, takich jak jazda autonomiczna, ma to znaczenie na poziomie egzystencjalnym. Decyzje mające wpływ na życie i śmierć podejmowane są w czeluściach czarnej skrzynki – ta myśl słusznie napawa nas lękiem. Na tym opiera się również etyczne sedno sztucznej inteligencji: bez uważnego rozpoznania jej procesów, bez możliwości planowania i nadzorowania, nie do pomyślenia będą skuteczne zasady i prawa chroniące ludzkość.

Takie zasady i prawa są przedmiotem gorących dyskusji w fotografii, zwłaszcza w fotografii komercyjnej i stają się paradygmatem dla wielu innych zawodów, którym grunt jest „wyrywany spod nóg” poprzez nowe możliwości sztucznej inteligencji. Na celowniku znalazła się profesja, której specjalistyczna wiedza oraz czasochłonna produkcja obrazów przy pomocy aparatów fotograficznych prawdopodobnie nie będzie już potrzebna w szeregu zastosowań komercyjnych. Jednocześnie jej kapitał, wizerunek i prawa autorskie zapewne rozpłyną się w mgnieniu oka.

Fotografia Symulowana

Już dziś zderzają się ze sobą dwa światy obrazów: z jednej strony jest to fotografia wykonana przy pomocy aparatu, a z drugiej, to przedstawienia generowane dzięki komputerom; tu obraz światła, tam obraz danych. Jest to para najbardziej nierównego rodzeństwa. Dane, które są obecnie pochłaniane i trawione przez algorytmy sztucznej inteligencji, to szacunkowo ponad dwanaście bilionów fotografii (plus wszystkie inne rodzaje obrazów), które zgromadziły się w pamięci historii i są tam dostępne jako osadzona masa danych.

Nowy, „sztucznie inteligentny obraz” tak bardzo różni się od klasycznego, że nie możemy go już nazywać „fotografią”. Zdjęcie, jakie znamy, czy to analogowe, czy cyfrowe, zrobione aparatem lub smartfonem, jest produktem uchwyconego zdarzenia świetlnego, optycznym odciskiem świata zewnętrznego, opartym na zmysłowym postrzeganiu ludzkiego aktora i jego bezpośredniej, pierwotnej, autentycznej relacji z nim. Fotografie są przecież dwuwymiarowymi wycinkami czterowymiarowej czasoprzestrzeni. Z natury są analityczne.

Natomiast sztucznie inteligentny obraz jest produktem algorytmów neuronowych i statystycznie przetworzonych danych. Jego związek ze światem zewnętrznym jest pośredni, wtórny, pochodny. Może symulować fotografię, ale nie ucieleśniać jej: obraz taki jest oparty na mentalnym wkładzie ludzkiego aktora i jego inscenizowanej relacji ze światem. Obrazy sztucznie inteligentne to dwuwymiarowe montaże danych z innych dwuwymiarowych powierzchni. Z natury są syntetyczne.

Nowe nazewnictwo określające tego typu obrazy nie zostało jeszcze ustalone. Dodawanie do fotografii atrybutów takich jak inteligentna, generowana czy algorytmiczna prowadzi do ślepego zaułka, ponieważ nawet poprawny atrybut nie może uratować fałszywego rzeczownika. Jako alternatywy zaproponowano „syntografię” i „promptografię”; poczekajmy i zobaczmy, która z nich ostatecznie zwycięży.

Przejściu od obrazu świetlnego do obrazu danych, po raz kolejny towarzyszy zniesienie autorstwa, tym razem jednak na dobre. Jeśli bowiem każde nowe przedstawienie jest złożeniem wielu już istniejących, to wszyscy twórcy stają się potencjalnymi autorami nowego obrazu – choćby nawet tylko w nieskończenie małym stopniu, jak w przypadku rozcieńczeń homeopatycznych odpowiadających kropli krwi w oceanie.

Prawda i Prawdopodobieństwo

Wizualny świat sztucznej inteligencji wyznacza jakościowo nowy etap cyfryzacji. Od samego początku tego procesu, w latach 90. było jasne, że kluczową rolę odegra fotografia.

Najbardziej dalekosiężną konsekwencją społeczną zachodzących przemian jest upadek prawdy, bastionu, który fotografia zbudowała niegdyś oko w oko i ramię w ramię z naukami przyrodniczymi. To fotografia przez ponad półtora wieku warunkowała zaufanie do oka. Cały nasz sceptycyzm, wszystkie nasze teoretyczne spostrzeżenia na temat sztucznego, skonstruowanego, zainscenizowanego charakteru obrazu fotograficznego nie były w stanie zniszczyć idei mówiącej o tym, iż aparat jest maszyną prawdy, która dostarcza nam rzetelnych i godnych zaufania dokumentów i dowodów.

Ta naiwna wiara w prawdę została zachwiana wraz z cyfryzacją fotografii. Analogowe wątki, które niegdyś łączyły fotografię ze światem zewnętrznym, zostały pocięte na kawałki, a teraz mogą zostać ponownie złożone według subiektywnego uznania oraz wzorów obliczeniowych. Prawda nie jest już automatyczną, technicznie gwarantowaną cechą epoki obrazu, ale stała się kwestią dziennikarskiej rzetelności – niektórych mediów, agencji i osób o nienagannej reputacji.

Od tej chwili konieczna była nowa kalkulacja społeczna, która zastąpiła prawdę prawdopodobieństwem, a która dziś, w obliczu sztucznej inteligencji, stawia przed nami zupełnie nowe wyzwania. Bo gdy fotografia jaką znamy w dotychczasowej formie ulegnie erozji, zostanie zmarginalizowana i zmiażdżona, gdy nasz obraz świata zostanie zniekształcony przez coraz bardziej wymyślone, fikcyjne, kłamliwe konstrukty, cywilizacja liberalna również będzie w niebezpieczeństwie. Jej spójność opiera się na podwójnym konsensusie: wiarygodności obrazów i wiarygodności nauki. Kiedy zawodzi wiarygodność obrazów, cierpi także nauka, czego doświadczamy na przykładzie kryzysu klimatycznego: istnieje on w naszej świadomości dopiero od czasów, gdy w obiegu publicznym pojawiły się obrazy klęsk żywiołowych takich jak susze, powodzie czy fotografie topniejących lodowców.

Obrazy stworzone przy pomocy sztucznej inteligencji – powtórzmy, nie są fotografiami. Mogą je udawać, tak jak kiedyś fotografie udawały rzeczywistość. Jest to skok jakościowy, który nie tylko uprawomocnia, ale również wymaga od nas, abyśmy mówili o zjawisku rewolucyjnym i zupełnie nowym.

Estetyczny i Polityczny Kicz

Spojrzenie na publikacje zawierające obrazy sztucznej inteligencji może czasami przyprawić nas o dreszcze. Syczy tu i bulgocze jak w kuchni czarownicy. Przerażające postaci potworów stoją obok wysportowanych super-ciał, konie biegające po salonach, psy wielkie jak słonie . . . niekończący się strumień kiczu i nonsensu, doskonale wystylizowany, a jednocześnie tak zunifikowany i zbędny, że należy się zastanowić, gdzie dokładnie można znaleźć tak zachwalaną ekspansję fotograficznej kreatywności. Na ten moment zmuszeni jesteśmy jej szukać jak igły w stogu siana. Kiczowatość sfery obrazu wynika bowiem niemal nieuchronnie z amalgamatowej natury sztucznej inteligencji, która – co wydaje się być jej paradoksem – produkuje przede wszystkim sztuczną głupotę ze wszystkimi swoimi pustymi i zużytymi obrazami.

Odpowiednikiem kiczu estetycznego jest kicz polityczny, żelujący i przekształcający dyskurs społeczny, znajdujący się w ideologicznych bunkrach, bańkach i komorach pogłosowych, w których krążą halucynacyjne, alternatywne, swobodnie wymyślone rzeczywistości. Na pierwszy rzut oka może się to wydawać niepowiązane, ale obie formy kiczu mają wspólną, jeśli nie jedyną przyczynę: zanik pewności i prawdy w ich pierwotnym i elementarnym sensie jako zgodności między stwierdzeniem a rzeczywistością, teoretycznie abstrakcyjnie ustalonej przez naukę a fizycznie i zmysłowo przez techniczne media obrazowe.

Regresja Wiedzy

Estetyczny i polityczny kicz – brzmi nieszkodliwie, a jednak jest bagnem, które zagraża nawet najbardziej liberalnym i demokratycznym wspólnotom. Społeczeństwo bez kompasu i bez kotwicy łatwo się gubi. „Mącenie wody” to termin określający strategię podważania pewności, siania wątpliwości i dopuszczania kłamstw. Sztucznie inteligentne obrazy, udające zdjęcia, są dla tych celów narzędziem preferowanym. Idealnie nadają się bowiem do wykorzystywania i nadużywania naszego tradycyjnego zaufania do fotografii – a tym bardziej do ruchomego obrazu. Należy tu podkreślić, że jesteśmy przecież dopiero na początku kształtowania się tego procesu. Wciąż jeszcze panująca niedoskonałość sztucznych obrazów, czy to Papieża w modnej puchowej kurtce, czy Trumpa w „bójce” z policjantami, już wkrótce odejdzie do przeszłości. Wielki obrazowy horror dopiero nadejdzie.

Rozprzestrzenia się już swoista nostalgia, tęsknota za szczęśliwymi czasami, kiedy wierzyliśmy, że możemy zaufać wartości fotografii dowodowej. I rzeczywiście, przy całej fascynacji nową sztuczną inteligencją, jest coś, czego warto bronić: autentyczny obraz z aparatu, tworzony w świetle rzeczywistości. Istnieją już techniczne podejścia do tego problemu, takie jak Inicjatywa na Rzecz Autentyczności Treści (CAI), której celem jest dostarczanie zdjęciom, filmom i nagraniom audio zabezpieczonych przed manipulacją metadanych dotyczących ich pochodzenia i przetwarzania.

Wydaje się jednak, że debata na temat fotografii i jej związku z rzeczywistością, tak zaciekle toczona w ciągu ostatnich kilkudziesięciu lat, coraz bardziej znika z pola widzenia. Mamy poczucie, że jej status ontologiczny, do niedawna klasyfikowany jako subiektywny i zaprogramowany, powrócił do strefy pozornie obiektywnej autentyczności w obliczu sztucznie inteligentnego obrazu. Dane mogą kłamać, światło nie? To byłby fatalny wniosek. Bądźmy odporni na takie rekurencje, które wrzucają nas z powrotem w debaty z wczorajszego dnia.

Strategie Artystyczne

Estetyczną historię fotografii można postrzegać jako odzwierciedlenie jej rozwoju technologicznego: innowacje techniczne zawsze otwierały nowe przestrzenie projektowania artystycznego, a im ważniejsza była innowacja, tym większy był późniejszy rozwój twórczy. Jest jeszcze zbyt wcześnie, aby nakreślić dokładne scenariusze ogromnych wstrząsów jakie przyniesie sztuczna inteligencja, ale niektóre stanowiska i strategie można zdefiniować na podstawie tego, jak artyści radzą sobie dzisiaj z tym wyzwaniem.

Twórcy przede wszystkim opierają się pokusie używania sztucznej inteligencji jako zwykłej zabawki, naiwnemu rozgrywaniu kolejnych partii w oparciu o reguły programu, pozwalającego wypluwać algorytmom niefiltrowany kicz. Zamiast tego rozwijają narracje i koncepcje, w których rezonuje refleksja i krytyka. Ich perspektywa jest perspektywą teoretyczną, meta-poglądem.

Najbardziej obiecujące postawy, które tu widzimy, często wykazują uderzające podobieństwo do założeń sztuki konceptualnej i sztuki zawłaszczania. Dla dzisiejszej awangardy cyfrowej wszystko jest znów dostępne na wyciągnięcie ręki: historia, media, nauka i polityka, filozofia i sztuka. Żaden dogmat ani wiedza, bez względu na to, jak bardzo są utwierdzone, nie pozostają przez nich nietknięte.

Jednak nowe strategie sztucznej inteligencji nie tylko napiszą na nowo przeszłość i rzucą światło na teraźniejszość, ale przede wszystkim wykroczą w przyszłość, dostarczając prognoz, modeli i symboli jutrzejszego życia i przetrwania. Będą to strategie zintegrowane, w których obszary sztuki przecinają się z kręgami nauk przyrodniczych i humanistycznych, architektury i urbanistyki, ekologii i wielu innych dziedzin. Sztuka cross-medialna, sztuka interfejsów, gdzie nieruchomy obraz staje się funkcją obrazu ruchomego i elementem rozszerzonej immersyjnej przestrzeni.

Naszym zadaniem w najbliższej przyszłości będzie przeciwstawienie się groźnemu potencjałowi sztucznej inteligencji i przekształcenie jej w instrument poznania oraz wrażliwości. Inteligencja, której potrzebujemy do tego, jest i pozostanie naszą własnością. Bo sztucznie inteligentne obrazy przyszłości będą miały sens tylko wtedy, gdy pozostaną obrazami ludzkimi.

Berlin, październik 2024 r.

To be published in Kwartalnik Fotografia, Września, no. 44, March 2024