Artificial Intelligence
Le monde de l’image artificiellement intelligente
Andreas Müller-Pohle
[German | English | Polish | Slovenian | Chinese]
La plus grande transformation de notre époque est le passage de l’intelligence naturelle à l’intelligence artificielle, un processus historique au centre duquel se trouve un médium aussi familier que digne de confiance : la photographie.
Le Center for AI Safety, un institut de recherche à but non lucratif basé à San Francisco, a surpris le public par un avertissement brutal : le danger d’une « extinction due à l’intelligence artificielle » devrait être considéré comme une priorité mondiale au même titre que les pandémies ou les guerres nucléaires. Des centaines d’experts de renom ont signé la déclaration, dont Geoffrey Hinton, l’un des pionniers de l’apprentissage profond (deep learning), qui avait récemment mis fin à sa longue collaboration avec Google afin de pouvoir parler librement des dangers existentiels de l’intelligence artificielle. C’était en mai 2023.
Admoniteurs et pacificateurs
Hinton est l’une des voix les plus éminentes à mettre en garde contre les menaces posées par une technologie qui se présente sous la forme de créations inoffensives de textes et d’images – et qui a pourtant le potentiel de bouleverser à peu près tout ce qui constitue notre système de valeurs occidental. Il n’est même pas nécessaire de se projeter dans un avenir lointain, il suffit de considérer la dynamique du présent. Et elle est déjà bien déroutante. Ici, les admoniteurs sont confrontés aux pacificateurs, qui considèrent tout cela comme un battage médiatique, une vague passagère, voire un simple rot de la révolution numérique qui s’est produite il y a plus de trente ans et qui ne devrait plus nous effrayer.
Pourquoi devrions-nous la craindre ? L’intelligence artificielle est déjà présente dans presque tous les appareils, dans toutes les applications logicielles sophistiquées, et il est difficile d’imaginer un domaine technologiquement pertinent de la société sans elle. Qu’il s’agisse de diagnostic médical, de traitement du langage ou de robotique industrielle, elle nous aide dans notre vie quotidienne et professionnelle – mais elle est camouflée, comme un virus qui se propage insidieusement et ne s’arrête que lorsqu’il a pris le contrôle total du corps infecté.
Fin 2022, le lancement de ChatGPT a fait sensation dans le monde entier : un programme capable de générer du langage à partir de myriades de données d’apprentissage existantes – non pas dans le sens d’une quelconque compréhension sémantique, mais de manière purement formelle et statistique en suivant des structures syntaxiques apprises. Depuis lors, le nombre de textes artificiellement intelligents a explosé, le courrier électronique et les applications commerciales étant les moins intéressants. Des romans et des poèmes sont déjà en cours d’écriture. Et même des pièces de théâtre.
Quelques mois plus tôt, le monde de l’image avait été bouleversé par des générateurs intelligents tels que DALL-E 2, Midjourney et Stable Diffusion, qui peuvent générer des images à partir de la saisie d’un texte, ce que l’on appelle un prompt ou « prompteur ». Et des générateurs de vidéos et de sons sont aussi en train de conquérir l’univers des sens – des dizaines de programmes et d’outils, déjà étonnants et troublants, mais qui n’en sont encore qu’à leurs débuts.
Le fait que l’intelligence artificielle, dont l’histoire remonte au milieu du siècle dernier, n’arrive que maintenant avec force, est lié à trois facteurs principaux : la disponibilité de quantités gigantesques de données (big data) provenant des médias sociaux, du commerce en ligne et d’autres domaines ; l’augmentation rapide des performances des ordinateurs rendue possible par les nouveaux processeurs graphiques et les technologies de stockage ; et les progrès de l’apprentissage automatique, en particulier de l’apprentissage profond.
Super boîte noire
Le développement exponentiel actuel de l’intelligence artificielle est avant tout dû aux progrès des systèmes d’auto-apprentissage, des systèmes capables d’améliorer constamment leurs performances sur la base de leur expérience et donc de s’accélérer eux-mêmes, avec des conséquences incalculables sur la contrôlabilité des processus mis en œuvre.
La complexité presque illimitée des réseaux neuronaux et l’accélération des recherches qui les alimentent font de l’intelligence artificielle une boîte noire d’une qualité nouvelle. Son prototype, l’appareil photographique, était déjà une camera obscura qui ne pouvait être comprise qu’avec des connaissances technologiques. L’ordinateur, l’étape suivante, cachait son fonctionnement interne dans l’ombre des codes, régi uniquement par ses programmeurs, cette nouvelle classe de lettrés et de scribes. Et l’intelligence artificielle ? Elle fonctionne, mais même ses créateurs ne comprennent plus très bien comment ni pourquoi : une super boîte noire.
Dans de nombreux domaines, cela n’a pas d’importance ; dans d’autres, comme la conduite autonome, c’est une question existentielle. Des décisions de vie ou de mort, prises dans l’obscurité d’une boîte noire – l’idée nous effraie à juste titre. Et c’est bien là le cœur éthique de l’intelligence artificielle : sans pouvoir pénétrer dans ses processus, sans sa prévisibilité et sa traçabilité, on ne peut pas penser des règles et des lois efficaces pour notre protection.
Ces règles et lois font l’objet d’un vif débat dans le domaine de la photographie, en particulier de la photographie appliquée, et sont paradigmatiques pour une multitude de professions sous lesquelles le sol se dérobe sous l’effet des nouvelles possibilités offertes par l’intelligence artificielle. Dans le collimateur se trouve une profession dont l’expertise, la production d’images photographiques, ne sera vraisemblablement plus nécessaire dans de nombreuses applications commerciales, et dont le capital, les droits d’image et d’auteur, fondra en un clin d’œil.
Photographie simulée
Deux mondes d’images se confrontent : d’une part, la photographie au moyen d’un appareil photographique, d’autre part, la génération d’images au moyen d’un ordinateur ; ici l’image de la lumière, là l’image des données. Ce sont deux frères des plus inégaux. Car ces données qui sont aujourd’hui dévorées et digérées par les algorithmes de l’intelligence artificielle sont les quelque douze milliards de milliards de photographies (plus tous les autres types d’images) qui se sont accumulées dans la mémoire de l’histoire et qui y sont disponibles en tant que masse sédimentée de données.
La nouvelle image, artificiellement intelligente, est si différente que nous ne pouvons plus l’appeler « photographie ». La photographie telle que nous la connaissons, qu’elle soit analogique ou numérique, qu’elle soit prise avec un appareil photographique ou un smartphone, est le produit d’un événement lumineux capturé, une empreinte optique du monde extérieur basée sur la perception sensorielle d’un acteur humain et sa relation directe, primaire et authentique avec celui-ci. Les photographies sont des tranches bidimensionnelles d’un espace-temps quadridimensionnel ; elles sont en soi analytiques.
En revanche, l’image artificiellement intelligente est le produit d’algorithmes neuronaux et de données traitées statistiquement. Sa relation au monde extérieur est indirecte, secondaire, dérivée. Elle peut simuler, mais non incarner, la photographie : une image basée sur l’apport mental d’un acteur humain et sa relation mise en scène avec le monde. Les images artificiellement intelligentes sont des montages bidimensionnels de données provenant d’autres surfaces bidimensionnelles ; elles sont en soi synthétiques.
Un nouveau vocabulaire n’a pas encore été établi. L’ajout d’attributs tels que « intelligent », « généré » ou « algorithmique » au mot « photographie » conduit à une impasse, car même un attribut correct ne peut sauver un faux nom. « Synthographie » et « promptographie » ont été proposées comme alternatives ; attendons de voir laquelle l’emportera à la fin.
Le passage de l’image lumineuse à l’image de données s’accompagne de l’abolition de l’auteur – une fois de plus, et cette fois-ci pour de bon. Car si toute nouvelle image est un composé d’images déjà existantes, chacun de ses créateurs devient un auteur potentiel – même infinitésimalement, même homéopathiquement dilué comme une goutte de sang dans l’océan.
Vérité et probabilité
Le monde visuel de l’intelligence artificielle marque, d’un point de vue qualitatif, une nouvelle étape de la numérisation. Dès le début de ce processus, dans les années 1990, il était clair que la photographie jouerait un rôle clé.
La conséquence sociale la plus importante est le déclin de la vérité, ce bastion que la photographie a jadis construit en harmonie avec les sciences naturelles. C’est la photographie qui, pendant plus d’un siècle et demi, nous a conditionnés à faire confiance à l’œil. Tout notre scepticisme, toutes nos réflexions théoriques sur le caractère artificiel, construit et mis en scène de l’image photographique n’ont pas réussi à détruire l’idée que l’appareil photographique est une machine de vérité qui nous fournit des documents et des preuves fiables et dignes de confiance.
Cette croyance naïve en la vérité a volé en éclats avec la numérisation de la photographie. Les fils analogiques qui reliaient autrefois la photographie au monde extérieur furent coupés en morceaux et pouvaient désormais être réassemblés et calculés à volonté. La vérité n’était plus une caractéristique automatique et techniquement garantie de l’image, mais devenait une question d’intégrité journalistique – de certains médias, agences et individus à la réputation irréprochable.
Dès lors, un nouveau calcul social s’imposait, qui remplaçait la vérité par la probabilité et qui, aujourd’hui, face à l’intelligence artificielle, nous confronte à des défis entièrement nouveaux. Car une fois que la photographie telle que nous la connaissons est érodée, qu’elle est marginalisée et pulvérisée, une fois que notre image du monde est déformée par des constructions de plus en plus inventées, fictives, mensongères, même la civilisation de la liberté devient menacée. Sa cohésion repose sur un double consensus : la crédibilité des images et la crédibilité de la science. Lorsque la crédibilité des images échoue, la science en pâtit également, comme nous en faisons l’expérience avec la crise climatique : ce n’est que depuis que les images de sécheresse, d’inondation et de fonte des glaciers existent qu’elle existe.
Les images artificiellement intelligentes ne sont – je le répète – pas des photographies. Elles peuvent prétendre être des photographies, tout comme les photographies prétendaient autrefois être la réalité. Il s’agit d’un saut qualitatif qui non seulement justifie, mais exige que nous parlions de quelque chose de révolutionnairement nouveau.
Kitsch esthétique et politique
Un coup d’œil sur les sites et les canaux d’images artificiellement intelligentes fait parfois frémir. Ça siffle et ça bouillonne comme dans une cuisine de sorcière. Des images de monstres effrayants à côté de super-corps athlétiques, des chevaux qui courent dans les salons, des chiens aussi gros que des éléphants . . . un flot infini de kitsch et de non-sens, parfaitement stylisé et pourtant si uniforme et redondant qu’on se demande où on pourrait bien trouver l’épanouissement tant vanté de la créativité photographique. Pour l’instant, il faut chercher comme une aiguille dans une botte de foin. Car la « kitschisation » de la sphère de l’image résulte presque inévitablement de la nature d’amalgame de l’intelligence artificielle qui, et c’est là son paradoxe, produit surtout de la bêtise artificielle avec toutes ses images vides et usées.
Le pendant du kitsch esthétique est le kitsch politique, qui gélatinise et remodèle le discours social, que l’on retrouve dans les bunkers idéologiques, les chambres d’écho et à bulles dans lesquelles circulent des réalités hallucinées, alternatives, librement inventées. Ces deux formes de kitsch peuvent à première vue sembler sans rapport, mais elles ont une cause commune, mais pas unique : la décadence de la certitude et de la vérité, dans leur sens originel et élémentaire de correspondance entre l’énoncé et la réalité, telle qu’elle est établie théoriquement de manière abstraite par les sciences et sensuellement de manière concrète par les médias de l’image technique.
Régression de la connaissance
Le kitsch esthétique et politique – cela semble inoffensif, et pourtant c’est le marécage qui menace même les sociétés les plus libérales et les plus démocratiques. Une société sans boussole, sans ancre se perd facilement. « Brouiller les pistes », c’est le terme adéquat pour qualifier une stratégie qui consiste à ébranler les certitudes, à semer le doute et à rendre les mensonges acceptables. Les images artificiellement intelligentes qui se font passer pour des photographies sont l’instrument de prédilection de cette stratégie. Elles sont en effet parfaitement adaptées pour exploiter et abuser notre confiance traditionnelle dans la photographie, et plus encore dans l’image animée. Et il faut souligner que nous n’en sommes qu’au début de ce processus. L’imperfection encore fréquente des images artificielles, qu’il s’agisse du Pape en manteau de duvet ou de Trump dans une échauffourée avec des policiers, appartiendra bientôt au passé. La grande horreur picturale est encore à venir.
Une certaine nostalgie se répand déjà, une nostalgie des jours heureux où l’on croyait pouvoir se fier à la valeur probante de la photographie. En effet, malgré la fascination exercée par la nouvelle intelligence artificielle, il existe une chose qui mérite d’être défendue : l’image authentique de l’appareil photographique, créée à la lumière de la réalité. Des approches techniques existent déjà, comme l’Initiative pour l’authenticité du contenu (Content Authenticity Initiative), qui vise à fournir aux photos, vidéos et enregistrements audio des métadonnées infalsifiables sur leur origine et leur traitement.
Pourtant, il semble que le débat sur la photographie et sa relation avec la réalité, si âprement disputé au cours des dernières décennies, ait été de plus en plus perdu de vue. Son statut ontologique, jusqu’à récemment qualifié de subjectif et programmé, semble s’être déplacé vers une zone d’authenticité apparemment objective face à l’image artificiellement intelligente. Les données peuvent mentir, la lumière non ? Ce serait une conclusion fatale. Soyons à l’abri de telles récursions qui nous replongent dans les débats d’hier et d’avant-hier.
Stratégies artistiques
L’histoire esthétique de la photographie peut être considérée comme le reflet de son développement technologique : les innovations techniques ont toujours ouvert de nouveaux espaces de création artistique, et plus l’innovation est importante, plus l’expansion créative qui s’ensuit est puissante. Il est encore trop tôt pour esquisser un scénario adéquat pour les immenses bouleversements de l’intelligence artificielle, mais certaines approches et stratégies peuvent être nommées pour la façon dont les artistes relèvent le défi aujourd’hui.
Avant tout, ils résistent à la tentation de l’utiliser comme un simple jouet, de jouer naïvement avec elle plutôt que contre elle. De la laisser cracher son kitsch sans filtre. Au contraire, ils développent des récits et des concepts dans lesquels résonnent la réflexion et la critique. Leur perspective est théorique, une méta-vue.
Les approches les plus prometteuses que nous voyons ici ressemblent souvent de manière frappante à celles de l’art conceptuel et de l’art d’appropriation. Pour l’avant-garde numérique d’aujourd’hui, tout est de nouveau à prendre : l’histoire, les médias, la science et la politique, la philosophie et l’art. Aucun dogme, aucun savoir, aussi solide soit-il, ne leur échappe.
Mais les nouvelles stratégies d’intelligence artificielle ne se contenteront pas de réécrire le passé et d’éclairer le présent, elles s’inscriront surtout dans le futur, en fournissant des prévisions, des modèles, des symboles pour la vie et la survie de demain. Il s’agira de stratégies intégrées dans lesquelles les cercles de l’art croiseront ceux des sciences naturelles et humaines, de l’architecture et de l’urbanisme, de l’écologie et de bien d’autres domaines. Un art cross-média, un art des interfaces, où l’image fixe deviendra une fonction de l’image en mouvement et un élément de l’espace immersif élargi.
Il nous appartiendra de contrer le potentiel menaçant de l’intelligence artificielle et d’en faire au contraire un instrument de connaissance et de sensibilité. L’intelligence dont nous avons besoin pour cela est et restera la nôtre. Car les images artificiellement intelligentes de l’avenir n’auront de sens que si elles restent des images humaines.
Berlin, Octobre 2023
© Andreas Müller-Pohle. Publié pour la première fois dans European Photography, Berlin, n° 114, vol. 44, hiver 2023/2024.
© French translation: Lionel Bayol-Thémines & Marc Lenot