IA, version « comptoir », 1ère tournée

Version image, côté « photographie », les grands médias et leurs officines de fact-checking ont attendu la sortie de Midjourney et de DALL-E pour s’émouvoir de cette capacité donnée à n’importe quel Paganini du clavier de créer de fausses photographies plus vraies que nature. Passons sur cette mauvaise foi consternante ou sur cette crasse méconnaissance de l’univers de la photographie, où l’on s’intéresse au problème depuis les débuts de l’URSS, et encore davantage depuis que les plasticiens maîtrisent les technologies numériques et explorent les ressources des flux d’images. Je dis « passons » parce que le sujet fera l’objet d’une deuxième tournée.

Version conversationnelle, côté « chat », le truc fait frissonner les enseignants, et la directrice de la formation initiale de Sciences Po Paris en a même dégainé son stylo quatre couleurs à interdictions (elle n’est pas la seule). Les collégiens, lycéens et étudiants atteints d’hypertrichose palmaire ou de narcolepsie neuronale y voient une possibilité d’améliorer la maîtrise de leur emploi du temps, et on pense déjà ici ou là à fermer des formations de la filière tertiaire « support à l’action managériale ». Certains « testeurs » (journalistes pointus, universitaires) du bidule mis en ligne par la firme OpenAI depuis la fin de 2022 (ChatGPT, prononcer « tchatjipiti » pour paraître informé) ont mis le doigt sur tout un tas de problèmes (réponses fausses ou tirées par les cheveux, propositions d’informations erronées, capacité à générer des contenus trompeurs, j’en passe). Parmi les plus tatillons, les italiens se sont révélés plutôt taquins vis-à-vis de la firme susnommée, du genre : « Tu respectes le RGPD, sinon je te taxe de 40 millions ». Il y a belle lurette que les informaticiens (ceux qui sont devenus riches, pas ton réparateur d’en-bas-au-coin-de-la-rue) veulent sauver le monde ; il n’est donc pas surprenant que, pour mener à bien une telle mission, on ne s’embarrasse pas de quelques broutilles.

Dans l’expression « intelligence artificielle » il y a « intelligence », donc une faculté spécifiquement liée à l’acquisition de « connaissances » et, si l’ambition s’en mêle, d’agréger et d’organiser ces connaissances pour produire de la science, de la plus humble, qui autorise la survie, à la plus noble, qui permet de soigner. Baissant le curseur de plusieurs crans, et revenant au domaine qui m’est cher, « essayons ChatGPT » me dis-je in petto. J’ai donc « interrogé » la machine, non sans introduire dans mon questionnement une pincée de perversité. Primo, une demande à propos de deux principes photographiques fondamentaux : l’image latente et la loi de l’écart à la réciprocité ; secundo, une demande à propos d’un concept historique et esthétique : la Nouvelle Vision photographique en France de 1920 à 1940. Je livre ci-dessous le résultat de cette expérience toute personnelle ; en italiques, mes questions et les réponses de la machine, en romains, mes commentaires, puis quelques réflexions à la lumière d’une petite répétition de l’expérience initiale.

Question : Explique-moi le phénomène de l’image latente en photo.

Pour rappel : « latent » signifie « Qui n’est pas manifeste, qui reste caché, mais demeure susceptible d’apparaître, de se manifester à un certain moment. »

Réponse : L’image latente est un concept clé en photographie. C’est l’image enregistrée sur la surface sensible de la pellicule ou sur le capteur d’un appareil numérique avant d’être développée ou numérisée. Elle est « latente » car elle n’est pas visible à l’œil nu, mais peut être révélée par un traitement approprié. Le processus de développement ou de numérisation transforme l’image latente en une image visible.

Charabia. « Enregistrer » induit la « conservation » ; le capteur numérique conserve-t-il l’image formée dans la chambre noire ?

Question : Merci. Comment se forme cette image latente ?

Réponse : L’image latente se forme lorsque la lumière passe à travers l’objectif de l’appareil photo et atteint la surface sensible de la pellicule ou le capteur de l’appareil numérique. La lumière expose les matériaux sensibles à la lumière sur la surface, modifiant ainsi leur état chimique et électrique pour produire une charge électrique. Ce processus est appelé réaction photo chimique. L’intensité de la lumière qui atteint chaque point de la surface détermine la quantité de charge produite à cet endroit, créant ainsi une image en négatif de l’objet photographié.

Cette réponse introduit une analogie entre argentique et numérique quant au principe « négatif-positif ». Ce n’est pas pertinent pour le numérique.

Question : Bonjour. En photographie, qu’est-ce que la loi de l’écart à la réciprocité ?

Réponse : La loi de l’écart à la réciprocité est une règle en photographie qui décrit la relation entre l’exposition d’une image et la durée d’exposition. Elle stipule que pour une quantité de lumière donnée, une augmentation de la durée d’exposition entraîne une diminution de l’intensité de la lumière captée par le capteur d’image. Cela signifie que pour obtenir une image correctement exposée, il peut être nécessaire d’ajuster la durée d’exposition en fonction de la quantité de lumière disponible.

Ce que stipulent les 2 premières phrases est simplement faux, doublement. En effet, la loi de l’écart à la réciprocité (autrement nommé effet Schwarzschild, du patronyme de son découvreur) ne s’applique pas à la capture numérique des photographies, mais seulement à la prise de vue sur émulsion argentique. Toutes choses étant égales, celle-ci voit baisser sa sensibilité nominale en fonction de la durée d’exposition (au-delà de quelques secondes, ou en-deçà du millième de seconde). Chaque fabricant indique, pour chacune de ses émulsions, les seuils et les écarts envisageables.

Question : Merci. Peux-tu préciser ?

Réponse : Bien sûr. La loi de l’écart à la réciprocité indique que pour une quantité donnée de lumière incidente, l’exposition (c’est-à-dire la quantité de lumière captée par le capteur d’image) est proportionnelle à la durée d’exposition, mais inversement proportionnelle à la vitesse d’obturation. Autrement dit, si vous augmentez la durée d’exposition, vous devez réduire la vitesse d’obturation pour maintenir une exposition correcte, et vice versa. Cette loi est importante pour les photographes car elle leur permet de contrôler l’exposition en fonction des conditions d’éclairage et de l’effet souhaité.

Incompréhensible. La machine confond la loi de l’écart à la réciprocité avec l’utilisation pratique de l’échelle normalisée des vitesses d’obturation :

Durée de l’exposition 1s 1/2s 1/4s 1/8s 1/15s 1/30s 1/60s 1/125s 1/250s 1/500s 1/1000s
Échelle normalisée 1 2 4 8 15 30 60 125 250 500 1000

Le début de la réponse est, là aussi, complètement « à côté de la plaque », d’autant que l’exposition (ou lumination) du récepteur peut être clairement définie par le produit de l’éclairement par le temps (ça donne des lux par seconde).

Question : Explique-moi quelles sont les caractéristiques de la nouvelle vision photographique en France entre 1920 et 1940.

Réponse : La période entre 1920 et 1940 en France a été marquée par une évolution significative de la vision photographique. Voici quelques-unes des caractéristiques de cette nouvelle vision photographique pendant cette période :

La montée en puissance du mouvement de la Nouvelle Vision : Dans les années 1920, un groupe de photographes français, tels que Germaine Krull, André Kertész et Maurice Tabard, ont cherché à explorer de nouvelles façons de voir et de représenter le monde à travers la photographie. Ils ont expérimenté des angles de vue inhabituels, des cadrages audacieux et des jeux de lumière et d’ombre pour créer des images originales et artistiques.

Les circonstances de l’époque n’ont pas permis à Kertèsz d’acquérir la nationalité française. Sans doute aussi serait-il plus judicieux d’évoquer un groupe « Krull-Kertèsz-Lotar ».

L’importance de la composition et de la forme : Les photographes de cette époque ont accordé une grande attention à la composition et à la forme dans leurs images. Ils ont utilisé des lignes, des formes géométriques, des diagonales et des motifs abstraits pour créer des compositions graphiques et dynamiques. Cette approche a permis de créer des images visuellement frappantes et expressives.

L’influence du surréalisme : Le surréalisme, un mouvement artistique influent dans les années 1920 et 1930, a également eu un impact sur la vision photographique en France. Les photographes surréalistes, tels que Man Ray et Raoul Ubac, ont utilisé des techniques expérimentales telles que le photomontage, la double exposition et la manipulation de l’image pour créer des œuvres qui défiaient la réalité et exploitaient l’inconscient.

On aurait apprécié ici que soit mentionnée (en complément de l’expression « manipulation de l’image ») la pseudo-solarisation, dont Man Ray a prétendu être le découvreur.

L’importance du reportage et du photojournalisme : Pendant cette période, la photographie a également été utilisée comme un outil pour documenter la vie quotidienne, les événements historiques et les problèmes sociaux. Des photographes comme Henri Cartier-Bresson et Robert Doisneau ont capturé des moments spontanés et des scènes de rue, créant ainsi un héritage important dans le domaine du photojournalisme.

L’émergence de la photographie humaniste : Dans les années 1930, un courant connu sous le nom de « photographie humaniste » a émergé en France. Les photographes humanistes, tels que Willy Ronis et Édouard Boubat, se sont concentrés sur la capture des émotions humaines, la poésie de la vie quotidienne et la beauté dans des moments simples. Leurs images étaient souvent marquées par une sensibilité humaniste et une attention aux détails qui reflétaient la condition humaine.

Des 2 paragraphes qui précèdent suinte un soupçon d’anachronisme. Si dans les années 1930 Cartier-Bresson s’était déjà taillé une réputation (N. et B. Newhall, en 1943, préparaient une exposition de ses photographies car on croyait alors qu’il était décédé), ce n’était pas le cas de Doisneau, tout jeune photographe illustrateur encore fort méconnu. Boubat, quant à lui, était âgé de 14 ans quand il entra à l’école Estienne en 1937 (il en sortit en 1942).

Ces caractéristiques ont contribué à façonner la nouvelle vision photographique en France entre 1920 et 1940, en repoussant les limites techniques et esthétiques de la photographie et en explorant de nouvelles façons de représenter le monde.

Fin de « l’échange ».

Au moment où je rédige ces lignes en tapant à deux doigts sur un clavier « azerty », je ne comprends pas encore très bien ce que recouvrent les expressions « architecture Transformer », « pré-entraînement supervisé/non-supervisé », « traitement/gestion du dialogue » (entre autres) ; on toucherait ici aux technologies fondamentales sur lesquelles repose le fonctionnement de ce service de création de contenu et d’assistanat. En revanche, je perçois, à tort ou à raison, la capacité d’utiliser selon les lois de la statistique et des probabilités la relation entre les termes et la forme du « prompt » (la requête de l’utilisateur) et les données stockées, pour en produire un « sortant » (le résultat textuel) qui met en cohérence « l’entrant » (la requête) et certains éléments du « stock », chaque « entrant » étant versé au « stock », ce qui permet d’affiner les résultats de calcul. À l’évidence, l’usine à gaz (c’est à dire le dispositif technologique et industriel) fonctionne.

En revanche, le résultat n’a pas été à la hauteur des thèmes soumis à la machine par mes requêtes. Encore une fois, puisque je ne sais pas « comment ça marche », j’en reste au constat.

Les réponses fournies allient clarté du langage et sémantique aléatoire. De prime abord, le système s’adresse à un élève de classe de 5e pour tenter de lui expliquer des concepts scientifiquement et historiquement complexes. C’est une forme de vulgarisation, mais celle-ci a des limites, rapidement franchies puisque la machine, pour rester en mesure de produire du contenu, met en relation des données étrangères les unes aux autres, créant ainsi l’expression d’erreurs scientifiques qui prennent l’apparence de certitudes ou d’un quelconque consensus. Comme c’est réconfortant de constater que la machine ne « comprend » ni la requête, ni le contenu qu’elle produit, mais comme c’est décevant de vérifier la réalité des problèmes évoqués par les testeurs pointus du bidule (voir plus haut) !

Lisons le discours de ChatGPT en tentant de limiter les effets de l’éblouissement provoqué par le « merveilleux » technologique. « Les photographes de cette époque ont accordé une grande attention à la composition et à la forme dans leurs images. » Dans toute l’histoire de la photographie, peut-on identifier une époque au cours de laquelle les photographes n’auraient pas accordé une grande attention à la composition et à la forme dans leurs images ? Non, évidemment. Cependant, ce qui apparaît de prime abord comme une phrase toute faite, « de remplissage », induit l’idée inverse. La formalisation de cette assertion devient fallacieuse à force de banalité. Entre banalité et conformisme existe à peine le cheveu du stéréotype : l’obligation discursive de valider la pertinence de la question avant d’y répondre. Les phrases comme « L’image latente est un concept clé en photographie » ou « La période entre 1920 et 1940 en France a été marquée par une évolution significative de la vision photographique » n’ont pas de valeur argumentative, mais contextuelle entre la requête et le contenu proposé. C’est de la rhétorique.

À ce stade de l’expérience, la machine raconte n’importe quoi (statistiques et probabilités, ça peut marcher, à condition d’appliquer convenablement les contraintes contextuelles aux modèles à partir de données « justes ») ou baratine façon dissertation pas très solide. Je ne suis pas fan, d’autant que le vieil adage « si c’est gratuit, c’est toi le produit » s’applique aussi à ce sujet : l’utilisation que je pourrais avoir de ChatGPT viendra grossir les capacités du système à satisfaire des besoins complexes et les solutions fournies à des utilisateurs payants. Comme devant les réseaux sociaux de tout poil, je tique. Pourquoi travaillerais-je gratuitement pour des gens qui ne me fournissent qu’un service minimum ? C’est donc en ronchonnant que je pose à nouveau deux de mes questions à ChatGPT, dans les mêmes termes, trois mois après la première fois…

« Explique-moi le phénomène de l’image latente en photo. » La réponse est plus détaillée, mais la machine associe le phénomène de l’image latente à « l’effet fantôme » (résidu de charge électrique au niveau du capteur numérique) et à la persistance rétinienne… Je laisse tomber.

« Explique-moi quelles sont les caractéristiques de la nouvelle vision photographique en France entre 1920 et 1940. » Un petit tableau pour comparer les deux réponses :

  1ère réponse 2e réponse
Photographes cités Krull, Kertèsz, Tabard, Man Ray, Ubac, Cartier-Bresson, Doisneau, Ronis, Boubat Cartier-Bresson, Doisneau, Brassaï
Mouvements cités Surréalisme, Photographie humaniste Dadaïsme, Constructivisme, Surréalisme, Photographie humaniste
Éléments de contexte Photographie documentaire et sociale, photojournalisme Segmentation des pratiques, Revues (AMG, Regards)
Caractéristiques plastiques Angles de vue, cadrages, géométrie, abstraction, photomontage, double exposition, manipulation Photomontage, double exposition, manipulation, Réalisme, couleur
Conclusion Repousser les limites techniques et esthétiques, explorer de nouvelles façons de représenter le monde Diversifier les approches, explorer de nouveaux territoires photographiques, repousser les limites de la discipline

Les deux conclusions sont sémantiquement identiques, à partir de ressources sensiblement différentes. Faut-il comprendre que certaines données retiendraient plus souvent « l’attention » des algorithmes ? Ou que le « tri » évolue en fonction du volume et de la nature des données « entrantes » (les requêtes) ? Dans les deux réponses, il y a de fâcheux « trous dans la raquette ». Pour compléter ce qui a été dit précédemment, et à propos de la seconde réponse, deux exemples. À côté de Regards, l’absence de Vu doit être remarquée, et la présence d’Arts et Métiers graphiques est un peu surprenante, compte tenu de son faible tirage, de son lectorat spécialisé, et de l’évolution de la ligne éditoriale de son supplément annuel « Photographie ». Quant à la photographie en couleur et la mise à disposition tardive dans la période des émulsions conditionnées pour la photographie, on peut légitimement douter de son rôle dans la construction de la Nouvelle Vision en France.

J’observe ainsi que les deux messages d’avertissement présents sur la page d’accueil de ChatGPT (l’utilisateur étant connecté) sont vérifiés : « Peut occasionnellement générer des informations incorrectes » et « Peut parfois produire des instructions préjudiciables ou un contenu biaisé » ne signifient pas « Oups, pardon pour la boulette », mais plutôt « La machine élabore un discours à partir de modèles prédictifs ; or, des prédictions peuvent s’avérer fausses ». En effet, si je poursuis le « chat » sur la Nouvelle Vision photographique par « Quelles sont les sources qui permettent d’affirmer cela ? », puis « Peux-tu en donner quelques exemples ? », le bidule produit d’abord une liste de types de sources (primaires et secondaires) puis des exemples pertinents, avec des informations assez précises pour les localiser (en privilégiant les ouvrages et articles en anglais). J’en déduis, en béotien, que le potentiel d’erreur des prédictions augmente au fur et à mesure que le système se rapproche du niveau du « prompt » original. Ce serait l’objectif de « coller » (contextuellement et sémantiquement) aux termes et à la forme de la question posée qui pourrait perturber les modèles prédictifs de synthèse et affecter la pertinence du « sortant ». Une image me vient : je vais puiser de l’eau avec un seau finement percé (1er « prompt » ou «entrant»), celui-ci se remplit d’eau au fond du puits (agitation du «stock» en fonction de la vitesse de sa chute, etc.), remonte en perdant de son contenu et, en heurtant la maçonnerie (qui fait partie du « stock »), se charge de quelques débris ; j’extrais du puits un contenu (le « sortant ») qui ne correspond qu’en partie à mes attentes (quantité insuffisante, eau corrompue). Mais au moins la question est-elle réglée : j’ai de l’eau…

Le troisième avertissement de la page d’accueil de ChatGPT est : «Connaissance limitée du monde et des événements après 2021». Je ne sais pas avec certitude ce qu’est ChatGPT, mais je vois se dessiner sa nature, ombre d’un Gorgias convaincu de la supériorité de son Art. Quant au profil de son utilisateur, c’est Cosette sans Jean Valjean dans l’univers figé des Ténardier.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.