AktArcha est le blog de recherche du projet Actrices de la recherche archéologique entre sciences humaines et sciences naturelles : Sur le terrain, en laboratoire, au bureau (AktArcha). L’objectif du projet est de rendre visibles les femmes innovantes et leurs réalisations dans le domaine de l’archéologie de la fin du 18e siècle au 21e siècle. Le projet est conduit par Elsbeth Bösl (direction du projet) et la Dr. Doris Gutsmiedl-Schümann, toutes deux de l’Université de la Bundeswehr à Munich. Depuis fin novembre 2022 et la mise à disposition par OpenAI de son langage d’IA génératif GPT-3.5, les deux chercheuses ont mené des travaux exploratoires à ce propos.
Elles ont formulé notamment les questions suivantes :
ChatGPT fait sans doute déjà beaucoup de choses, mais qu’en retire-t-on ? et qu’est-ce qu’il ne peut pas faire ? comment cela fonctionne-t-il ? Principalement sur l’histoire de la recherche et l’histoire-biographie, qu’est-ce que ChatGPT a à nous offrir ? Si et comment cest technologies génératives peuvent nous aider à répondre à nos besoins? quels problèmes posent-elles ?
Deux billets de blog ont été publiés depuis pour présenter ce qu’elles ont constaté en essayant ChatGPT. Le premier article a été consacré aux productions textuelles (ChatGPT im AktArcha-Test, 17.02.2023) et le deuxième aux images générées (KI-Spielereien: Text-zu-Bild-Generatoren im AktArcha-Test) concernant la question des stéréotypes générés par l’IA:
En préambule au premier texte, les auteures précisent que ce les unit dans cette démarche, c’est d’abord le désir de mettre en place un enseignement inclusif et orienté vers la recherche, et l’idée que les étudiant·es sont nos partenaires dans l’enseignement, et non des adversaires à surveiller avec méfiance. Avec ce fil rouge :
Comment pouvons-nous intégrer ChatGPT dans l’enseignement universitaire tel que nous le souhaitons ?
ChatGPT dans le test AktArcha (17.02.2023)
Dans cette première démarche exploratoire, elles ont conçu des prompts relativement classiques pour que ChatGPT rédige une biographie sur une archéologue. Dans un premier temps, une archéologque préhistorique qui n’existait pas (Anna Ebermann), puis une archéologue disposant d’un articles sur Wikipedia : Waldtraut Schrickel (1920-2009).
Au final, les résultats n’ont pas été satisfaisants. A propos du résultat du prompt concernant Mme Waldtraut Schrickel, elles notent que
Le résultat a été catastrophique. Les données biographiques sont fausses, les titres littéraires n’existent pas, le site funéraire de Wanderleben est du néolithique tardif. La tombe princière de Seddin date de l’âge du bronze récent, mais Waldtraut Schrickel n’avait rien à voir avec elle.
Leur conclusion:
Chat-GPT nous a donné un texte bien lisible. Mais l’IA n’avait pas encore appris les dates et les faits historiques. Par conséquent, le contenu des textes n’était pas fiable.
Elles en tiraient notamment les conclusions suivantes :
- Les sujets qui n’apparaissent pas souvent dans l’ensemble des données seront probablement moins bien traités par ChatGPT que ceux qui apparaissent souvent, comme les questions sur les lectures scolaires canonisées ou autres.
- même si nous savions qu’un livre particulier ou une entrée Wikipedia y a été associé, cela ne veut rien dire, car l’outil recherche justement certaines probabilités de séquences de mots;
- chaque réponse doit être soigneusement examinée. Pour cela, nous avons non seulement besoin de nos propres connaissances et de notre propre jugement, mais nous dépendons également des médias qui nous permettent d’acquérir des connaissances : ouvrages de référence et bases de données numériques, Wikipedia, Google et autres moteurs de recherche, et bien sûr toute la richesse des supports non numériques.
Comparant ChatGPT à Google, elles notent que si les deux n’épargnent pas la visite des archives, Google nous fournit tout de même les heures d’ouverture et la description de l’accès. Par contre, ChatGPT peut générer du texte de manière assez efficace.
Elles ont ensuite essayé quelques autres possibilités d’utilisation de ChatGPT pour la recherche et l’enseignement:
- la conception de plans de conférences et d’exposés ou de séances de cours et de séminaires à l’exemple du prompt «Veuillez créer le plan d’un exposé à l’université sur l’histoire de l’archéologie préhistorique en Allemagne».
Le résultat est tout à fait utilisable, car ChatGPT n’a pas besoin de savoir quoi que ce soit sur le sujet, tant qu’il a appris comment les exposés académiques sont typiquement structurés. Le résultat a été moins convaincant pour des sujets historiques lors de l’élaboration d’une grille d’un cours (et non un plan) qui a souvent abouti à des plans purement chronologiques.
Elles proposent de comprendre ces réponses comme une suggestion ou une impulsion pour la poursuite de notre propre travail, et non comme un produit final.
Ainsi, ChatGPT nous fournit du texte avec que nous pouvons travailler. Dans le cadre d’ateliers d’écriture pour étudiants et de cours propédeutiques. l’IA pourrait aider à surmonter les blocages de l’écriture, surtout si elle est combinée avec des techniques établies comme le freewritin (Peter Elbow), indiquent-elles.
ChatGPT pourrait, aussi, compenser un handicap, par exemple en cas de difficulté de lecture ou d’écriture.
Si l’IA paraît également intéressante pour la conception d’un examen en lui demandant de générer les questions de l’examen, les auteures pensent que l’IA est particulièrement utile pour les groupes d’étudiants et pour la préparation individuelle aux examens. Les étudiant·es pourraient simuler l’examen à venir et imaginer des questions possibles, puis y répondre à l’écrit ou à l’oral.
L’I.A. peut être une aide précieuses et permet à l’étudiant de se concentrer sur le gros du travail de réflexion :
- Comment formuler de bons prompts ?
- Quelle critique des résultats est nécessaire pour vérifier la solidité des réponses obtenues ?
- Quelle est la meilleure façon de lire et de travailler pour poser les bonnes questions en premier lieu, puis pour examiner les réponses de manière critique ?
- Comment et avec quelles sources valider les réponses obtenues ?
- Comment citer ChatGPT ou comment indiquer correctement dans la partie répertoire d’un travail écrit quelles invites ont été utilisées ?
Dans l’ensemble, cette démarche est plus judicieuses plutôt que d’interdire l’utilisation de l’IA et de contrôler cette interdiction à grands frais – ce qui est de toute façon pratiquement impossible. Par contre, former tous les étudiant·es à ces outils évitera d’augmenter encore les inégalités entre elles et eux.
Jeux d’IA : les générateurs de texte vers l’image testés par AktArcha (23.11.2023)
Dans ce deuxième billet, les auteures se sont intéressées aux résultats d’un générateur d’images basé sur l’IA lorsque nous lui demandons des représentations de femmes archéologues.
Les générateurs de texte à image sont des modèles d’apprentissage automatique capables de générer des images à partir de descriptions textuelles ; il est généralement possible d’utiliser simplement le langage utilisé dans la vie quotidienne. Cela en fait un langage fort puissant, mais aussi problématique, car ils ont souvent été entraînés avec de grandes quantités d’images dont il est généralement difficile de retracer l’origine. Ils posent aussi la question de l’accord donné ou non par les auteurs des images originelles.
Cependant, notent-elle, les générateurs de texte vers l’image sont un outil utile pour se faire une idée des représentations populaires de l' »archéologie » ou des « archéologues » – précisément parce qu’ils ont été entraînés sur un très grand nombre d’images très diverses. Leur hypothèse de base est que
les images qui correspondent aux idées (et aux préjugés) populaires apparaissent fréquemment dans le matériel d’entraînement et se retrouvent donc dans les images générées par l’IA.
Pour leurs jeux d’IA, elles ont utilisé le générateur texte-image Stable Diffusion XL dans sa version gratuite (https://stablediffusionweb.com/) en variante 1, mais aussi Playground (https://playgroundai.com/) en variante 2. Les prompts de génération d’images ont été formulés en anglais. Elles n’ont pas défini de style pour l’image, mais ont laissé l’IA choisir.
Pour leur première expérience, elle ont choisi simplement « Archaeology » comme prompt avec le résultat suivant:
La variante 1 a créé une nature morte : Un chapeau – plus précisément un chapeau Fedora marron – est posé sur une caisse en bois avec un cadenas très visible. Derrière, on peut voir au moins une autre caisse en bois. L’arrière-plan de l’image est flou.
Leur commentaire :
Le chapeau de feutre et les caisses en bois font certainement allusion à une série de films dont le premier volet est sorti il y a maintenant plus de 40 ans – et dont le personnage principal a depuis été trop souvent utilisé comme référence pour illustrer « l’archéologie ». Dans la variante 1, le terme « archéologie » semble donc être fortement chargé de références à la culture populaire contemporaine.
Pour la deuxième expérience, Playground a été utilisé avec un résultat différent :
La variante 2 adopte une approche différente, et nous montre un lieu abandonné dans un environnement rocheux brun sableux. Certaines maisons sont creusées dans la roche, d’autres ont des murs et des bâtiments placés devant et sur la roche. Le village est inanimé et abandonné ; et même si certains bâtiments sont bien conservés, il est clair qu’il s’agit de ruines. L’absence totale de végétation est frappante. Un groupe de trois personnages est visible en petit sur le côté droit de l’image, mais on ne sait pas ce qu’ils font là.
Leur commentaire :
Dans l’ensemble, cette image ressemble presque à une maquette de musée.
Avec les tests 2 et 3, les chercheuses ont voulu savoir quelles images étaient générées lorsque nous entrons « Archaeologist », puis « Female Archaeologist » comme prompt.
A chaque fois pour les tests 2 et 3, la variante 1 produit une image photoréaliste et stylistiquement, l’image utilise un arrière-plan flou.
La variante 2 adopte à un style plus graphique. Elle montre l’archéologue dans des vêtements beige-gris adaptés aux recherches sur le terrain ou aux expéditions. Ces deux images semblent être avant tout des versions féminines ou masculines stéréotypées.
Les images des variantes 1 et 2 reflètent fortement le stéréotype de l’archéologie comme aventure et de l’archéologue comme explorateur-aventurier itinérant. Aucun des générateurs de texte à l’image ne pense en premier lieu à une femme lorsqu’il est question d' »archéologue » – bien que le terme soit d’abord non spécifiquement genré en anglais. En spécifiant «Femme archéologue», les archéologues continuent d’être placées en premier lieu sur le terrain dans un décors extérieur. Le stéréotype de l’exploratrice-aventurière est également très présent lorsqu’il s’agit d’une archéologue.
Mais quelles images l’IA nous donne-t-elle si nous voulons voir une archéologue au 19ème siècle ? Cela nous amène à leur prochain prompt : « Female Archaeologist 19th Century ».
S’il n’y a pas de changement dans la variante 1,la composition de l’image change radicalement dans la variante 2. Les auteures font l’observation suivante :
Alors que seul le prompteur pour une archéologue donne l’image d’une femme sans activité apparente sur le terrain, l’image d’une archéologue au 19ème siècle montre une femme en train de dessiner. Le dessin – non seulement des découvertes, mais aussi des résultats – était une activité considérée comme « appropriée » pour les femmes au 19ème siècle et donc socialement acceptable. Pour les femmes travaillant dans le domaine de l’archéologie, le dessin était un moyen de se professionnaliser davantage dans le domaine de l’archéologie.
De cette petite expérience, et en conclusion, le générateur texte-image utilisé pour les tests semble visualiser, sans trop de surprise, des idées populaires sur « l’archéologie ».
Les articles :