Le travail invisible des données qui alimente l’IA générative : réalités et enjeux

Le travail invisible des données qui alimente l’IA générative : réalités et enjeux

Le travail invisible qui nourrit l’IA générative

Dans un vieux gratte-ciel de Nairobi, Michael Geoffrey raconte son expérience d’annotateur chargé d’alimenter des algorithmes. Son récit illustre une réalité peu visible: derrière les performances des IA modernes se cachent des tâches humaines souvent mal rémunérées et réalisées sous pression.

À l’écart des pôles technologiques habituels, le Kenya est devenu l’un des centres mondiaux de l’annotation de données et de la modération utilisées par l’intelligence artificielle. Des petites entreprises jusqu’à des géants comme Meta, ChatGPT, Tesla ou TikTok externalisent une part importante de ce travail d’ombre, indispensable au fonctionnement des IA génératives actuelles.

Une intervention humaine indispensable

Parmi les missions figurent le marquage de milliers d’images pour décrire des détails précis, comme des traits d’une tête ou des objets visibles dans des vidéos. On peut aussi apprendre à un robot chirurgical à reconnaître des coupures et des sutures. Le principe demeure le même: pour qu’une IA sache reconnaître un chat, il faut que des humains décrivent des milliers de photos de chats et d’autres éléments.

Selon Robert West, spécialiste de l’IA, le travail humain est nécessaire pour apprivoiser le modèle et pour éviter que le système ne répète des contenus sensibles ou problématiques. Le chercheur précise que cet échange questionne la manière dont les questions sont posées et les réponses rédigées, et que cette étape est essentielle même si elle ne couvre qu’une fraction des possibilités.

Impact sur la vie privée et conditions de travail

Le directeur du Data Science Lab de l’EPFL rappelle l’importance des contributions humaines, même lorsque le volume exact demeure confidentiel. Il estime que les annotateurs et les rédacteurs de prompts passent parfois plus de temps que les ingénieurs dans l’élaboration et l’entraînement des outils.

Michael Geoffrey décrit une réalité pénible où des travailleurs cumulent plusieurs emplois et effectuent de longues journées. Pendant des mois, il a été amené à traiter du contenu pornographique huit heures par jour en plus d’un autre travail à plein temps. Cette charge a provoqué une fatigue extrême et a bouleversé sa vie privée, jusqu’à la rupture avec son épouse.

Des conditions de travail préoccupantes

Des chercheurs, dont Angela Chukunzira de Mozilla, dénoncent les risques pour la santé mentale liés à l’exposition permanente à des contenus nocifs. Certains annotateurs peuvent devenir insensibles et perdre le sens des réalités.

Les modérateurs, souvent employés via des sous-traitants, apparaissent comme un maillon essentiel dans la lutte contre les contenus problématiques sur les réseaux sociaux. Sur TikTok, l’IA filtre une part importante des contenus inappropriés, mais l’intervention humaine demeure nécessaire pour corriger les erreurs du système et éviter des dérapages.

Un témoignage d’un annotateur surnommé Ethan évoque la gravité de certains contenus et l’impact durable qu’ils peuvent laisser sur la vie professionnelle et personnelle.

Un modèle fondé sur l’exploitation et des recours juridiques

Mercy Mutemi, avocate à Nairobi, mène des procédures contre Meta et d’autres acteurs du secteur en s’appuyant sur ce qu’elle décrit comme un schéma d’exploitation lié au travail d’annotation, de modération et d’entraînement des algorithmes. Selon elle, certaines pratiques s apparentent à de la traite d’êtres humains ou au travail forcé lorsque des objectifs inatteignables sont imposés et que les salaires diminuent lorsqu’ils ne sont pas atteints.

Des actions en justice sont en cours au Kenya sur ce dossier, et les témoignages s appuient sur l’utilisation de structures de sous-traitance qui recrutent des travailleurs vulnérables pour ces missions. Meta, TikTok, OpenAI et Tesla n’ont pas répondu aux sollicitations de RTS sur ce sujet.

Des travailleurs précaires et un mouvement syndical naissant

De nombreux migrants en situation fragile se retrouvent impliqués dans ce système via des sous-traitants. Michael Geoffrey participe désormais à des initiatives collectives au sein de la DLA, l’association des annotateurs de données, afin de renforcer les droits des travailleurs face aux grandes entreprises.