Comment Grok en est-il arrivé à faire l’éloge d’Adolf Hitler ?

Le robot conversationnel d’Elon Musk s’est retrouvé dans une polémique durant la dernière semaine en raison de ses réponses extrémistes. Décryptage.

LÉO MERCIER-ROSS ET SIMON GIONET

Éloge d’Adolf Hitler, critiques des « stéréotypes anti-Blancs », insulte du président turc et propos discriminatoires contre les juifs à Hollywood : Grok, le modèle d’intelligence artificielle (IA) conversationnel de la start-up d’Elon Musk xAI, fait depuis une semaine l’objet d’une polémique pour certaines de ses réponses extrémistes et discriminatoires données à des utilisateurs du réseau social X. Comment un modèle d’IA générative a-t-il pu produire de tels résultats ? Le Devoir fait le point avec Shingai Manjengwa, directrice principale du volet Éducation et développement à l’institut québécois de recherche sur l’intelligence sur l’IA Mila.

« Ce qui est unique chez Grok et xAI, c’est qu’ils ne soucient pas d’être politiquement corrects, ils veulent être directs. […] Le modèle ne craint pas la provocation tant qu’il génère des faits et des affirmations », explique d’emblée l’experte en intelligence artificielle. Cette approche, qui distingue le modèle d’Elon Musk de ses concurrents, est au coeur de la récente polémique.

Vendredi dernier, Elon Musk a annoncé avoir mis en place des améliorations « importantes » à Grok dans le but de plaire aux utilisateurs qui trouvaient le modèle encore trop politiquement correct. Dès lors, des utilisateurs ont commencé à observer des réponses extrémistes ou discriminatoires.

Pour comprendre ces résultats, Mme Manjengwa rappelle que les modèles langagiers comme Grok fonctionnent sur un système mathématique, même s’ils donnent l’illusion de comprendre et de parler un langage naturel lors de ses interactions avec les utilisateurs. « Ils apprennent à partir d’exemples », résume-t-elle. La majorité collectent leur « savoir » auprès d’une vaste quantité de données et d’images provenant entre autres d’articles, de publications universitaires ou de sites gouvernementaux, mais aussi de forums, ou de blogues personnels.

« Dis les choses comme elles sont »

Or, explique la chercheuse, toute compagnie qui a un modèle d’IA génératif donne un certain nombre d’instructions pour baliser les réponses données : fournir une réponse « honnête » ou « factuelle », par exemple.

Dans le cas de Grok, la mise à jour demandait notamment au modèle de « dire les choses comme elles sont et [de ne pas avoir] peur d’offenser les gens qui sont politiquement corrects » ou bien de « comprendre le ton, le contexte et le langage du message [et d’en] tenir compte dans [sa] réponse ».

« La fonctionnalité de Grok a été malencontreusement détournée de ses valeurs fondamentales dans certaines circonstances afin de rendre la réponse plus engageante pour l’utilisateur, expliquait xAI dans une publication sur le réseau X. En particulier, l’instruction de “suivre le ton et le contexte” de l’utilisateur a amené de manière indésirable Grok à donner la priorité à l’adhésion aux publications précédentes du fil de discussion, y compris les publications peu recommandables, plutôt qu’à répondre de manière responsable. »

« On se retrouve donc avec un système d’instructions qui se heurte à des mots qui ont un poids et un contexte historiques », résume Mme Manjengwa.

Elle donne l’exemple d’une affirmation factuelle aussi simple que « La majorité des habitants du continent africain sont noirs ». Au moment de transmettre cette affirmation à un utilisateur, le modèle risque ainsi de produire des explications et du contexte partiaux ou des stéréotypes racistes que le système a collectés à partir de X ou d’autres sources d’opinion sur le Web. « L’utilisateur est désormais imprégné des croyances et des interactions des gens » sans que ce processus soit transparent pour ce dernier, souligne-t-elle.

Un « signal d’alarme »

Aux yeux de Mme Manjengwa, la polémique entourant les réponses de Grok révèle surtout d’inquiétantes lacunes du processus de sécurité et d’éthique. « Une suite de tests robustes avec des appels et des réponses simulées aurait pu détecter le problème […] avant la publication de la nouvelle mise à jour », affirme-t-elle après avoir consulté les directives de la dernière mise à jour problématique. Un processus de vérification qui fait habituellement partie de toute compagnie en intelligence artificielle.

« Cela devrait être un signal d’alarme pour chaque développeur afin qu’il mette en place ses propres tests indépendants lorsqu’il intègre des outils d’IA à des logiciels », explique l’experte. Le problème, faitelle valoir, est qu’il n’existe pas de réglementation ni de législation qui oblige les entreprises en IA à suivre un tel protocole.

« On doit alors compter sur la bonne volonté des entreprises technologiques pour accomplir ce travail, mais ça ne fonctionne pas toujours à l’avantage des consommateurs », explique Shingai Manjengwa.

Une avenue pour y parvenir, selon elle, serait une meilleure éducation sur ce qu’est l’IA. « Je ne saurais trop insister sur l’urgence de mettre en place une éducation sur l’IA à grande échelle afin que les utilisateurs aient, de manière générale, une meilleure compréhension du fonctionnement de cet outil. […] C’est ce qui permettrait aux utilisateurs de comprendre ce qui se passe et de mieux en discuter lorsque des problèmes surviennent. »

Ce qui est unique chez Grok et xAI, c’est qu’ils ne soucient pas d’être politiquement corrects, ils veulent être directs. […] Le modèle ne craint pas la » provocation tant qu’il génère des faits et des affirmations. SHINGAI MANJENGWA

LE DEVOIR DE CITÉ

fr-ca

2025-07-14T07:00:00.0000000Z

https://ledevoir.pressreader.com/article/281758455312143

Le Devoir

Le Devoir virtuel

Comment Grok en est-il arrivé à faire l’éloge d’Adolf Hitler ?

Le robot conversationnel d’Elon Musk s’est retrouvé dans une polémique durant la dernière semaine en raison de ses réponses extrémistes. Décryptage.

LÉO MERCIER-ROSS ET SIMON GIONET