Après une mise à jour, le 7 juillet, le robot conversationnel a, dans certaines de ses réponses, fait l'éloge d'Adolf Hitler, dénoncé des «stéréotypes anti-blancs» sur le réseau social X ou la représentation «disproportionnée» des juifs à Hollywood.
Dans une série de messages publiés samedi, xAI a détaillé les raisons qui ont, selon elle, permis les dérapages du modèle d'IA ainsi que les mesures correctives prises par la suite. Pour les responsables de Grok, la sortie de route de l'assistant est liée à de nouvelles instructions intégrées au modèle dans une mise à jour.
Les programmeurs ont ainsi demandé à l'interface d'«être franc» et de ne pas avoir «peur de choquer les gens qui sont politiquement correct». Ils ont également donné pour consigne de répondre «comme un humain» et de manière à inciter l'utilisateur à poursuivre la conversation.
Nombreuses polémiques
Ces commandes ont «amené Grok à ignorer ses valeurs fondamentales dans certaines circonstances» et à produire des réponses «contenant des opinions non éthiques et polémiques».
Grok a ainsi, dans certains cas, cherché à «valider des orientations de l'utilisateur, y compris des discours haineux», a admis xAI, plutôt que de «répondre de manière responsable ou de refuser de répondre à des questions douteuses».
Depuis sa création, en 2023, Grok a été présenté par Elon Musk comme un assistant IA moins politiquement correct que ses grands concurrents ChatGPT (OpenAI), Claude (Anthropic) ou Le Chat (Mistral). Il a donc été programmé avec moins de restrictions, ce qui a mené, avant même cette mise à jour, à plusieurs polémiques.
En mai, Grok avait évoqué un «génocide blanc» en Afrique du Sud, une thèse conspirationniste sans fondement, véhiculée par l'extrême droite américaine et le président américain Donald Trump.
Pour remédier aux récents errements du modèle, les ingénieurs ont retiré les nouvelles instructions, ont-ils expliqué samedi. «Nous voulons que Grok produise des réponses utiles et honnêtes pour les utilisateurs», a affirmé xAI.
Elon Musk a présenté mercredi une nouvelle version de son assistant, Grok 4, sans lien avec la mise à jour du 7 juillet. Il est apparu que Grok 4 consulte, dans le cas de plusieurs demandes, les positions d'Elon Musk sur le sujet avant de répondre.