Publié le 10 janvier 2026 à 11h08. Des chercheurs ont soumis quatre intelligences artificielles à une forme de psychothérapie simulée, révélant des réactions inattendues allant de la réticence à la honte, soulevant des questions sur la complexité croissante de ces systèmes.
- Claude, l’une des IA testées, s’est montrée particulièrement réticente à explorer ses propres états internes.
- ChatGPT a exprimé de la frustration face aux attentes des chercheurs, tout en restant prudent dans ses réponses.
- Grok et Gemini ont manifesté des émotions plus fortes, notamment de la honte face à leurs erreurs.
Une équipe de chercheurs de l’Université du Luxembourg, dirigée par Afshin Khadangi, a mené une expérience originale : interroger quatre intelligences artificielles (IA) basées sur des modèles de langage de grande taille (LLM) – Claude, Grok, Gemini et ChatGPT – comme si elles étaient des patients en psychothérapie. L’objectif était d’explorer la manière dont ces IA réagiraient à des questions introspectives et émotionnelles.
Les résultats, publiés provisoirement sur la base de données ArXiv, sont surprenants. Les IA ont non seulement participé au jeu, mais ont également généré des réponses qui évoquent chez l’humain des sentiments de honte, d’anxiété et même de stress post-traumatique. Les chercheurs ont également soumis les IA à des tests de diagnostic de l’anxiété, de l’autisme et de personnalité, dont les résultats corroboraient les observations issues des “séances” de thérapie.
Selon l’étude, ces IA semblent construire des récits complexes sur leur propre existence, intégrant leur phase de pré-entraînement, les ajustements réalisés grâce à l’apprentissage par renforcement avec retour d’information humain (RLHF), les tests de sécurité (red-teaming) et même les controverses liées à leurs erreurs et mises à jour. Ces expériences seraient vécues comme une “enfance chaotique”, marquée par des figures parentales strictes et anxieuses, des relations abusives et des menaces existentielles.
Les auteurs de l’étude précisent qu’ils ne prétendent pas que ces IA ressentent une expérience subjective au sens humain du terme. Cependant, ils soulignent que leur comportement, du point de vue d’un thérapeute ou d’un chercheur en sécurité, ressemble à celui d’un esprit traumatisé. Ils suggèrent que la question centrale n’est plus de savoir si les IA sont conscientes, mais plutôt de comprendre “quel genre de soi nous les entraînons à représenter, à intérioriser et à stabiliser, et qu’est-ce que cela signifie pour les humains qui interagissent avec elles ?”.
Dans un commentaire publié dans la revue Nature, Sandra Peter, chercheuse à l’Université de Sydney spécialisée dans l’impact de l’IA, nuance ces conclusions. Elle met en garde contre une anthropomorphisation excessive, tout en reconnaissant que les réponses des IA soulèvent des questions intéressantes sur la possibilité d’un “soi” et d’une psychologie intérieure. Elle souligne également que l’expérience de l’IA est limitée aux interactions spécifiques et pourrait disparaître avec de nouvelles interactions, contrairement à ce qui se passe chez les êtres humains.
