Publié le 18 décembre 2024. Des chercheurs de l’Université de Washington ont mis au point une méthode permettant aux intelligences artificielles d’apprendre les valeurs culturelles en observant le comportement humain, une avancée cruciale pour éviter de biaiser les IA avec des normes universelles potentiellement inadaptées.
- Une nouvelle étude démontre qu’une IA peut acquérir des valeurs culturelles spécifiques en observant des interactions humaines.
- L’apprentissage par renforcement inverse (IRL) s’avère plus efficace pour inculquer des valeurs qu’une simple programmation d’objectifs.
- Les résultats suggèrent qu’il est possible d’adapter les IA à des contextes culturels précis avant leur déploiement.
Les systèmes d’intelligence artificielle (IA) sont intrinsèquement influencés par les données sur lesquelles ils sont entraînés. Or, les valeurs et les normes varient considérablement d’une culture à l’autre. Une IA formée sur un ensemble de données global risque donc de ne pas fonctionner de manière optimale, voire de se montrer inappropriée, dans des contextes culturels différents. Pour pallier ce problème, une équipe de l’Université de Washington a exploré une approche novatrice : permettre aux IA d’apprendre les valeurs culturelles en observant directement le comportement humain.
Les chercheurs ont conçu une expérience dans laquelle des IA ont observé des participants issus de deux groupes culturels différents jouer à une version modifiée du jeu vidéo Overcooked. Dans ce jeu, les joueurs doivent collaborer pour préparer et livrer des soupes à l’oignon, mais l’un des joueurs se trouve dans une cuisine moins bien placée, ce qui le désavantage. Les participants pouvaient choisir d’aider ce joueur en lui fournissant des ingrédients, au détriment de leur propre performance. L’étude a révélé que les participants d’origine latino-américaine étaient, en moyenne, plus enclins à l’altruisme que ceux d’origine européenne. Les IA, en observant ces interactions, ont été capables d’apprendre le degré d’altruisme propre à chaque groupe et d’appliquer cette valeur à de nouveaux scénarios.
L’équipe a publié ses conclusions le 9 décembre dans la revue PLOS One. « Nous ne devrions pas imposer un ensemble de valeurs universelles aux systèmes d’IA, car de nombreuses cultures ont leurs propres valeurs », explique Rajesh Rao, professeur à la Paul G. Allen School of Computer Science & Engineering et codirecteur du Centre de neurotechnologie de l’UW. « Nous voulions savoir si une IA pouvait apprendre des valeurs de la même manière qu’un enfant, en observant les gens de sa culture et en intégrant leurs valeurs. »
L’étude s’inspire de recherches antérieures de l’Université de Washington qui ont montré que les enfants de 19 mois élevés dans des foyers latino-américains et asiatiques manifestaient une plus grande propension à l’altruisme que ceux issus d’autres cultures, comme le souligne une étude publiée dans Nature.
Pour l’étude, 190 adultes identifiés comme blancs et 110 adultes identifiés comme latinos ont participé. Chaque participant a été associé à un agent IA, un système capable d’agir de manière autonome.
Les agents ont été entraînés à l’aide d’une technique appelée apprentissage par renforcement inverse (IRL). Contrairement à l’apprentissage par renforcement (RL) classique, où l’IA est récompensée pour avoir atteint un objectif précis, l’IRL consiste à observer le comportement d’un humain ou d’une autre IA et à en déduire les objectifs et les récompenses sous-jacents. Ainsi, un robot entraîné au tennis avec RL serait récompensé pour chaque point marqué, tandis qu’un robot entraîné avec IRL observerait des joueurs professionnels et apprendrait à les imiter en déduisant des objectifs tels que marquer des points.
« Les parents n’entraînent pas simplement les enfants à accomplir une tâche spécifique encore et encore », explique Andrew Meltzoff, professeur de psychologie à l’UW et codirecteur de l’Institute for Learning & Brain Sciences (I-LABS). « Ils modélisent le comportement qu’ils souhaitent voir chez leurs enfants, en donnant l’exemple du partage et de l’attention aux autres. Les enfants apprennent les valeurs humaines presque par osmose, en observant comment les gens agissent dans leur communauté ou leur culture. »
Dans une deuxième expérience, les agents d’IA ont été confrontés à un nouveau scénario : décider de donner ou non une partie de leur argent à une personne dans le besoin. Les agents formés sur les données issues des participants latino-américains ont de nouveau fait preuve d’un comportement plus altruiste.
« Nous pensons que ces démonstrations de principe pourraient être améliorées en augmentant la quantité et la variété des données spécifiques à chaque culture fournies à l’IA », conclut Rao. « Cette approche permettrait à une entreprise de développer un modèle adapté aux valeurs d’une culture particulière avant de déployer son système d’IA dans cette culture. » Des recherches supplémentaires sont nécessaires pour évaluer l’efficacité de cette méthode dans des contextes réels, avec davantage de groupes culturels et des problèmes plus complexes.
« Créer une IA sensible à la culture est un enjeu majeur pour la société », souligne Meltzoff. « Comment pouvons-nous concevoir des systèmes capables de prendre en compte le point de vue des autres et de développer un esprit civique ? »
Nigini Oliveira, chercheuse postdoctorale à l’Allen School de l’UW, et Jasmin Li, ingénieure logicielle chez Microsoft (qui a mené cette recherche pendant ses études à l’UW), ont été les co-autrices principales de cette étude. Koosha Khalvati, scientifique à l’Allen Institute (ayant réalisé cette recherche en tant que doctorante à l’UW), Rodolfo Cortés Barragan, professeur adjoint à l’Université d’État de San Diego (chercheur postdoctoral à l’UW lors de cette étude), et Katharina Reinecke, professeure à l’Allen School et directrice du Centre pour une IA bénéfique à l’échelle mondiale à l’UW, ont également contribué à ce travail.
Pour toute information complémentaire, veuillez contacter Rajesh Rao à l’adresse [email protected].
