Home Technologie et scienceLes mauvaises incitations sont-elles à blâmer pour les hallucinations de l’IA?

Les mauvaises incitations sont-elles à blâmer pour les hallucinations de l’IA?

by Thomas Caron

UN Nouveau document de recherche d’Openai demande pourquoi de grands modèles de langue comme GPT-5 et des chatbots comme Chatgpt s’hallucinent toujours, et si quelque chose peut être fait pour réduire ces hallucinations.

Dans Un article de blog résumant le documentOpenai définit les hallucinations comme «des déclarations plausibles mais fausses générées par les modèles de langues», et il reconnaît que malgré les améliorations, les hallucinations «restent un défi fondamental pour tous les modèles de langage grand» – qui ne sera jamais complètement éliminé.

Pour illustrer le point, les chercheurs disent que lorsqu’ils ont demandé «un chatbot largement utilisé» sur le titre du doctorat d’Adam Tauman Kalai. Dissertation, ils ont obtenu trois réponses différentes, toutes mal. (Kalai est l’un des auteurs du journal.) Ils ont ensuite posé des questions sur son anniversaire et ont reçu trois dates différentes. Encore une fois, tous avaient tort.

Comment un chatbot peut-il être si faux – et semble si confiant dans son industrie? Les chercheurs suggèrent que les hallucinations surviennent, en partie, en raison d’un processus de pré-formation qui se concentre sur l’obtention de modèles pour prédire correctement le mot suivant, sans étiquettes vraies ou fausses attachées aux déclarations de formation: «Le modèle ne voit que des exemples positifs de langage courant et doit approximativement la distribution globale.»

«L’orthographe et les parenthèses suivent des modèles cohérents, donc les erreurs disparaissent avec l’échelle», écrivent-ils. “Mais des faits arbitraires à basse fréquence, comme l’anniversaire d’un animal de compagnie, ne peuvent pas être prédits à partir de modèles seuls et conduisent donc à des hallucinations.”

La solution proposée par l’article, cependant, se concentre moins sur le processus de pré-formation initial et plus sur la façon dont les grands modèles de langage sont évalués. Il fait valoir que les modèles d’évaluation actuels ne provoquent pas les hallucinations elles-mêmes, mais elles «définissent les mauvaises incitations».

Les chercheurs comparent ces évaluations au type de tests à choix multiples de supposition aléatoire, car «vous pourriez avoir de la chance et avoir raison», tout en laissant la réponse vide «garantit un zéro».

Événement >

San Francisco
|
27-29 octobre 2025

«De la même manière, lorsque les modèles sont classés uniquement sur la précision, le pourcentage de questions qu’ils se répercutent exactement, ils sont encouragés à deviner plutôt que de dire« Je ne sais pas », disent-ils.

La solution proposée est donc similaire aux tests (comme le SAT) qui incluent «négatif [scoring] Pour de mauvaises réponses ou un crédit partiel pour avoir laissé des questions vides pour décourager les devinettes aveugles. » De même, Openai affirme que les évaluations du modèle doivent «pénaliser davantage les erreurs confiantes que vous pénalisez l’incertitude et accorder un crédit partiel pour les expressions d’incertitude appropriées».

Et les chercheurs soutiennent qu’il ne suffit pas d’introduire «quelques nouveaux tests conscients de l’incertitude sur le côté». Au lieu de cela, “les étions largement utilisées et basées sur la précision doivent être mises à jour afin que leur score décourage deviner.”

“Si les principaux tableaux de bord restent enrichissants des suppositions chanceuses, les modèles continueront d’apprendre à deviner”, disent les chercheurs.

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.