GPT-4 rendra ChatGPT plus intelligent mais ne corrigera pas ses défauts

GPT-4 rendra ChatGPT plus intelligent mais ne corrigera pas ses défauts

Avec son étrangeté capable de tenir une conversation, de répondre à des questions et d’écrire de la prose, de la poésie et du code cohérents, le chatbot ChatGPT a forcé de nombreuses personnes à repenser le potentiel de l’intelligence artificielle.

La startup qui a créé ChatGPT, OpenAI, a annoncé aujourd’hui une nouvelle version très attendue du modèle d’IA en son cœur.

Le nouvel algorithme, appelé GPT-4, suit GPT-3, un modèle de génération de texte révolutionnaire annoncé par OpenAI en 2020, qui a ensuite été adapté pour créer ChatGPT l’année dernière.

Le nouveau modèle obtient des scores plus élevés sur une gamme de tests conçus pour mesurer l’intelligence et les connaissances chez les humains et les machines, selon OpenAI. Il fait également moins d’erreurs et peut répondre aux images ainsi qu’au texte.

Cependant, GPT-4 souffre des mêmes problèmes qui ont tourmenté ChatGPT et font que certains experts en intelligence artificielle sont sceptiques quant à son utilité, y compris des tendances à “halluciner” des informations incorrectes, à présenter des préjugés sociaux problématiques et à se comporter mal ou à adopter des personnalités dérangeantes lorsqu’on leur donne un ” contradictoire ».

“Bien qu’ils aient fait beaucoup de progrès, ce n’est clairement pas digne de confiance”, déclare Oren Etzioni, professeur émérite à l’Université de Washington et PDG fondateur de l’Allen Institute for AI. “Il va falloir beaucoup de temps avant que vous vouliez qu’un GPT fasse fonctionner votre centrale nucléaire.”

OpenAI a fourni plusieurs démos et données issues de tests d’analyse comparative pour montrer les capacités de GPT-4. Le nouveau modèle peut non seulement battre le score de passage à l’examen uniforme du barreau, qui est utilisé pour qualifier les avocats dans de nombreux États américains, mais il a obtenu un score dans les 10% supérieurs de ceux des humains.

Lire aussi  Activision Blizzard fait face à un recours collectif pour des investisseurs «trompeurs» dans la perspective du procès DFEH

Il obtient également des scores plus élevés que GPT-3 sur d’autres examens conçus pour tester les connaissances et le raisonnement, dans des matières telles que la biologie, l’histoire de l’art et le calcul. Et il obtient de meilleures notes que tout autre modèle de langage d’IA sur des tests conçus par des informaticiens pour évaluer les progrès de ces algorithmes. “D’une certaine manière, c’est plus ou moins la même chose”, dit Etzioni. “Mais c’est plus ou moins la même chose dans une série d’avancées absolument époustouflantes.”

GPT-4 peut également effectuer des astuces intéressantes vues auparavant avec GPT-3 et ChatGPT, comme résumer et suggérer des modifications à des morceaux de texte. Il peut également faire des choses que ses prédécesseurs ne pouvaient pas, notamment agir en tant que tuteur socratique qui aide à guider les étudiants vers les bonnes réponses et à discuter du contenu des photographies. Par exemple, si une photo d’ingrédients sur un comptoir de cuisine est fournie, GPT-4 peut suggérer une recette appropriée. S’il est accompagné d’un tableau, il peut expliquer les conclusions qui peuvent en être tirées.

“Il semble définitivement avoir acquis des capacités”, déclare Vincent Conitzer, professeur à la CMU spécialisé dans l’IA et qui a commencé à expérimenter le nouveau modèle de langage. Mais il dit qu’il fait encore des erreurs, comme suggérer des directions absurdes ou présenter de fausses preuves mathématiques.

ChatGPT a attiré l’attention du public avec une capacité étonnante à aborder de nombreuses questions et tâches complexes via une interface conversationnelle facile à utiliser. Le chatbot ne comprend pas le monde comme le font les humains et répond simplement avec des mots qui, selon les statistiques, devraient suivre une question.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick