Home Technologie et scienceComment cette percée de l’IA avec des mathématiques pures et l’apprentissage du renforcement pourrait aider à prédire les crises futures

Comment cette percée de l’IA avec des mathématiques pures et l’apprentissage du renforcement pourrait aider à prédire les crises futures

by Thomas Caron

Imaginez savoir que le marché boursier se bloquera probablement dans trois ans, que les conditions météorologiques extrêmes détruiront votre maison en huit ou que vous aurez une maladie débilitante dans 15 – mais vous pouvez prendre des mesures maintenant pour vous protéger de ces crises. Bien que prédire l’avenir avec certitude sera toujours impossible, intelligence artificielle pourrait se rapprocher de cela, suggèrent certains experts. Les prédictions d’une telle ampleur nécessiteraient de faire des milliards de connexions dans d’immenses ensembles de données à travers d’énormes distances ou périodes. Bien que de telles capacités dépassent les systèmes d’IA actuels, un percée mathématique Décrit dans un récent document de préparation pourrait fournir des indices pour naviguer dans de telles données et trouver les modèles plus importants pour révéler des résultats que les gens ne seraient pas en mesure de prédire autrement.

Pour développer un système d’IA capable de faire un travail aussi difficile, une équipe de chercheurs du California Institute of Technology et d’autres institutions a utilisé la conjecture d’Andrews-Curtis – un problème mathématique intraitable de la théorie du groupe, un domaine qui étudie la symétrie, la structure et les opérations en groupes mathématiques. Proposé par les mathématiciens James Andrews et Morton Curtis en 1965, la conjecture suggère que une configuration mathématique aussi compliquée pourrait être réduite à sa forme la plus élémentaire par une séquence finie de trois mouvements. Une façon de visualiser la conjecture est d’imaginer un vaste labyrinthe dans lequel un joueur essaie de connecter tous les points à un point central de «maison». La durée de tout chemin unique pourrait être inimaginablement longue et nécessiter des millions, voire des milliards de mesures dans le labyrinthe, explique Sergei Gukov, l’auteur principal de l’étude et professeur de mathématiques à Caltech. «C’est la raison pour laquelle nous avons choisi ce problème», dit-il, «parce que c’est un problème mathématique où, afin de progresser, nous sommes essentiellement obligés de développer de nouveaux systèmes d’IA qui peuvent s’adapter à ce niveau de complexité.»

Au cours des 60 années qui ont suivi la formulation de la conjecture d’Andrews-Curtis, la conjecture n’a jamais été prouvée ou réfutée. Prouver que cela signifierait montrer que chaque description éligible peut être connectée à la description «à domicile» standard. Répartir qu’il faudrait montrer un soi-disant contre-exemple dans lequel il n’y a pas de «chemin» pour atteindre la conjecture. «A priori, on ne sait pas si des chemins existent [for coordinates]et l’objectif est d’essayer de prouver ou de réfuter si un chemin existe ou de trouver un exemple lorsqu’un chemin notexiste », explique l’auteur principal de l’étude, Ali Shehper, un chercheur principal de l’IA à Caltech. Pendant des décennies, les mathématiciens ont tenté de réfuter la conjecture en proposant de nombreux contre-exemples pour lesquels aucune voie ne pouvait être trouvée. Des contre-exemples potentiels, montrant ainsi qu’aucune de ces propositions ne réfute réellement la conjecture.


Sur le soutien du journalisme scientifique

Si vous appréciez cet article, envisagez de soutenir notre journalisme primé par abonnement. En achetant un abonnement, vous contribuez à assurer l’avenir des histoires percutantes sur les découvertes et les idées qui façonnent notre monde aujourd’hui.


Avec la conjecture d’Andrews-Curtis comme modèle, l’équipe a créé un jeu: Imaginez une planche d’échecs mais avec un million ou même un milliard de carrés. En tant que joueur, vous devez atteindre un carré «à la maison» désigné – en utilisant une boîte à outils de quelques mouvements, similaire à la façon dont chaque pièce d’échecs peut être déplacée de manière spécifique. Mais c’est un jeu solitaire: vous êtes le seul joueur, et votre travail consiste à prendre toute coordonnée qui vous est donnée et à déterminer si, en utilisant une combinaison des mouvements disponibles autant de fois que nécessaire, vous pouvez atteindre la maison. Pour les coordonnées plus près de chez nous, la tâche n’est pas si difficile. Mais lorsque les coordonnées sont éloignées, trouver votre chemin par essais et erreurs pourrait facilement prendre une vie, surtout parce que vous n’avez aucun moyen de juger immédiatement si chaque étape franchie est sur le bon chemin jusqu’à ce que vous atteigniez la destination. Le chemin est également beaucoup plus long que la distance réelle entre les deux points. «Pour passer de A à B, vous devez parcourir des milliers de kilomètres dans ce labyrinthe compliqué, même si la distance réelle peut être très petite», explique Gukov. “C’est donc comme un diable a conçu le labyrinthe.”

Pour former l’IA pour jouer au jeu, l’équipe de Gukov a utilisé l’apprentissage du renforcement, une technique d’apprentissage automatique où un agent d’IA – un système qui prend des décisions et prend des actions pour atteindre un objectif – applique quelles actions fonctionnent le mieux par essais et erreurs et en recevant des récompenses ou des pénalités. “Si vous montrez simplement les problèmes difficiles de l’agent au début, cela ne saura pas quoi faire avec eux. Mais si vous montrez d’abord des problèmes plus faciles, cela aide vraiment”, dit Shehper.

Mais pour traverser les immenses espaces requis par la conjecture d’Andrews-Curtis, les petites étapes ne sont pas suffisantes. Le jeu aborde ce problème en utilisant deux agents d’IA avec des rôles distincts: un joueur et un observateur. En regardant le joueur et en évaluant ses succès, l’agent d’observateur commence à combiner des mouvements de base dans des combinaisons, ou «supermoves», que le joueur peut ensuite utiliser pour faire des bonds plus gros. Au fur et à mesure que le joueur exécute ses mouvements disponibles pour exceller sur les chemins plus courts, l’observateur apprend à évaluer la difficulté des coordonnées et à évaluer quels supermoves serviront le mieux le joueur; Il fournit ensuite ces supermoves stratégiquement lorsque le joueur est le plus susceptible de les utiliser.

Alors que les coordonnées les plus faciles peuvent nécessiter jusqu’à 10 mouvements pour atteindre «la maison», les coordonnées plus difficiles se développent rapidement en complexité. «Mathématiquement, on sait qu’il existe des cas où il a besoin de milliards de mouvements, mais nous n’y sommes pas encore arrivés avec notre système d’IA», explique Shehper. «Nous sommes dans la gamme de milliers de mouvements.»

Des milliers de mouvements ont néanmoins été suffisants pour innover sur des contre-exemples de longue date à la conjecture d’Andrews-Curtis. En utilisant le système d’IA agentique, l’équipe a pu résoudre de grandes familles de contre-exemples potentiels de longue date qui étaient ouverts depuis 30 ans. Il a même progressé sur une série de contre-exemples qui existent depuis environ quatre décennies, réduisant la plupart d’entre eux à des formes plus simplifiées. UN étude de préimpression À l’Université de Liverpool, a depuis indépendamment confirmé les résultats de l’équipe de Gukov.

«Ce qu’ils ont fait, c’est au-delà des attentes que j’avais» pour ce que l’IA pourrait faire avec la conjecture, explique Alexei Miasnikov, professeur de mathématiques au Stevens Institute of Technology. Miasnikov, qui a conduit Recherche sur la conjecture d’Andrews-Curtis et n’a pas été impliqué dans l’étude de l’équipe de Gukov, dit que leur travail a montré à quel point le renforcement de la machine pourrait être utile pour les mathématiques expérimentales. “Cela montre que vous pouvez obtenir des résultats intéressants que vous ne pouvez pas obtenir sans ordinateur”, explique Miasnikov. «Je pense que des choses beaucoup plus intéressantes seront développées bientôt. Nous sommes juste au début.»

L’équipe de Gukov espère créer des outils pour un large éventail de problèmes en mathématiques et en dehors de celui-ci, dit Shehper. Les systèmes d’IA actuels, tels que Alphago (qui joue GO) ou Alphastar (qui joue le jeu vidéo Starcraft II), et même de nombreux modèles de grande langue, tels que GPT d’Openai ou Grok de Xai, traitent des problèmes qui sont connus pour être résolubles, et ils fonctionnent pour trouver des solutions plus optimales. «Nous savons que les échecs et les choses sont des problèmes résolubles», explique Shehper. “Un jeu se termine, et vous gagnez ou perdez, et ces systèmes trouvent en fait une meilleure façon de le faire.” L’objectif de l’équipe est de développer des systèmes pour résoudre les problèmes où les mathématiciens ne savent pas encore si des solutions existent – et où le chemin pour évaluer si une réponse pourrait être possible est incalable.

Gukov et Shehper espèrent que les nouveaux outils qu’ils développent pourront finalement être appliqués aux prédictions du monde réel. Peut-être que les futurs modèles d’IA seront en mesure de prévoir comment les machines complexes pourraient échouer après des années d’utilisation, comment les systèmes de conduite automatisés pourraient produire des erreurs rares mais dangereuses sur de longues périodes et comment la maladie pourrait survenir chez un individu au fil des décennies. Ils pourraient potentiellement être appliqués à de nombreux domaines, tels que la médecine, la cryptographie, la finance et la modélisation du climat. “Vous pourriez dire que nous développons des systèmes d’IA pour de telles applications”, dit Gukov, “mais d’abord, nous les entraînons simplement avec les mathématiques. Les mathématiques sont bon marché, donc nous n’allons pas brûler l’argent de quelqu’un ou faire de mauvaises prédictions sur les ouragans.”

Quant à prouver ou à réfuter la conjecture d’Andrews-Curtis elle-même, le système d’IA développé par l’équipe de Gukov est loin de le faire – et ce n’est même pas l’objectif des chercheurs. Mais en excluant les contre-exemples, leur travail a fourni un nouveau soutien à la conjecture. «La croyance commune en [mathematics] La communauté lorsque nous avons commencé ce travail était que la conjecture d’Andrews-Curtis est probablement fausse, donc il faut donc essayer de le réfuter », explique Gukov.« Mais après avoir passé plusieurs années sur cette conjecture, j’ai commencé à croire qu’il y a peut-être une chance – une bonne chance – c’est en fait vrai. »

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.