L’aventure ASCII vieille de plusieurs décennies NetHack peut faire allusion à l’avenir de l’IA – >

Les modèles d’apprentissage automatique maîtrisent déjà les jeux d’échecs, de go, d’Atari et plus encore, mais pour qu’il passe au niveau supérieur, les chercheurs de Facebook ont ​​l’intention que l’IA s’attaque à un autre type de jeu : le NetHack notoirement difficile et infiniment complexe.

« Nous voulions construire ce que nous pensons être le « grand défi » le plus accessible avec ce jeu. Ce ne sera pas résoudre l’IA, mais elle ouvrira des voies vers mieux AI », a déclaré Edward Grefenstette de Facebook AI Research. “Les jeux sont un bon domaine pour trouver nos hypothèses sur ce qui rend les machines intelligentes et les briser.”

Vous n’êtes peut-être pas familier avec NetHack, mais c’est l’un des jeux les plus influents de tous les temps. Vous êtes un aventurier dans un monde fantastique, plongeant dans les profondeurs de plus en plus dangereuses d’un donjon différent à chaque fois. Vous devez combattre des monstres, naviguer dans des pièges et d’autres dangers, tout en restant en bons termes avec votre dieu. C’est le premier “roguelike” (après Rogue, son prédécesseur immédiat et beaucoup plus simple) et sans doute toujours le meilleur – presque certainement le plus difficile.

(C’est gratuit, d’ailleurs, et vous pouvez le télécharger et y jouer sur presque n’importe quelle plate-forme.)

Ses graphismes ASCII simples, utilisant ag pour un gobelin, un @ pour le joueur, des lignes et des points pour l’architecture du niveau, etc., démentent son incroyable complexité. Parce que Nethack, qui a fait ses débuts en 1987, est en développement actif depuis, avec son équipe changeante de développeurs élargissant sa liste d’objets et de créatures, de règles et les innombrables, innombrables interactions entre eux tous.

Et cela fait partie de ce qui fait de NetHack un défi si difficile et intéressant pour l’IA : c’est tellement ouvert. Non seulement le monde est différent à chaque fois, mais chaque objet et créature peut interagir de nouvelles manières, la plupart codées à la main au fil des décennies pour couvrir tous les choix possibles des joueurs.

NetHack avec une mise à jour graphique basée sur des tuiles – toutes les informations sont toujours disponibles par texte.

« Atari, Dota 2, StarCraft 2… les solutions que nous avons eues pour progresser là-bas sont très intéressantes. NetHack présente simplement différents défis. Vous devez vous fier aux connaissances humaines pour jouer au jeu en tant qu’humain », a déclaré Grefenstette.

Lire aussi  La première partie du mod Titanic pour Mafia est maintenant disponible • -

Dans ces autres jeux, il y a une stratégie plus ou moins évidente pour gagner. Bien sûr, c’est plus complexe dans un jeu comme Dota 2 que dans un jeu Atari 800, mais l’idée est la même : il y a des pièces que le joueur contrôle, un environnement de jeu et des conditions de victoire à poursuivre. C’est un peu le cas dans NetHack, mais c’est plus étrange que ça. D’une part, le jeu est différent à chaque fois, et pas seulement dans les détails.

« Nouveau donjon, nouveau monde, nouveaux monstres et objets, vous n’avez pas de point de sauvegarde. Si vous faites une erreur et que vous mourez, vous n’avez pas de deuxième chance. C’est un peu comme dans la vraie vie », a déclaré Grefenstette. « Vous devez apprendre de vos erreurs et aborder de nouvelles situations avec ces connaissances. »

Boire une potion corrosive est une mauvaise idée, bien sûr, mais qu’en est-il de la jeter sur un monstre ? Enduire votre arme avec ? Le verser sur la serrure d’un coffre au trésor ? Le diluer avec de l’eau ? Nous avons des idées intuitives sur ces actions, mais une IA qui joue au jeu ne pense pas comme nous.

La profondeur et la complexité des systèmes de NetHack sont difficiles à expliquer, mais cette diversité et cette difficulté font du jeu un candidat parfait pour une compétition, selon Grefenstette. “Vous devez vous fier aux connaissances humaines pour jouer au jeu”, a-t-il déclaré.

Les gens conçoivent depuis de nombreuses années des robots pour jouer à NetHack qui ne reposent pas sur des réseaux de neurones mais sur des arbres de décision aussi complexes que le jeu lui-même. L’équipe de Facebook Research espère engendrer une nouvelle approche en créant un environnement de formation sur lequel les gens peuvent tester des algorithmes de jeu basés sur l’apprentissage automatique.

Écrans NetHack avec des étiquettes indiquant ce dont l’IA est consciente.

L’environnement d’apprentissage NetHack a été mis en place l’année dernière, mais le NetHack Challenge ne fait que commencer. Le NLE est essentiellement une version du jeu intégrée dans un environnement informatique dédié qui permet à une IA d’interagir avec lui via des commandes textuelles (directions, actions comme attaquer ou bouffer)

Lire aussi  Test d'eau Galaxy Z Fold 3, Z Flip 3 : jusqu'où peuvent-ils aller ?

C’est une cible tentante pour les concepteurs d’IA ambitieux. Alors que des jeux comme StarCraft 2 peuvent bénéficier d’un profil plus élevé à certains égards, NetHack est légendaire et l’idée de construire un modèle sur des lignes complètement différentes de celles utilisées pour dominer d’autres jeux est un défi intéressant.

C’est aussi, comme l’a expliqué Grefenstette, plus accessible que beaucoup par le passé. Si vous vouliez créer une IA pour StarCraft 2, vous aviez besoin de beaucoup de puissance de calcul pour exécuter des moteurs de reconnaissance visuelle sur les images du jeu. Mais dans ce cas, tout le jeu est transmis par texte, ce qui le rend extrêmement efficace à travailler. Il peut être joué des milliers de fois plus rapidement que n’importe quel humain, même avec la configuration informatique la plus basique. Cela laisse le défi grand ouvert aux individus et aux groupes qui n’ont pas accès au type de configurations haute puissance nécessaires pour alimenter d’autres méthodes d’apprentissage automatique.

“Nous voulions créer un environnement de recherche qui présentait de nombreux défis pour la communauté de l’IA, mais pas le restreindre aux seuls grands laboratoires universitaires”, a-t-il déclaré.

Au cours des prochains mois, NLE sera disponible pour les personnes à tester, et les concurrents peuvent essentiellement créer leur bot ou leur IA par tous les moyens de leur choix. Mais lorsque la compétition elle-même commencera sérieusement le 15 octobre, ils se limiteront à interagir avec le jeu dans son environnement contrôlé via des commandes standard – pas d’accès spécial, pas d’inspection de la RAM, etc.

Lire aussi  Ce que signifie le flot d'alertes Covid au Royaume-Uni pour les applications d'exposition

Le but de la compétition sera de terminer le jeu, et l’équipe Facebook suivra combien de fois l’agent « monte », comme on l’appelle dans NetHack, dans un laps de temps défini. Mais “nous supposons que ce sera zéro pour tout le monde”, a admis Grefenstette. Après tout, c’est l’un des jeux les plus difficiles jamais créés, et même les humains qui y jouent depuis des années ont du mal à gagner ne serait-ce qu’une fois dans leur vie, et encore moins plusieurs fois de suite. Il y aura d’autres mesures de notation pour juger les gagnants dans un certain nombre de catégories.

L’espoir est que ce défi jette les bases d’une nouvelle approche de l’IA, qui ressemble plus fondamentalement à la pensée humaine réelle. Les raccourcis, les essais et erreurs, le piratage de score et le zerging ne fonctionneront pas ici – l’agent doit apprendre des systèmes de logique et les appliquer de manière flexible et intelligente, ou mourir horriblement aux mains d’un centaure ou d’un hiboux enragé.

Vous pouvez consulter les règles et autres spécificités du NetHack Challenge ici. Les résultats seront annoncés lors de la conférence NeurIPS plus tard cette année.

Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick