Ces robots savent quand demander de l’aide

Ces robots savent quand demander de l’aide

Un nouveau modèle de formation, baptisé « KnowNo », vise à résoudre ce problème en apprenant aux robots à demander notre aide lorsque les ordres ne sont pas clairs. Dans le même temps, cela garantit qu’ils ne demandent des éclaircissements que lorsque cela est nécessaire, minimisant ainsi les allers-retours inutiles. Le résultat est un assistant intelligent qui essaie de s’assurer qu’il comprend ce que vous voulez sans trop vous déranger.

Andy Zeng, chercheur chez Google DeepMind qui a contribué au développement de la nouvelle technique, affirme que même si les robots peuvent être puissants dans de nombreux scénarios spécifiques, ils sont souvent mauvais dans les tâches généralisées qui nécessitent du bon sens.

Par exemple, lorsqu’on lui demande de vous apporter un Coca, le robot doit d’abord comprendre qu’il doit aller dans la cuisine, chercher le réfrigérateur et ouvrir la porte du réfrigérateur. Traditionnellement, ces sous-étapes plus petites devaient être programmées manuellement, car sinon le robot ne saurait pas que les gens gardent habituellement leurs boissons dans la cuisine.

C’est un problème que les grands modèles linguistiques (LLM) pourraient aider à résoudre, car ils intègrent de nombreuses connaissances de bon sens, explique Zeng.

Désormais, lorsqu’on demande au robot d’apporter un Coca-Cola, un LLM, qui a une compréhension généralisée du monde, peut générer un guide étape par étape que le robot doit suivre.

Le problème avec les LLM, cependant, est qu’il n’y a aucun moyen de garantir que leurs instructions pourront être exécutées par le robot. Peut-être que la personne n’a pas de réfrigérateur dans la cuisine ou que la poignée de la porte du réfrigérateur est cassée. Dans ces situations, les robots doivent demander de l’aide aux humains.

Lire aussi  Les développeurs de Minecraft n'autoriseront pas les NFT sur la plate-forme de jeu | Minecraft

KnowNo rend cela possible en combinant de grands modèles linguistiques avec des outils statistiques qui quantifient les niveaux de confiance.

Lorsqu’on lui reçoit une instruction ambiguë telle que « Mettez le bol au micro-ondes », KnowNo génère d’abord plusieurs actions suivantes possibles à l’aide du modèle de langage. Il crée ensuite un score de confiance prédisant la probabilité que chaque choix potentiel soit le meilleur.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick