Il y a eu un grand intérêt pour ce que le laboratoire des machines de pensée de Mira Murati construit avec son 2 milliards de dollars de financement de semences et l’équipe des étoiles d’anciens chercheurs d’Openai qui ont rejoint le laboratoire. Dans un article de blog Publié mercredi, le laboratoire de recherche de Murati a donné au monde son premier aperçu de l’un de ses projets: créer des modèles d’IA avec des réponses reproductibles.
Le billet de blog de recherche, intitulé «Vaincre le non-déterminisme dans l’inférence LLM», essaie de déballer la cause profonde de ce qui introduit le caractère aléatoire dans les réponses du modèle d’IA. Par exemple, posez à chatte la même question à quelques reprises et vous aurez probablement un large éventail de réponses. Cela a été largement accepté dans la communauté de l’IA comme un fait – les modèles d’IA d’aujourd’hui sont considérés comme des systèmes non déterministes – mais le laboratoire des machines de réflexion considère cela comme un problème résoluble.
Le post, rédigé par le chercheur de laboratoire des machines de pensée Horace He, fait valoir que la cause profonde de l’aléatoire des modèles d’IA est la façon dont les nains GPU – les petits programmes qui fonctionnent à l’intérieur des puces informatiques de Nvidia – sont cousues ensemble dans le traitement d’inférence (tout ce qui se passe après avoir appuyé sur Entrée dans Chatgpt). Il suggère qu’en contrôlant soigneusement cette couche d’orchestration, il est possible de rendre les modèles AI plus déterministes.
Au-delà de la création de réponses plus fiables pour les entreprises et les scientifiques, il note que l’obtention de modèles d’IA générer des réponses reproductibles pourrait également améliorer la formation d’apprentissage par renforcement (RL). RL est le processus de récompense des modèles d’IA pour les réponses correctes, mais si les réponses sont toutes légèrement différentes, les données deviennent un peu bruyantes. Créer des réponses plus cohérentes sur les modèles d’IA pourrait rendre l’ensemble du processus RL «plus lisse», selon He. Thinking Machines Lab a déclaré aux investisseurs qu’il prévoyait d’utiliser RL pour Personnaliser les modèles d’IA pour les entreprisesLes informations précédemment rapportées.
Murati, l’ancien directeur de la technologie d’Openai, a déclaré en juillet que le premier produit de Thinking Machines Lab sera dévoilé dans les prochains moiset qu’il sera «utile pour les chercheurs et les startups qui développent des modèles personnalisés». On ne sait toujours pas quel est ce produit, ou s’il utilisera des techniques de cette recherche pour générer des réponses plus reproductibles.
Thinking Machines Lab a également déclaré qu’il prévoyait de publier fréquemment des articles de blogCode et autres informations sur ses recherches dans le but de «bénéficier au public, mais aussi d’améliorer notre propre culture de recherche». Cet article, le premier de la nouvelle série de blogs de l’entreprise intitulé «Connexionnisme», semble faire partie de cet effort. Openai s’est également engagé à ouvrir la recherche lors de sa création, mais la société est devenue plus fermée à mesure qu’elle est devenue plus grande. Nous verrons si le laboratoire de recherche de Murati reste fidèle à cette affirmation.
Le blog de recherche offre un aperçu rare dans l’une des startups d’IA les plus secrètes de la Silicon Valley. Bien qu’il ne révèle pas exactement où se déroule la technologie, cela indique que Thinking Machines Lab s’attaque à certaines des plus grandes questions de la frontière de la recherche sur l’IA. Le véritable test est de savoir si le laboratoire des machines de réflexion peut résoudre ces problèmes et faire des produits autour de ses recherches pour justifier sa valorisation de 12 milliards de dollars.
Événement >
San Francisco
|
27-29 octobre 2025
