Home Technologie et scienceCette startup veut déclencher un moment DeepSeek aux États-Unis

Cette startup veut déclencher un moment DeepSeek aux États-Unis

by Thomas Caron

Publié le 26 octobre 2023 14:15:00. Une startup française, Prime Intellect, se lance dans la création d’une intelligence artificielle (IA) ouverte et compétitive, en rupture avec la domination des modèles américains et chinois, grâce à une nouvelle approche de l’apprentissage par renforcement distribué.

  • Prime Intellect développe INTELLECT-3, un modèle de langage à grande échelle, en utilisant un système d’apprentissage par renforcement décentralisé.
  • L’entreprise vise à démocratiser l’accès à l’IA en permettant à un plus grand nombre d’acteurs de créer et de modifier des modèles avancés.
  • L’apprentissage par renforcement, étape cruciale pour améliorer les performances des IA, est devenu un point de blocage que Prime Intellect cherche à résoudre.

Depuis l’émergence de DeepSeek en janvier dernier, l’intérêt pour les modèles d’IA open source chinois ne cesse de croître. Face à cette dynamique, une nouvelle entreprise française, Prime Intellect, entend bouleverser les codes en proposant une alternative décentralisée et accessible. L’objectif : briser le monopole des géants technologiques et permettre à un plus large éventail d’utilisateurs de participer à la création de l’IA de demain.

Selon Vincent Weisser, PDG de Prime Intellect, le paysage actuel de l’IA est polarisé entre les modèles propriétaires américains et les offres open source chinoises. « Le monde de l’IA est actuellement divisé entre ceux qui s’appuient sur des modèles américains fermés et ceux qui utilisent des offres chinoises ouvertes », explique-t-il. La technologie développée par sa société ambitionne de démocratiser l’IA en offrant à chacun la possibilité de concevoir et de personnaliser des systèmes d’intelligence artificielle de pointe.

L’amélioration des modèles d’IA ne se limite plus à l’augmentation des données d’entraînement et de la puissance de calcul. Les modèles les plus performants utilisent désormais l’apprentissage par renforcement pour affiner leurs capacités après une phase de pré-entraînement. Il s’agit de soumettre le modèle à des exercices spécifiques – résoudre des équations mathématiques, répondre à des questions juridiques, jouer à des jeux – et de le récompenser ou de le pénaliser en fonction de ses résultats.

« Ces environnements d’apprentissage par renforcement constituent désormais un goulot d’étranglement pour réellement faire évoluer les capacités », souligne Vincent Weisser. Prime Intellect a donc mis au point un cadre permettant à chacun de créer son propre environnement d’apprentissage par renforcement, adapté à une tâche particulière. L’entreprise combine les meilleurs environnements développés par son équipe et par la communauté pour optimiser INTELLECT-3.

Pour illustrer le potentiel de cette approche, un chercheur de Prime Intellect, Will Brown, a créé un environnement dédié à la résolution d’énigmes Wordle. En observant un modèle de petite taille résoudre ces énigmes, il a pu constater son efficacité et sa méthode, bien plus méthodique que la sienne. L’idée est que, pour un chercheur souhaitant améliorer un modèle, il suffise de lui faire pratiquer intensivement dans un environnement contrôlé, en utilisant des algorithmes d’apprentissage par renforcement pour ajuster ses paramètres et le transformer en un expert dans un domaine spécifique.

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.