Publié le 18 novembre 2025 à 12h06. Microsoft Research lance Project Gecko, une initiative ambitieuse visant à rendre l’intelligence artificielle plus accessible et adaptée aux besoins spécifiques des communautés sous-représentées à travers le monde, en commençant par le secteur agricole en Inde et au Kenya.
- Microsoft Research s’engage à développer des systèmes d’IA abordables et personnalisables pour la majorité de la population mondiale.
- Le projet Gecko se concentre sur l’utilisation des langues locales, la prise en compte des contextes culturels et l’intégration de données multimodales (texte, voix, vidéo).
- Un nouveau système d’IA, MMCTAgent, est au cœur de cette initiative, offrant des réponses contextuelles et pertinentes dans diverses langues.
L’essor de l’intelligence artificielle générative transforme la productivité à l’échelle mondiale, mais ses bénéfices ne sont pas uniformément répartis. Les systèmes d’IA actuels, souvent entraînés sur des données issues principalement de langues et de cultures occidentales, peinent à fonctionner efficacement pour les populations sous-représentées en ligne. Cet écart se traduit par une faible adoption de l’IA dans les pays où les langues à faibles ressources sont dominantes, même en tenant compte des facteurs économiques et d’accès à Internet.
Pour pallier ces inégalités, Microsoft Research a mis en place Project Gecko, une collaboration internationale impliquant des chercheurs de Microsoft Research Africa (Nairobi), de Microsoft Research India et du Microsoft Research Accelerator aux États-Unis. Le projet s’associe également à Digital Green, une organisation spécialisée dans le développement d’infrastructures numériques communautaires pour l’agriculture, ainsi qu’à d’autres partenaires issus des secteurs de l’agrotechnologie, de la philanthropie et du monde universitaire.
Au cœur de Project Gecko se trouve MMCTAgent (Multimodal Multi-Critical Thinking Agent), un nouveau système d’IA capable d’analyser des informations provenant de différentes sources – discours, images et vidéos – pour fournir des réponses précises et adaptées au contexte. Disponible sur Azure AI Foundry Labs, le code de MMCTAgent est également accessible sur GitHub.
Le projet a choisi de se concentrer initialement sur le secteur agricole, un domaine stratégique pour améliorer simultanément les conditions climatiques, sanitaires et éducatives. L’attention est particulièrement portée sur les petites exploitations agricoles en Inde et au Kenya, où des millions de personnes pourraient bénéficier de technologies permettant d’accroître les rendements et de renforcer la résilience face aux changements climatiques.
Project Gecko s’appuie sur VeLLM (universal Empowerment with LLMs), une plateforme développée par Microsoft Research India, qui permet de créer des systèmes d’IA capables de générer du contenu multilingue et multimodal à partir de données culturellement pertinentes. VeLLM a déjà démontré son efficacité en contribuant au développement de Shiksha, un assistant virtuel pour les enseignants des zones rurales de l’Inde.
L’agriculture est un pilier économique essentiel au Kenya et en Inde, représentant une part significative du PIB et employant une grande majorité de la population, notamment de petits exploitants. Cependant, les services numériques existants, destinés à aider les agriculteurs à faire face aux défis liés à la météo et aux parasites, sont souvent limités par leur dépendance à des modèles linguistiques massifs (LLM) entraînés principalement sur l’anglais et les langues occidentales. Cela rend difficile pour les agriculteurs d’obtenir des réponses précises dans leur langue locale et en utilisant la terminologie spécifique à leur domaine d’activité, ce qui freine l’adoption de ces technologies.
Le projet collabore étroitement avec FarmerChat, un assistant d’IA vocal développé par Digital Green, qui conseille déjà des millions d’agriculteurs. Digital Green a constitué une vaste bibliothèque de plus de 10 000 vidéos, dans plus de 40 langues et dialectes, au cours des deux dernières décennies, une ressource précieuse et sous-exploitée. L’objectif est de faire évoluer FarmerChat d’un simple outil de questions-réponses à un véritable compagnon agricole de confiance.
Grâce au cadre MMCTAgent, les agriculteurs pourront poser des questions en utilisant leur voix ou du texte et recevoir des réponses concrètes, étape par étape, dans leur langue préférée, sous forme de texte, de voix ou de vidéos illustrant directement la solution proposée. MMCTAgent améliore les modèles d’IA existants grâce à des outils spécifiques au domaine agricole, traitant différents types d’informations et décomposant les questions complexes. Il utilise des techniques de traitement du langage naturel (TLN) et de vision par ordinateur pour mieux comprendre les vidéos et les transcriptions de la bibliothèque Digital Green, les rendant ainsi plus accessibles et consultables.
Pour surmonter le manque de données d’entraînement et de ressources informatiques pour les langues à faibles ressources, l’équipe de Project Gecko développe de nouveaux modèles à partir de zéro, notamment des modèles de reconnaissance vocale automatique (ASR) et de synthèse vocale (TTS). Elle utilise également des modèles de langage réduits (SLM), qui nécessitent moins de puissance de calcul que les LLM massifs, ce qui facilite leur adaptation aux domaines et aux langues ciblés. Des modèles vocaux et SLM sur mesure sont ainsi créés pour des langues telles que le kiswahili, l’hindi et le kikuyu, et sont continuellement améliorés grâce aux données fournies par les utilisateurs.
À l’avenir, Project Gecko ambitionne d’étendre son impact à d’autres secteurs, tels que la santé, l’éducation et la vente au détail. En s’inspirant des modèles de conception et des infrastructures efficaces développés dans le domaine agricole, Microsoft espère créer des solutions généralisables. L’équipe prévoit également de publier un guide multilingue pour aider les développeurs à créer des applications d’IA multilingues spécifiques à un domaine, en s’appuyant sur l’expérience interculturelle des équipes de recherche Microsoft en Inde et au Kenya. L’objectif ultime est de garantir que la prochaine génération d’IA soit inclusive, culturellement pertinente et façonnée par les communautés qu’elle est censée servir.
