Publié le 2024-02-29. Gemini Pro, l’intelligence artificielle de Google, se dote d’une nouvelle capacité de création d’images baptisée Nano Banana Pro, qui promet des résultats plus réalistes et une meilleure compréhension des requêtes complexes, même si quelques limites persistent.
Les utilisateurs ayant accès à Gemini Pro, que ce soit via un compte professionnel ou un abonnement Google One, peuvent désormais tester cette nouvelle version des générateurs d’images. Nano Banana Pro combine la puissance de réflexion de Gemini Pro 3.0 avec la génération d’images, permettant à l’IA de mieux analyser et conceptualiser chaque requête avant de produire une image.
Pour tester ses capacités, les développeurs ont soumis une requête apparemment simple : une photographie de Jésus au volant d’une Škoda Fabia. Nano Banana Pro a réussi ce défi dès la première tentative, démontrant sa capacité à combiner des concepts abstraits (Jésus) avec des éléments concrets et spécifiques (une Škoda Fabia). Cette réussite souligne l’importance d’une compréhension approfondie de la requête par l’IA, notamment lorsqu’elle implique la reconnaissance d’objets précis.
L’image générée est non seulement réaliste, mais la plaque d’immatriculation (ASE 5512) est crédible et n’est pas actuellement enregistrée, comme l’ont vérifié les testeurs. L’IA a également intégré l’image dans un paysage typiquement tchèque, ajoutant au réalisme de la scène.
Cependant, Nano Banana Pro n’est pas infaillible. L’IA semble encore rencontrer des difficultés avec des concepts qui contredisent les données sur lesquelles elle a été entraînée. Par exemple, elle peine à représenter un train circulant sur une seule voie ferrée, même si de tels systèmes, bien que rares, ont existé dans le passé, comme en témoigne cet article.
L’IA a même initialement refusé de générer l’image d’un monocycle pour personne handicapée, un concept logiquement possible. Seulement après avoir été “persuadée” – en lui faisant remarquer qu’un monocycle a deux roues – a-t-elle produit une image d’un monocycle adapté, potentiellement utilisable par un sportif extrême.
En conclusion, Nano Banana Pro offre déjà des résultats prometteurs en matière de génération d’images réalistes, particulièrement pour les tâches courantes. Bien qu’elle puisse rencontrer des difficultés avec des requêtes plus complexes ou qui défient ses données d’apprentissage, une approche persuasive peut souvent l’aider à surmonter ces obstacles.
