Google I/O 2024 : mise à jour Gemini AI, sera-ce la 8ème comme promis ?

Il n’y a pas de recherches récentes.

Résumé de la mise à jour et scénario d’utilisation de Google I/O 2024 Gemini AI

3 raisons pour lesquelles l’auteur recommande cet article !

1. Google E/S 2024Un bref résumé de la mise à jour Gemini introduite dans

2. Introduction à des scénarios spécifiques utilisant l’agent Gemini AI

3. Ce que les Gémeaux devraient apprendre du Chat GPT-4o d’OpenAI

Google I/O 2024, résumé de la mise à jour de Gemini AI

Services inclus : Gemini, dévoilé pour la première fois lors de la dernière I/O, a désormais évolué vers 1.5 flash, 1.5 Pro et Advanced, traitant 1 million de contextes et prenant en charge 35 langues (prévu pour s’étendre au traitement de 2 millions de contextes)
Construire des systèmes intelligents pour les utilisateurs :Nous recherchons actuellement un système automatisé qui réduirait les tracas du quotidien, comme le traitement des retours après les achats et la préparation du déménagement.
Une nouvelle façon de conserver et de communiquer les souvenirs :Recherchez facilement des photos et rappelez-vous des souvenirs à l’aide de « Ask Photo »
Google Workspace pour optimiser l’efficacité du travail : Equipé de Gemini dans Google Workspace pour traiter les recherches d’e-mails et les tâches récapitulatives

Réchauffe l’industrie avec l’annonce d’une technologie innovante d’IA OpenAI lance ChatGPT-4o Plus tard, Google a tenu sa conférence annuelle des développeurs Google I/O 2024 le lendemain, le 14 mai (heure locale). Alors que les médias, les influenceurs et les utilisateurs en général prêtent attention à la technologie révolutionnaire de ChatGPT-4o, que fait Google ? Technologie d’IA différenciée et expérience clientLes attentes étaient plus élevées que jamais quant à la présentation du spectacle.

Dans cet article, nous couvrirons les annonces majeures de Google I/O 2024. Contenu de la mise à jour de Gemini AI et scénarios d’utilisationConcentrons-nous sur et enfin brièvement Analyser les différences avec ChatGPT-4oJetons un coup d’œil à la direction de chaque service.

Sundar Pichai, PDG de Google, prononce le discours d’ouverture de Google I/O 2024

Q : Qu’est-ce que Google I/O ?

Google I/O est une conférence destinée aux développeurs organisée chaque année par Google. Il s’agit de l’abréviation d’Entrée/Sortie et contient le sens de partage « d’innovation ». Il présente les dernières informations et méthodes de développement sur diverses plates-formes et technologies Google telles qu’Android, Chrome et Google Assistant. De plus, des sessions liées aux tendances technologiques de pointe telles que l’intelligence artificielle, l’apprentissage automatique et le cloud computing seront également organisées. De plus, vous pourrez découvrir les dernières annonces de produits et de plates-formes, les sessions de développeurs, les laboratoires et ateliers de code, ainsi que les opportunités de réseautage. Le contenu fourni lors de Google I/O 2024 sera disponible en ligne du 16 au 18 mai.

Gémeaux, évolution vers un agent IA

Après avoir dévoilé pour la première fois le modèle de pointe de l’intelligence artificielle*, le plan Gemini lors de la dernière Google I/O, il s’est désormais développé en Gemini 1.5 Pro et Gemini Advanced. Gemini 1.5 Pro peut gérer 1 million de contextes, Exploitez de grandes quantités d’informations, notamment des centaines de pages de texte ou des heures d’audioTu peux. Cette fonctionnalité sera disponible en 35 langues dans Gemini Advanced à partir du 14 mai (heure locale). De plus, AI Agent est équipé d’un système intelligent doté de capacités avancées de raisonnement, de planification et de mémoire, ce qui lui permet d’aider à traiter diverses tâches au nom de l’utilisateur.

*modèle de frontièreDans le domaine de l’intelligence artificielle InnoverIl s’agit d’un modèle d’avant-garde qui Il s’agit d’une IA multimodale qui peut déduire du texte, des images, des vidéos, des codes, etc., et peut comprendre et connecter diverses entrées.

Construire un système intelligent pour les utilisateurs

Google recherche des moyens de gérer automatiquement les tâches routinières et fastidieuses des utilisateurs, telles que retourner faire des achats ou mettre à jour des informations après avoir déménagé dans une nouvelle ville. en particulier, Une expérience intelligente qui prédit la situation de l’utilisateur et fournit de manière proactive les informations nécessairesNous nous concentrons sur la fourniture.

Ces systèmes ne permettent pas à l’IA de faire tout le travail automatiquement ; Supervisé par l’utilisateur et toujours en contrôle de la situation en demandant des informations en cas de besoinFaisons-le.

Scénario 1 : Automatiser les retours de chaussures

J’ai acheté une paire de chaussures en ligne, mais je dois les retourner car elles ne me conviennent pas. Voyons comment les Gémeaux peuvent vous aider en ce moment. (Il s’agit d’un scénario hypothétique.)

Recherche de reçus	Gemini accède à votre compte de messagerie et recherche votre boîte de réception. Recherchez les e-mails de reçus liés aux achats de chaussures.
Trouvez votre numéro de commande	Extrayez le numéro de commande de l’e-mail de réception. Confirmez les informations de retour requises (date de commande, montant de l’achat, etc.).
Remplissez le formulaire de retour	Accédez à la page de retours du centre commercial en ligne concerné. Votre numéro de commande et vos informations d’achat seront automatiquement saisis. Lorsqu’on vous demande le motif du retour, sélectionnez « La taille ne convient pas ».
Service de livraison (exemple) Réservation de ramassage UPS	Accédez au site Web d’UPS pour planifier un ramassage de retour. Entrez votre adresse et sélectionnez l’heure de prise en charge la plus rapprochée. Une fois votre réservation de prise en charge terminée, vous recevrez un e-mail de confirmation.
Notification des résultats	Gemini vous enverra un message vous informant que tous les processus sont terminés. Nous fournissons également un lien pour suivre l’état de votre retour en temps réel.

Scénario 2 : Déménager dans une nouvelle zone

Un utilisateur vient de déménager à Chicago. Voyons comment Gemini et Chrome peuvent vous aider dans les nombreuses tâches dont vous aurez besoin lors de votre installation dans une nouvelle ville.

navigation en ville	Gemini recherche des pressings, des services de promenade de chiens, des épiceries et bien plus encore à proximité en fonction de votre nouvelle adresse. Nous fournissons aux utilisateurs une liste recommandée en combinant l’emplacement, les heures d’ouverture et les avis de chaque service.
Réservation de services	Faites des réservations pour les services de blanchisserie et de promenade de chiens recommandés par Gemini. Planifiez automatiquement votre première visite au pressing et votre chien pour une promenade.
Mise à jour de l’adresse	Gemini vérifie la liste des sites Web que vous fréquentez. Accédez au site Web de votre banque, de votre fournisseur d’accès Internet, de votre centre commercial en ligne, etc. et mettez à jour la nouvelle adresse. Complétez le changement d’adresse en saisissant les informations requises (informations de connexion au compte, code de vérification, etc.) sur chaque site.
Demander plus d’informations	Si des informations supplémentaires sont nécessaires sur un site Web particulier, Gemini vous enverra un message. Fournit des liens pour saisir des informations supplémentaires et tout commentaire dont vous pourriez avoir besoin.
contrôle de la situation	Gemini met à jour vos progrès en temps réel, vous donnant le contrôle à chaque étape du processus. Il vous enverra une notification à chaque étape terminée afin que vous puissiez la vérifier.

Le processus de recommandation de lieux à proximité de votre région à l’aide de Gemini

Grâce à ces scénarios, l’agent IA de Google Gemini gère les tâches répétitives et complexes de la vie quotidienne de l’utilisateur, offrant ainsi un environnement qui permet d’économiser du temps et des efforts. Google explique qu’en proposant cette expérience, il s’efforce de protéger strictement la vie privée et, surtout, de fournir des services stables.

Une nouvelle façon de conserver et de communiquer des souvenirs, Google Photos

Par exemple, si vous ne vous souvenez pas du numéro de plaque d’immatriculation de votre voiture dans un parking, demandez simplement à Google Photos et il reconnaîtra les voitures qui apparaissent fréquemment et vous fournira leurs plaques d’immatriculation. Aussi, me remémorant l’enfance de ma fille, j’ai demandé : « Quand Lucy a-t-elle appris à nager ? Lorsque vous posez la même question, Gemini trouve non seulement des photos associées, mais fournit également des explications supplémentaires au fil du temps sur la façon dont votre fille a appris à nager. La fonctionnalité devrait être lancée cet été, et d’autres fonctionnalités devraient être ajoutées à l’avenir.

Google Photos, fonctionnalité « Demander une photo »

Google Workspace optimise l’efficacité du travail

Gemini 1.5 pro est installé dans Google Workspace, offrant des fonctions de multimodalité et de traitement de contexte long. À cause de ça Rechercher et résumer les e-mailsCela devient encore plus puissant. Par exemple, si vous demandez à Gemini de résumer tous les e-mails récents que vous avez reçus de l’école de votre enfant, il analysera les e-mails et les pièces jointes pertinents pour résumer les points clés et les choses à faire.

Vous pouvez également demander un enregistrement de la réunion des parents avec les points clés, et les réponses des bénévoles peuvent également être rédigées en votre nom. Gemini 1.5 Pro est actuellement disponible dans Google Workspace Lab. Cet environnement agit comme un assistant intelligent qui fait gagner du temps aux utilisateurs et augmente l’efficacité du travail.

Google a également mis l’accent sur les changements dans la recherche Google utilisant Gemini et le développement d’un modèle multimodal. La recherche Google prend en charge de nouvelles méthodes de recherche (y compris la recherche) en introduisant la recherche générative par IA (SGE), qui permet aux utilisateurs de répondre plus facilement à des questions plus complexes ou de rechercher des photos. De plus, les capacités multimodales, telles que la création d’audio personnalisé et interactif avec Gemini, permettent aux utilisateurs de faire plus que simplement envoyer du texte. Grâce à ces avancées technologiques, Google prévoit de créer une expérience de recherche plus puissante et de continuer à ajouter de nouvelles fonctionnalités.

Lors de cette Google I/O, trois avantages majeurs de l’IA Gemini de Google ont été confirmés. Premièrement, nous proposons une expérience qui prédit la situation du client et l’informe de manière proactive. Google fournit les informations nécessaires en tenant compte de la situation de l’utilisateur, augmentant ainsi le confort du client.

Deuxièmement, il offre une fonction de recherche plus pratique. La recherche basée sur le contenu et les résumés personnalisés dans les photos vous aident à gérer efficacement vos précieux souvenirs, tout en améliorant l’expérience utilisateur en donnant plus de sens aux résultats de recherche.

Enfin, Google augmente encore le confort des clients en reliant l’IA aux services existants. Il fournit des fonctions qui permettent de gagner du temps et d’augmenter l’efficacité du travail, et est chargé de résumer ou de traiter de grandes quantités d’informations.

Ce que Google I/O devrait apprendre d’OpenAI

Cependant, malgré l’introduction de diverses technologies innovantes dans cette Google I/O, il était décevant de constater que l’immersion et l’empathie faisaient quelque peu défaut. Spécialement moi Session de mise à jour ChatGPT-4oAprès avoir regardé , j’ai ressenti cela relativement plus. La précédente session ChatGPT-4o ne s’est pas limitée à simplement expliquer la nouvelle technologie introduite ; Expérience de conversation naturelle entre les utilisateurs et l’IAétait concentré sur.

Démonstration en temps réel de ChatGPT-4o d’OpenAI

Grâce à une démonstration en direct, les fonctions de ChatGPT-4o ont été présentées de manière immersive, telles que la lecture et l’expression d’émotions par l’IA, continuant à répondre sans hésitation même lorsque l’utilisateur interrompait la conversation et interprétant diverses informations visuelles pour permettre une communication plus naturelle. .

Dans cet environnement, il a été estimé que ChatGPT-4o, contrairement à d’autres services d’IA, avait considérablement amélioré l’interaction avec les utilisateurs, offrant une expérience émotionnelle comme si l’on parlait à une personne. Cette expérience a été efficace pour aider le public à s’immerger davantage dans la session et à découvrir à quel point l’IA peut les aider naturellement et utilement dans leur vie quotidienne.

D’un autre côté, Google disposait clairement de nombreux avantages technologiques par rapport aux autres sociétés, mais du point de vue du client, la question était : « Ces excellents services ne sont-ils pas planifiés et marqués du point de vue du développeur ? Par exemple, chaque service a reçu un nom différent : “Bio”, qui crée des vidéos à partir de texte, “Imazen”, qui crée des photos à partir de texte, “Lilia”, qui crée de la musique avec l’IA, et “S”, une recherche de photos par l’IA. Il est également quelque peu décevant qu’il y ait beaucoup d’informations dont les utilisateurs doivent se souvenir, comme le « port ».

finition

Si Google I/O avait eu une nouvelle image de marque et un nouveau positionnement pour rendre facilement accessibles les excellentes fonctionnalités actuellement développées, la technologie actuelle aurait été mieux perçue par le public. En particulier, à une époque où l’intelligence artificielle devient plus performante que les êtres humains, il est considéré comme une perspective importante pour l’IA de se comporter davantage comme un être humain envers les utilisateurs et d’offrir des avantages pratiques sans aucun sentiment d’hétérogénéité.

Nous sommes encore plus impatients de voir quelles innovations les technologies Gemini et Google AI apporteront à nos vies à l’avenir. Si vous imaginez, la session de l’année prochaine pourrait être la 8e* véritablement prometteuse, avec l’IA dirigeant directement les E/S. (Je pense que de nombreuses personnes transmettront cette « 8e promesse » à OpenAI.)

*Épisode 8 de Promise : Un terme mème qui est à nouveau en hausse ces jours-ci. Un terme qui fait principalement référence au moment le plus important du contenu lié au baseball et au théâtre. En particulier, au baseball, cela provient du fait qu’une situation dramatique se produit dès la 8ème manche d’un match de baseball et que l’ambiance change.

De nos jours, tous les contenus informatiques sont protégés par la loi sur le droit d’auteur et la reproduction, la copie et la distribution non autorisées sont interdites.

Découvrez l’invisible, en fournissant des informations cachées sur les clients dans la vie quotidienne.

Tags: agent, ChatGP, ChatGPT4o, Chrome, conférence, développeur, discours, espace de travail, Gémeaux, Google IO, I.A., IA, Modèle frontière, openai