Il n’y a pas de recherches récentes.
Résumé de la mise à jour et scénario d’utilisation de Google I/O 2024 Gemini AI
3 raisons pour lesquelles l’auteur recommande cet article !
1. Google E/S 2024Un bref résumé de la mise à jour Gemini introduite dans
2. Introduction à des scénarios spécifiques utilisant l’agent Gemini AI
3. Ce que les Gémeaux devraient apprendre du Chat GPT-4o d’OpenAI
Google I/O 2024, résumé de la mise à jour de Gemini AI
- Services inclus : Gemini, dévoilé pour la première fois lors de la dernière I/O, a désormais évolué vers 1.5 flash, 1.5 Pro et Advanced, traitant 1 million de contextes et prenant en charge 35 langues (prévu pour s’étendre au traitement de 2 millions de contextes)
- Construire des systèmes intelligents pour les utilisateurs :Nous recherchons actuellement un système automatisé qui réduirait les tracas du quotidien, comme le traitement des retours après les achats et la préparation du déménagement.
- Une nouvelle façon de conserver et de communiquer les souvenirs :Recherchez facilement des photos et rappelez-vous des souvenirs à l’aide de « Ask Photo »
- Google Workspace pour optimiser l’efficacité du travail : Equipé de Gemini dans Google Workspace pour traiter les recherches d’e-mails et les tâches récapitulatives
Réchauffe l’industrie avec l’annonce d’une technologie innovante d’IA OpenAI lance ChatGPT-4o Plus tard, Google a tenu sa conférence annuelle des développeurs Google I/O 2024 le lendemain, le 14 mai (heure locale). Alors que les médias, les influenceurs et les utilisateurs en général prêtent attention à la technologie révolutionnaire de ChatGPT-4o, que fait Google ? Technologie d’IA différenciée et expérience clientLes attentes étaient plus élevées que jamais quant à la présentation du spectacle.
Dans cet article, nous couvrirons les annonces majeures de Google I/O 2024. Contenu de la mise à jour de Gemini AI et scénarios d’utilisationConcentrons-nous sur et enfin brièvement Analyser les différences avec ChatGPT-4oJetons un coup d’œil à la direction de chaque service.
Q : Qu’est-ce que Google I/O ?
Google I/O est une conférence destinée aux développeurs organisée chaque année par Google. Il s’agit de l’abréviation d’Entrée/Sortie et contient le sens de partage « d’innovation ». Il présente les dernières informations et méthodes de développement sur diverses plates-formes et technologies Google telles qu’Android, Chrome et Google Assistant. De plus, des sessions liées aux tendances technologiques de pointe telles que l’intelligence artificielle, l’apprentissage automatique et le cloud computing seront également organisées. De plus, vous pourrez découvrir les dernières annonces de produits et de plates-formes, les sessions de développeurs, les laboratoires et ateliers de code, ainsi que les opportunités de réseautage. Le contenu fourni lors de Google I/O 2024 sera disponible en ligne du 16 au 18 mai.
Gémeaux, évolution vers un agent IA
Après avoir dévoilé pour la première fois le modèle de pointe de l’intelligence artificielle*, le plan Gemini lors de la dernière Google I/O, il s’est désormais développé en Gemini 1.5 Pro et Gemini Advanced. Gemini 1.5 Pro peut gérer 1 million de contextes, Exploitez de grandes quantités d’informations, notamment des centaines de pages de texte ou des heures d’audioTu peux. Cette fonctionnalité sera disponible en 35 langues dans Gemini Advanced à partir du 14 mai (heure locale). De plus, AI Agent est équipé d’un système intelligent doté de capacités avancées de raisonnement, de planification et de mémoire, ce qui lui permet d’aider à traiter diverses tâches au nom de l’utilisateur.
*modèle de frontièreDans le domaine de l’intelligence artificielle InnoverIl s’agit d’un modèle d’avant-garde qui Il s’agit d’une IA multimodale qui peut déduire du texte, des images, des vidéos, des codes, etc., et peut comprendre et connecter diverses entrées.
Construire un système intelligent pour les utilisateurs
Google recherche des moyens de gérer automatiquement les tâches routinières et fastidieuses des utilisateurs, telles que retourner faire des achats ou mettre à jour des informations après avoir déménagé dans une nouvelle ville. en particulier, Une expérience intelligente qui prédit la situation de l’utilisateur et fournit de manière proactive les informations nécessairesNous nous concentrons sur la fourniture.
Ces systèmes ne permettent pas à l’IA de faire tout le travail automatiquement ; Supervisé par l’utilisateur et toujours en contrôle de la situation en demandant des informations en cas de besoinFaisons-le.
Scénario 1 : Automatiser les retours de chaussures
J’ai acheté une paire de chaussures en ligne, mais je dois les retourner car elles ne me conviennent pas. Voyons comment les Gémeaux peuvent vous aider en ce moment. (Il s’agit d’un scénario hypothétique.)
Recherche de reçus Trouvez votre numéro de commande Remplissez le formulaire de retour Service de livraison (exemple) Réservation de ramassage UPS Notification des résultats
Scénario 2 : Déménager dans une nouvelle zone
Un utilisateur vient de déménager à Chicago. Voyons comment Gemini et Chrome peuvent vous aider dans les nombreuses tâches dont vous aurez besoin lors de votre installation dans une nouvelle ville.
navigation en ville Réservation de services Mise à jour de l’adresse Demander plus d’informations contrôle de la situation
Grâce à ces scénarios, l’agent IA de Google Gemini gère les tâches répétitives et complexes de la vie quotidienne de l’utilisateur, offrant ainsi un environnement qui permet d’économiser du temps et des efforts. Google explique qu’en proposant cette expérience, il s’efforce de protéger strictement la vie privée et, surtout, de fournir des services stables.
Une nouvelle façon de conserver et de communiquer des souvenirs, Google Photos
Par exemple, si vous ne vous souvenez pas du numéro de plaque d’immatriculation de votre voiture dans un parking, demandez simplement à Google Photos et il reconnaîtra les voitures qui apparaissent fréquemment et vous fournira leurs plaques d’immatriculation. Aussi, me remémorant l’enfance de ma fille, j’ai demandé : « Quand Lucy a-t-elle appris à nager ? Lorsque vous posez la même question, Gemini trouve non seulement des photos associées, mais fournit également des explications supplémentaires au fil du temps sur la façon dont votre fille a appris à nager. La fonctionnalité devrait être lancée cet été, et d’autres fonctionnalités devraient être ajoutées à l’avenir.
Google Workspace optimise l’efficacité du travail
Gemini 1.5 pro est installé dans Google Workspace, offrant des fonctions de multimodalité et de traitement de contexte long. À cause de ça Rechercher et résumer les e-mailsCela devient encore plus puissant. Par exemple, si vous demandez à Gemini de résumer tous les e-mails récents que vous avez reçus de l’école de votre enfant, il analysera les e-mails et les pièces jointes pertinents pour résumer les points clés et les choses à faire.
Vous pouvez également demander un enregistrement de la réunion des parents avec les points clés, et les réponses des bénévoles peuvent également être rédigées en votre nom. Gemini 1.5 Pro est actuellement disponible dans Google Workspace Lab. Cet environnement agit comme un assistant intelligent qui fait gagner du temps aux utilisateurs et augmente l’efficacité du travail.
Google a également mis l’accent sur les changements dans la recherche Google utilisant Gemini et le développement d’un modèle multimodal. La recherche Google prend en charge de nouvelles méthodes de recherche (y compris la recherche) en introduisant la recherche générative par IA (SGE), qui permet aux utilisateurs de répondre plus facilement à des questions plus complexes ou de rechercher des photos. De plus, les capacités multimodales, telles que la création d’audio personnalisé et interactif avec Gemini, permettent aux utilisateurs de faire plus que simplement envoyer du texte. Grâce à ces avancées technologiques, Google prévoit de créer une expérience de recherche plus puissante et de continuer à ajouter de nouvelles fonctionnalités.
Lors de cette Google I/O, trois avantages majeurs de l’IA Gemini de Google ont été confirmés. Premièrement, nous proposons une expérience qui prédit la situation du client et l’informe de manière proactive. Google fournit les informations nécessaires en tenant compte de la situation de l’utilisateur, augmentant ainsi le confort du client.
Deuxièmement, il offre une fonction de recherche plus pratique. La recherche basée sur le contenu et les résumés personnalisés dans les photos vous aident à gérer efficacement vos précieux souvenirs, tout en améliorant l’expérience utilisateur en donnant plus de sens aux résultats de recherche.
Enfin, Google augmente encore le confort des clients en reliant l’IA aux services existants. Il fournit des fonctions qui permettent de gagner du temps et d’augmenter l’efficacité du travail, et est chargé de résumer ou de traiter de grandes quantités d’informations.
Ce que Google I/O devrait apprendre d’OpenAI
Cependant, malgré l’introduction de diverses technologies innovantes dans cette Google I/O, il était décevant de constater que l’immersion et l’empathie faisaient quelque peu défaut. Spécialement moi Session de mise à jour ChatGPT-4oAprès avoir regardé , j’ai ressenti cela relativement plus. La précédente session ChatGPT-4o ne s’est pas limitée à simplement expliquer la nouvelle technologie introduite ; Expérience de conversation naturelle entre les utilisateurs et l’IAétait concentré sur.
Grâce à une démonstration en direct, les fonctions de ChatGPT-4o ont été présentées de manière immersive, telles que la lecture et l’expression d’émotions par l’IA, continuant à répondre sans hésitation même lorsque l’utilisateur interrompait la conversation et interprétant diverses informations visuelles pour permettre une communication plus naturelle. .
Dans cet environnement, il a été estimé que ChatGPT-4o, contrairement à d’autres services d’IA, avait considérablement amélioré l’interaction avec les utilisateurs, offrant une expérience émotionnelle comme si l’on parlait à une personne. Cette expérience a été efficace pour aider le public à s’immerger davantage dans la session et à découvrir à quel point l’IA peut les aider naturellement et utilement dans leur vie quotidienne.
D’un autre côté, Google disposait clairement de nombreux avantages technologiques par rapport aux autres sociétés, mais du point de vue du client, la question était : « Ces excellents services ne sont-ils pas planifiés et marqués du point de vue du développeur ? Par exemple, chaque service a reçu un nom différent : “Bio”, qui crée des vidéos à partir de texte, “Imazen”, qui crée des photos à partir de texte, “Lilia”, qui crée de la musique avec l’IA, et “S”, une recherche de photos par l’IA. Il est également quelque peu décevant qu’il y ait beaucoup d’informations dont les utilisateurs doivent se souvenir, comme le « port ».
finition
Si Google I/O avait eu une nouvelle image de marque et un nouveau positionnement pour rendre facilement accessibles les excellentes fonctionnalités actuellement développées, la technologie actuelle aurait été mieux perçue par le public. En particulier, à une époque où l’intelligence artificielle devient plus performante que les êtres humains, il est considéré comme une perspective importante pour l’IA de se comporter davantage comme un être humain envers les utilisateurs et d’offrir des avantages pratiques sans aucun sentiment d’hétérogénéité.
Nous sommes encore plus impatients de voir quelles innovations les technologies Gemini et Google AI apporteront à nos vies à l’avenir. Si vous imaginez, la session de l’année prochaine pourrait être la 8e* véritablement prometteuse, avec l’IA dirigeant directement les E/S. (Je pense que de nombreuses personnes transmettront cette « 8e promesse » à OpenAI.)
*Épisode 8 de Promise : Un terme mème qui est à nouveau en hausse ces jours-ci. Un terme qui fait principalement référence au moment le plus important du contenu lié au baseball et au théâtre. En particulier, au baseball, cela provient du fait qu’une situation dramatique se produit dès la 8ème manche d’un match de baseball et que l’ambiance change.
De nos jours, tous les contenus informatiques sont protégés par la loi sur le droit d’auteur et la reproduction, la copie et la distribution non autorisées sont interdites.
Découvrez l’invisible, en fournissant des informations cachées sur les clients dans la vie quotidienne.