La magie de l’IA d’Apple et de Google promet la confidentialité, à un prix

Getty Images

Depuis l’aube de l’iPhone, la plupart des smarts dans les smartphones sont venus d’ailleurs : les ordinateurs d’entreprise connus sous le nom de cloud. Les applications mobiles ont envoyé les données des utilisateurs vers le cloud pour des tâches utiles telles que la transcription de discours ou la suggestion de réponses aux messages. Aujourd’hui, Apple et Google affirment que les smartphones sont suffisamment intelligents pour effectuer eux-mêmes certaines tâches d’apprentissage automatique cruciales et sensibles.

Lors de l’événement WWDC d’Apple ce mois-ci, la société a déclaré que son assistant virtuel Siri transcrirait le discours sans utiliser le cloud dans certaines langues sur les iPhones et iPads récents et futurs. Lors de son propre événement pour développeurs d’E/S le mois dernier, Google a déclaré que la dernière version de son système d’exploitation Android disposait d’une fonctionnalité dédiée au traitement sécurisé des données sensibles sur l’appareil, appelée Private Compute Core. Ses utilisations initiales incluent l’alimentation de la version de la fonction Smart Reply de l’entreprise intégrée à son clavier mobile qui peut suggérer des réponses aux messages entrants.

Apple et Google affirment tous deux que l’apprentissage automatique sur l’appareil offre plus de confidentialité et des applications plus rapides. Ne pas transmettre de données personnelles réduit le risque d’exposition et permet de gagner du temps à attendre que les données traversent Internet. Dans le même temps, la conservation des données sur les appareils s’aligne sur l’intérêt à long terme des géants de la technologie de garder les consommateurs liés à leurs écosystèmes. Les personnes qui entendent que leurs données peuvent être traitées de manière plus privée pourraient devenir plus disposées à accepter de partager plus de données.

La récente promotion par les entreprises de l’apprentissage automatique sur l’appareil intervient après des années de travail sur la technologie pour restreindre les données que leurs clouds peuvent « voir ».

En 2014, Google a commencé à collecter des données sur l’utilisation du navigateur Chrome grâce à une technique appelée confidentialité différentielle, qui ajoute du bruit aux données collectées de manière à restreindre ce que ces échantillons révèlent sur les individus. Apple a utilisé la technique sur les données recueillies à partir des téléphones pour informer les emoji et les prédictions de frappe et pour les données de navigation Web.

Lire aussi  Eurogamer Newscast : Mangeriez-vous un Pokémon ?

Plus récemment, les deux entreprises ont adopté une technologie appelée apprentissage fédéré. Il permet à un système d’apprentissage automatique basé sur le cloud d’être mis à jour sans récupérer de données brutes ; au lieu de cela, les appareils individuels traitent les données localement et ne partagent que les mises à jour digérées. Comme pour la confidentialité différentielle, les entreprises n’ont discuté de l’utilisation de l’apprentissage fédéré que dans des cas limités. Google a utilisé cette technique pour maintenir ses prédictions de frappe sur mobile à jour avec les tendances linguistiques ; Apple a publié des recherches sur son utilisation pour mettre à jour les modèles de reconnaissance vocale.

Rachel Cummings, professeure adjointe à Columbia qui a déjà été consultante sur la confidentialité pour Apple, déclare que le passage rapide à l’apprentissage automatique sur les téléphones a été frappant. “Il est incroyablement rare de voir quelque chose passer de la première conception au déploiement à grande échelle en si peu d’années”, dit-elle.

Ces progrès ont nécessité non seulement des avancées en informatique, mais aussi des entreprises pour relever les défis pratiques du traitement des données sur les appareils appartenant aux consommateurs. Google a déclaré que son système d’apprentissage fédéré n’exploite les appareils des utilisateurs que lorsqu’ils sont branchés, inactifs et sur une connexion Internet gratuite. La technique a été rendue possible en partie par l’amélioration de la puissance des processeurs mobiles.

Le matériel mobile Beefier a également contribué à l’annonce de Google en 2019 selon laquelle la reconnaissance vocale pour son assistant virtuel sur les appareils Pixel serait entièrement sur l’appareil, sans la béquille du cloud. La nouvelle reconnaissance vocale sur l’appareil d’Apple pour Siri, annoncée à la WWDC ce mois-ci, utilisera le “moteur neuronal” que la société a ajouté à ses processeurs mobiles pour alimenter les algorithmes d’apprentissage automatique.

Lire aussi  Les chiens robots trouvent avec précision les fourmilières de feu

Les prouesses techniques sont impressionnantes. On peut se demander dans quelle mesure ils changeront de manière significative la relation des utilisateurs avec les géants de la technologie.

Les présentateurs de la WWDC d’Apple ont déclaré que la nouvelle conception de Siri était une “mise à jour majeure de la confidentialité” qui résolvait le risque associé à la transmission accidentelle de l’audio vers le cloud, affirmant que c’était la plus grande préoccupation des utilisateurs en matière de confidentialité concernant les assistants vocaux. Certaines commandes Siri, telles que le réglage des minuteries, peuvent être reconnues entièrement localement, ce qui permet une réponse rapide. Pourtant, dans de nombreux cas, les commandes transcrites à Siri, y compris probablement à partir d’enregistrements accidentels, seront envoyées aux serveurs Apple pour que le logiciel décode et réponde. La transcription vocale Siri sera toujours basée sur le cloud pour les haut-parleurs intelligents HomePod couramment installés dans les chambres et les cuisines, où l’enregistrement accidentel peut être plus préoccupant.

Google promeut également le traitement des données sur l’appareil comme une victoire en matière de confidentialité et a indiqué qu’il étendrait la pratique. La société s’attend à ce que des partenaires tels que Samsung qui utilisent son système d’exploitation Android adoptent le nouveau Privacy Compute Core et l’utilisent pour des fonctionnalités qui reposent sur des données sensibles.

Google a également fait de l’analyse locale des données de navigation une caractéristique de sa proposition de réinventer le ciblage des publicités en ligne, baptisé FLoC et prétendu être plus privé. Des universitaires et certaines entreprises technologiques rivales ont déclaré que la conception aiderait probablement Google à consolider sa domination des publicités en ligne en rendant le ciblage plus difficile pour d’autres entreprises.

Michael Veale, maître de conférences en droits numériques à l’University College London, affirme que le traitement des données sur l’appareil peut être une bonne chose, mais ajoute que la façon dont les entreprises technologiques le promeuvent montre qu’elles sont principalement motivées par le désir de garder les gens liés à des écosystèmes numériques lucratifs.

Lire aussi  Synthétiser une nouvelle classe de nanomatériaux bio-inspirés et captant la lumière - -

“La confidentialité se confond avec la confidentialité des données, mais il s’agit également de limiter le pouvoir”, explique Veale. “Si vous êtes une grande entreprise de technologie et que vous parvenez à recadrer la confidentialité comme la seule confidentialité des données, cela vous permet de poursuivre vos activités normalement et vous donne une licence d’exploitation.”

Un porte-parole de Google a déclaré que la société “construit pour la confidentialité partout où l’informatique a lieu” et que les données envoyées au Private Compute Core pour traitement “doivent être liées à la valeur de l’utilisateur”. Apple n’a pas répondu à une demande de commentaire.

Cummings of Columbia affirme que les nouvelles techniques de confidentialité et la façon dont les entreprises les commercialisent ajoutent de la complexité aux compromis de la vie numérique. Au cours des dernières années, alors que l’apprentissage automatique s’est largement déployé, les entreprises technologiques ont progressivement élargi la gamme de données qu’elles collectent et analysent. Il existe des preuves que certains consommateurs comprennent mal les protections de la vie privée proclamées par les géants de la technologie.

Une étude à venir de Cummings et de ses collaborateurs de l’Université de Boston et de l’Institut Max Planck a montré des descriptions de la confidentialité différentielle tirées des entreprises technologiques, des médias et des universitaires à 675 Américains. En entendant parler de la technique, les gens étaient environ deux fois plus susceptibles de déclarer qu’ils seraient disposés à partager des données. Mais il y avait des preuves que les descriptions des avantages différentiels de la vie privée encourageaient également des attentes irréalistes. Un cinquième des répondants s’attendaient à ce que leurs données soient protégées contre les recherches des forces de l’ordre, ce que ne fait pas la confidentialité différentielle. Les dernières déclarations d’Apple et de Google concernant le traitement des données sur l’appareil peuvent apporter de nouvelles opportunités de malentendus.

Cette histoire est apparue à l’origine sur wired.com.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick