Tesla place un gros pari sur la conduite autonome uniquement visuelle

La dernière mise à jour de la technologie de conduite autonome de Tesla augmente la participation de l’entreprise dans un pari audacieux qu’elle peut fournir des véhicules autonomes en utilisant uniquement des caméras. Mais malgré l’amélioration des capacités de conduite autonome basée sur la vision, les experts disent qu’elle se heurte à des obstacles fondamentaux.

Samedi dernier, Tesla a déployé la version 9 très tardive de son logiciel « Full Self-Driving » (FSD), qui donne aux véhicules Tesla une capacité limitée à naviguer de manière autonome. Le package, qui est déjà en vente en tant que module complémentaire de 10 000 $, est en test bêta avec un groupe sélectionné de pilotes depuis octobre dernier. Mais la dernière mise à jour marque un changement important en abandonnant l’entrée des capteurs radar et en s’appuyant uniquement sur les caméras de la voiture.

Ceci suit le annonce en mai que Tesla supprimera complètement le radar de ses voitures Model 3 et Model Y construites aux États-Unis et suggère que la société double une stratégie en contradiction avec la plupart des autres projets de conduite autonome. Les véhicules autonomes construits par Waymo, filiale d’Alphabet et Cruise, appartenant à GM, fusionnent les entrées des caméras, des radars et des lidar ultra-précis et ne sillonnent que les rues pré-cartographiées à l’aide de scans laser 3D haute résolution.

Le PDG de Tesla, Elon Musk, a été vocal dans sa critique du lidar en raison de son coût élevé et a plutôt préconisé une approche de « vision pure ». C’est controversé en raison du manque de redondance lié au fait de s’appuyer sur un seul capteur. Mais la justification est claire, explique Kilian Weinberger, professeur agrégé à l’Université Cornell qui travaille sur la vision par ordinateur pour les véhicules autonomes.

« Les caméras sont très bon marché par rapport au lidar », dit-il. « En faisant cela, ils peuvent mettre cette technologie dans toutes les voitures qu’ils vendent. S’ils vendent 500 000 voitures, toutes ces voitures circulent en collectant des données pour elles. »

Lire aussi  Les rorquals communs austral se sont rétablis en grand nombre dans l'Antarctique

Les données sont l’élément vital des systèmes d’apprentissage automatique au cœur de la technologie de conduite autonome. Le grand pari de Tesla, dit Weinberger, est que la montagne de vidéos que sa flotte amasse l’aidera à atteindre une autonomie complète plus rapidement que la plus petite quantité de données lidar que ses concurrents s’appuient sur un petit nombre de voitures plus chargées de capteurs conduites par des employés.

Parlant à la conférence sur la vision par ordinateur et la reconnaissance de formes Le mois dernier, Andrej Karpathy, chef de l’IA de Tesla, a révélé que la société avait construit un superordinateur, qui, selon lui, était le cinquième plus puissant au monde, pour traiter toutes ces données. Il a également expliqué la décision d’abandonner le radar, affirmant qu’après une formation sur plus de 1,5 pétaoctet de vidéo augmentée à la fois de données radar et d’étiquetage humain, le système de vision uniquement surpasse désormais considérablement leur approche précédente.

La justification de l’abandon du radar a du sens, dit Weinberger, et il ajoute que l’écart entre le lidar et les caméras s’est rétréci ces dernières années. Le principal argument de vente de Lidar est la détection de profondeur incroyablement précise obtenue en faisant rebondir des lasers sur des objets, mais les systèmes basés sur la vision peuvent également estimer la profondeur et leurs capacités se sont considérablement améliorées.

Weinberger et ses collègues ont fait une percée en 2019 en convertissant les estimations de profondeur basées sur des caméras en le même type de nuages ​​de points 3D utilisés par le lidar, améliorant considérablement la précision. Karpathy a révélé que la société était en utilisant une telle technique « pseudo-lidar » à la conférence Scaled Machine Learning l’année dernière.

La façon dont vous estimez la profondeur est cependant importante. Une approche compare les images de deux caméras suffisamment espacées pour trianguler la distance aux objets. L’autre consiste à entraîner l’IA sur un grand nombre d’images jusqu’à ce qu’elle apprenne à capter les indices de profondeur. Weinberger dit que c’est probablement l’approche utilisée par Tesla car ses caméras frontales sont trop proches les unes des autres pour la première technique.

Lire aussi  La mise à jour Grand Renewal de Smash Legends reconstruit complètement le jeu avec de nouvelles fonctionnalités, des récompenses et bien plus encore

L’avantage des techniques basées sur la triangulation est que les mesures sont basées sur la physique, un peu comme le lidar, explique Leaf Jiang, PDG de la start-up NODAR, qui développe une technologie de vision 3D basée sur des caméras basée sur cette approche. Déduire la distance est intrinsèquement plus vulnérable aux erreurs dans des situations ambiguës, dit-il, par exemple, en distinguant un adulte à 50 mètres d’un enfant à 25 mètres. « Il essaie de déterminer la distance en fonction de repères de perspective ou de repères d’ombrage, ou autre, et ce n’est pas toujours fiable », dit-il.

Cependant, la façon dont vous percevez la profondeur n’est qu’une partie du problème. L’apprentissage automatique de pointe reconnaît simplement les modèles, ce qui signifie qu’il se débat avec de nouvelles situations. Contrairement à un conducteur humain, s’il n’a pas rencontré de scénario auparavant, il n’a pas la capacité de raisonner sur ce qu’il faut faire. « Aucun système d’IA ne comprend ce qui se passe réellement », déclare Weinberger.

La logique derrière la collecte de plus en plus de données est que vous capturerez plus de scénarios rares qui pourraient bouleverser votre IA, mais il y a une limite fondamentale à cette approche. « Finalement, vous avez des cas uniques. Et des cas uniques pour lesquels vous ne pouvez pas vous entraîner », explique Weinberger. « Les avantages d’ajouter de plus en plus de données diminuent à un moment donné. »

C’est le soi-disant “problème de longue traîne”, explique Marc Pollefeys, professeur à l’ETH Zurich qui a travaillé sur la conduite autonome par caméra, et il présente un obstacle majeur pour passer du type de systèmes d’aide à la conduite déjà courants dans voitures modernes à des véhicules vraiment autonomes. La technologie sous-jacente est similaire, dit-il. Mais alors qu’un système de freinage automatique conçu pour augmenter les réactions d’un conducteur peut se permettre de rater un piéton occasionnel, la marge d’erreur lorsqu’il contrôle totalement la voiture est de quelques fractions de pour cent.

Lire aussi  « Abolissez ces entreprises, débarrassez-vous d'elles » : que faudrait-il pour briser les grandes sociétés pétrolières ? | Environnement

D’autres entreprises autonomes tentent de contourner ce problème en réduisant les risques d’incertitude. Si vous pré-cartez des routes, vous n’avez qu’à vous concentrer sur la petite quantité d’entrées qui ne correspond pas, explique Pollefeys. De même, le risque que trois capteurs différents fassent la même erreur simultanément est extrêmement faible.

L’évolutivité d’une telle approche est certainement discutable. Mais essayer de passer d’un système qui fonctionne principalement à un système qui ne fait presque jamais d’erreurs en poussant simplement toujours plus de données via un pipeline d’apprentissage automatique est « voué à l’échec », explique Pollefeys.

« Lorsque nous voyons que quelque chose fonctionne 99 % du temps, nous pensons qu’il ne peut pas être trop difficile de le faire fonctionner à 100 % », dit-il. « Et ce n’est en fait pas le cas. Faire 10 fois moins d’erreurs est un effort gigantesque.

Vidéos publiées par les propriétaires de Tesla après la mise à jour de la FSD montrant leurs véhicules s’élancer sur les autoroutes ou être aveugle aux piliers en béton au milieu de la route démontrent le gouffre qui doit encore être comblé et suggère la prédiction de Musk de autonomie totale d’ici la fin de l’année peut-être été trop optimiste.

Mais Pollefeys pense qu’il est peu probable que Tesla abandonne le récit selon lequel la pleine autonomie est à portée de main. “Beaucoup de gens l’ont déjà payé [Tesla’s FSD package], ils doivent donc garder l’espoir vivant », dit-il. « Ils sont coincés dans cette histoire.

Tesla n’a pas répondu à une demande d’entretien.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick