Les plates-formes d’apprentissage automatique sans code et low-code nécessitent toujours du personnel

Les plates-formes d’apprentissage automatique sans code et à faible code (horizontales) sont utiles pour faire évoluer la science des données dans une entreprise. Pourtant, comme de nombreuses organisations le découvrent maintenant, il existe de nombreuses façons dont la science des données peut mal tourner pour résoudre de nouveaux problèmes. Zillow a subi des milliards de dollars de pertes en achetant des maisons à l’aide d’un modèle d’évaluation de maisons défectueux basé sur des données. Il a été démontré que la technologie des ressources humaines basée sur les données, en particulier lorsqu’elle est basée sur un logiciel de reconnaissance faciale, biaise les décisions d’embauche contre les classes protégées.

Bien que l’automatisation soit un excellent outil à avoir dans votre arsenal, vous devez tenir compte des défis avant d’utiliser une plate-forme de ML horizontale. Ces plates-formes doivent être flexibles, configurables et contrôlables pour être robustes et apporter une valeur ajoutée constante au fil du temps. Ils doivent permettre aux données d’être pondérées de manière flexible de manière contrôlée par l’utilisateur et disposer d’outils de visualisation des données pour détecter les valeurs aberrantes et les contributeurs au bruit. Ils ont également besoin de paramètres de modèle automatisés et de moniteurs de dérive de données pour alerter les utilisateurs des changements. Comme vous pouvez le voir, nous n’avons pas évolué au-delà du point où les algorithmes surpassent l’intelligence humaine.

Alors, ne vous laissez pas berner par AI/ML/low code… vous avez toujours besoin de gens. Examinons de plus près les raisons pour lesquelles.

Les machines apprennent des humains

Essayer de remplacer les scientifiques des données humaines, les experts du domaine et les ingénieurs par l’automatisation est une proposition aléatoire qui pourrait conduire à un désastre si elle est appliquée à des systèmes de prise de décision critiques. Pourquoi? Parce que les êtres humains comprennent les données d’une manière avec laquelle les systèmes automatisés ont encore du mal.

Lire aussi  Panneaux solaires gratuits : qu'y a-t-il dans les petits caractères ?

Les humains peuvent faire la différence entre les erreurs de données et les données simplement inhabituelles (par exemple, le trading Game/Stop/GME en février) et aligner des modèles de données inhabituels avec des événements du monde réel (par exemple, 9/11, COVID, crises financières, élections). Nous comprenons également l’impact des événements du calendrier tels que les jours fériés. Selon les données utilisées dans les algorithmes de ML et les données prédites, la sémantique des données peut être difficile à découvrir pour les algorithmes d’apprentissage automatisé. Les forcer à découvrir ces relations cachées n’est pas nécessaire si elles ne sont pas cachées à l’opérateur humain.

Mis à part la sémantique, la partie la plus délicate de la science des données est de faire la différence entre des résultats statistiquement bons et des résultats utiles. Il est facile d’utiliser des statistiques d’estimation pour vous convaincre que vous avez de bons résultats ou qu’un nouveau modèle vous donne de meilleurs résultats qu’un ancien modèle, alors qu’en fait aucun des deux modèles n’est utile pour résoudre un problème réel. Cependant, même avec des méthodologies statistiques valides, il existe toujours une composante pour interpréter les résultats de la modélisation qui nécessite une intelligence humaine.

Lors du développement d’un modèle, vous rencontrez souvent des problèmes concernant les statistiques d’estimation de modèle à mesurer : comment les pondérer, les évaluer dans le temps et décider quels résultats sont significatifs. Ensuite, il y a tout le problème du sur-test : si vous testez trop fréquemment sur le même ensemble de données, vous finissez par « apprendre » vos données de test, ce qui rend vos résultats de test trop optimistes. Enfin, vous devez créer des modèles et comprendre comment rassembler toutes ces statistiques dans une méthodologie de simulation qui sera réalisable dans le monde réel. Vous devez également considérer que ce n’est pas parce qu’une plate-forme d’apprentissage automatique a été déployée avec succès pour résoudre un problème de modélisation et de prédiction spécifique que répéter le même processus sur un problème différent dans ce domaine ou dans une verticale différente va conduire à le même succès.

Lire aussi  L'IA peut-elle ouvrir la voie au développement d'applications Low Code/No Code ?

Il y a tellement de choix qui doivent être faits à chaque étape du processus de recherche, de développement et de déploiement de la science des données. Vous avez besoin de data scientists expérimentés pour concevoir des expériences, d’experts du domaine pour comprendre les conditions limites et les nuances des données, et d’ingénieurs de production qui comprennent comment les modèles seront déployés dans le monde réel.

La visualisation est un joyau de la science des données

En plus de la pondération et de la modélisation des données, les data scientists bénéficient également de la visualisation des données, un processus très manuel, et plus un art qu’une science. Le tracé de données brutes, les corrélations entre les données et les quantités prédites et les séries chronologiques de coefficients résultant d’estimations dans le temps peuvent produire des observations qui peuvent être réintroduites dans le processus de construction du modèle.

Vous remarquerez peut-être une périodicité des données, peut-être un effet du jour de la semaine ou un comportement anormal pendant les vacances. Vous pouvez détecter des mouvements extrêmes dans les coefficients qui suggèrent que les données aberrantes ne sont pas bien gérées par vos algorithmes d’apprentissage. Vous remarquerez peut-être un comportement différent entre les sous-ensembles de vos données, ce qui suggère que vous pourriez séparer les sous-ensembles de vos données pour générer des modèles plus raffinés. Encore une fois, des algorithmes d’apprentissage auto-organisés peuvent être utilisés pour essayer de découvrir certains de ces modèles cachés dans les données. Mais un être humain pourrait être mieux équipé pour trouver ces modèles, puis en intégrer les informations dans le processus de construction du modèle.

Lire aussi  Le PDG de Warframe Developer Digital Extremes démissionne – Destructoid

Les plates-formes horizontales de ML doivent être surveillées

Un autre rôle important que jouent les gens dans le déploiement de systèmes d’IA basés sur le ML est la surveillance des modèles. Selon le type de modèle utilisé, ce qu’il prédit et la manière dont ces prédictions sont utilisées en production, différents aspects du modèle doivent être surveillés afin que les écarts de comportement soient suivis et que les problèmes puissent être anticipés avant qu’ils n’entraînent une dégradation. dans les performances du monde réel.

Si les modèles sont régulièrement réformés à l’aide de données plus récentes, il est important de suivre la cohérence des nouvelles données entrant dans le processus de formation avec les données précédemment utilisées. Si les outils de production sont mis à jour avec de nouveaux modèles entraînés sur des données plus récentes, il est important de vérifier que les nouveaux modèles sont aussi similaires aux anciens modèles que l’on pourrait s’y attendre, où les attentes dépendent du modèle et de la tâche.

Il y a clairement d’énormes avantages à appliquer l’automatisation à un large éventail de problèmes dans de nombreuses industries, mais l’intelligence humaine est toujours intrinsèque à ces développements. Vous pouvez automatiser le comportement humain dans une certaine mesure et, dans des environnements contrôlés, reproduire la puissance et les performances de leur travail avec des systèmes d’IA sans code et à faible code basés sur le ML. Mais, dans un monde où les machines dépendent encore fortement des humains, n’oubliez jamais le pouvoir des gens.

.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick