Exigences de stockage pour l’IA, le ML et l’analyse en 2022

L’intelligence artificielle (IA) et l’apprentissage automatique (ML) promettent de transformer des pans entiers de l’économie et de la société, s’ils ne le font pas déjà. Des voitures sans conducteur aux “bots” de service client, les systèmes basés sur l’IA et le ML sont à l’origine de la prochaine vague d’automatisation des entreprises.

Ils sont aussi de gros consommateurs de données. Après une dizaine d’années de croissance relativement régulière, les données utilisées par les modèles d’IA et de ML ont augmenté de façon exponentielle alors que les scientifiques et les ingénieurs s’efforcent d’améliorer la précision de leurs systèmes. Cela impose des exigences nouvelles et parfois extrêmes aux systèmes informatiques, y compris au stockage.

L’IA, le ML et l’analyse nécessitent de gros volumes de données, principalement dans des formats non structurés. “Tous ces environnements exploitent de grandes quantités de données non structurées”, déclare Patrick Smith, CTO de terrain pour l’Europe, le Moyen-Orient et l’Afrique (EMEA) chez le fournisseur Pure Storage. “C’est un monde de données non structurées, pas de blocs ou de bases de données.”

La formation des modèles d’IA et de ML, en particulier, utilise des ensembles de données plus volumineux pour des prédictions plus précises. Comme le souligne Vibin Vijay, spécialiste de l’IA et du ML chez OCF, un modèle de preuve de concept de base sur un seul serveur peut s’attendre à être précis à 80 %.

Avec une formation sur un cluster de serveurs, cela passera à une précision de 98% voire 99,99%. Mais cela impose ses propres exigences à l’infrastructure informatique. Presque tous les développeurs partent du principe que plus de données, c’est mieux, en particulier dans la phase de formation. “Cela se traduit par des collections massives, au moins des pétaoctets, de données que l’organisation est obligée de gérer”, déclare Scott Baker, CMO chez IBM Storage.

Les systèmes de stockage peuvent devenir un goulot d’étranglement. Les dernières applications d’analyse avancées font un usage intensif des CPU et surtout des clusters GPU, connectés via une technologie telle que Nvidia InfiniBand. Les développeurs envisagent même de connecter le stockage directement aux GPU.

“Dans les charges de travail d’IA et de ML, la phase d’apprentissage utilise généralement des GPU puissants qui sont chers et très demandés”, déclare Brad King, co-fondateur et CTO sur le terrain chez le fournisseur Scality. « Ils peuvent parcourir d’énormes volumes de données et peuvent souvent attendre sans rien faire pour plus de données en raison des limitations de stockage.

« Les volumes de données sont généralement importants. Grand est un terme relatif, bien sûr, mais en général, pour extraire des informations utilisables à partir de données, plus les données disponibles sont pertinentes, meilleures sont les informations.

Le défi consiste à fournir un stockage hautes performances à grande échelle et dans les limites du budget. Comme le souligne Vijay d’OCF, les concepteurs peuvent vouloir tout le stockage sur une mémoire flash de niveau 0 hautes performances, mais cela est rarement, voire jamais, pratique. Et en raison du fonctionnement de l’IA et du ML, en particulier dans les phases de formation, cela pourrait ne pas être nécessaire.

Au lieu de cela, les organisations déploient un stockage hiérarchisé, déplaçant les données vers le haut et vers le bas à travers les niveaux, du flash au cloud et même à la bande. « Vous recherchez les bonnes données, au bon endroit, au bon coût », déclare Vijay.

Les entreprises doivent également penser à la conservation des données. Les scientifiques des données ne peuvent pas prédire quelles informations sont nécessaires pour les futurs modèles, et les analyses s’améliorent avec l’accès aux données historiques. L’archivage des données rentable et à long terme reste important.

Exigences de stockage pour l’IA, le ML et l’analyse en 2022

Related

Related News

Wisła Plock SA

Le Premier ministre espagnol nie les allégations de corruption contre son épouse et annule des événements pour envisager de démissionner

Condos à Toronto : les ventes atteignent leur plus bas niveau depuis 15 ans

Les services secrets sont prêts si Trump est emprisonné pour ordre de bâillon, je doute que cela se produise

Comment de brillantes détectives de la télévision britannique m’ont aidée à me comprendre | Eh bien en fait

Narsingh, WFI – L’Hindou

Nous avons peut-être repéré la première éruption magnétar en dehors de notre galaxie

Coupe du monde masculine T20 : des terrains de cricket australiens expédiés aux États-Unis

Des restes du virus de la grippe aviaire trouvés dans le lait pasteurisé, selon la FDA

Ted Cruz pourrait avoir des problèmes avec l’IRS

L’Ukraine obtient le coup de pouce des États-Unis pour l’ATACMS

Shuriken Fight Series 17 en direct sur UFC FIGHT PASS ce samedi

Leave a Reply Cancel reply

Recent News

Wisła Plock SA

Le Premier ministre espagnol nie les allégations de corruption contre son épouse et annule des événements pour envisager de démissionner

Condos à Toronto : les ventes atteignent leur plus bas niveau depuis 15 ans

Les services secrets sont prêts si Trump est emprisonné pour ordre de bâillon, je doute que cela se produise

Comment de brillantes détectives de la télévision britannique m’ont aidée à me comprendre | Eh bien en fait

Narsingh, WFI – L’Hindou

Editor's Pick

More Interesting News

Wisła Plock SA

Le Premier ministre espagnol nie les allégations de corruption contre son épouse et annule des événements pour envisager de démissionner

Exigences de stockage pour l’IA, le ML et l’analyse en 2022

Quels types de stockage sont les meilleurs ?

Stockage à accès bloqué

Fichier et objet

Stockage en ligne

Que recommandent les fournisseurs de stockage ?

Share this:

Related

Related News

Leave a Reply Cancel reply

Recent News

Editor's Pick

Tags

More Interesting News