Perspectives sur l'IA

Les données d'IA circulent dans une boucle infinie.

En permettant une création et une itération permanentes, ce cycle vertueux affine les modèles au fur et à mesure de leur exécution.

La boucle infinie des données d'IA.

L'IA fait deux choses : elle utilise des données et elle en crée. En effet, les modèles d'IA améliorent leurs performances en utilisant des données fiables, qui peuvent être générées par le modèle lui-même ou provenir de nouvelles sources de données. Il en résulte une boucle infinie de production et d'utilisation des données qui aiguise l'intelligence des applications et génère de meilleurs résultats.

Ce mode de fonctionnement modifie en profondeur la valeur des données et la manière dont nous les utilisons. Le fait de stocker davantage de données dans cette boucle infinie améliore l'IA.

À chaque étape, les données font partie intégrante de l'IA.

De même que les sources de données récemment collectées, chaque réponse, contenu ou artefact généré par l'IA alimente le prochain cycle d'entraînement, s'inscrivant ainsi dans une boucle continue d'amélioration des résultats. Lors des déploiements de centres de données à grande échelle, les six phases de la boucle des données d'IA sont rendues possibles par une combinaison de périphériques de stockage et de dispositifs de mémoire.

1. PRÉPARER LES DONNÉES SOURCES

La première étape consiste à définir, à rechercher et à préparer les données.

Qu'il s'agisse de petites bases de données structurées ou du réseau Internet lui-même, les ensembles de données peuvent prendre n'importe quelle forme. Les disques durs en réseau proposent des fonctionnalités de conservation et de protection à long terme des données brutes. Les SSD en réseau constituent un niveau de données immédiatement accessible.

2. ENTRAÎNER LES MODÈLES

Ensuite, le modèle apprend en s'entraînant avec les données stockées.

L’entraînement est un processus expérimental au cours duquel un modèle converge et est protégé par des points de contrôle. Un accès ultrarapide aux données est alors indispensable. Cette phase, qui sollicite fortement les ressources, s'appuie sur des SSD locaux et sur des mémoires HBM et DRAM. Les disques durs et les SSD en réseau stockent des points de contrôle afin de protéger et d'affiner les modèles.

3. CRÉER DES CONTENUS

Le processus d'inférence utilise le modèle entraîné pour générer des résultats.

Selon l'application, le modèle peut être utilisé pour des tâches telles que le chat, l'analyse d'images ou la création de vidéos. Les principaux supports de stockage de cette création itérative sont les SSD locaux et les mémoires HBM et DRAM.

4. STOCKER LES CONTENUS

Le processus d'itération crée de nouvelles données validées que vous devez stocker.

Une fois enregistrées, ces données continuent d'être affinées et font l'objet de contrôles permanents à des fins d'assurance qualité et de conformité. Les disques durs stockent et protègent les versions répliquées des contenus créés. Les SSD en réseau offrent un niveau de données adapté à la vitesse.

5. CONSERVER LES DONNÉES

Les ensembles de données répliqués sont conservés dans les différents environnements et régions.

Les données stockées constituent l'ossature d'une IA fiable, ce qui permet aux experts en mégadonnées de s'assurer que les modèles fonctionnent comme prévu. Les disques durs ont pour fonction essentielle de stocker et de protéger les données à long terme. Les SSD en réseau permettent de raccorder les disques durs à la couche SSD locale et facilitent la circulation des données au sein de l'écosystème.

6. RÉUTILISER LES DONNÉES

Les données sources, les données des modèles et les données d'inférence alimentent le cycle suivant.

Les résultats sont réinjectés dans le modèle, ce qui améliore sa précision et permet d'en générer de nouveaux. Les disques durs et SSD en réseau permettent de créer des données d’IA dispersées géographiquement. Les ensembles de données bruts et les résultats sont utilisés en tant que sources pour de nouveaux flux.

Les charges de travail d'IA nécessitent plusieurs niveaux de stockage.

Les technologies de mémoire et de stockage telles que la mémoire DRAM, les disques durs et les SSD jouent un rôle essentiel tout au long du flux des données d'IA. À chaque étape, il est nécessaire de combiner ces éléments de manière optimisée afin de répondre aux exigences de chaque charge de travail en matière de performances et d'évolutivité.

Lire le blog

En savoir plus sur l'IA et le stockage de données.

Exploiter pleinement le potentiel de l'IA requiert des données, ainsi qu'un système de stockage pour les héberger.

Consultez les ressources associées.

Architecture de stockage avancée optimisée pour l'IA dans les centres de données.

Ce livre blanc présente une solution de stockage IA évolutive développée par Supermicro, Seagate et OSNexus, comprenant des disques Exos dotés de la technologie Mozaic 3+. Les avantages sont notamment l'évolutivité, la gestion unifiée, la sécurité avancée et la réduction de l'impact sur l'environnement.