Architecture de stockage avancée optimisée pour l'IA dans les centres de données.
Conçue pour le futur de l'IA, une solution développée par Supermicro, Seagate et OSNexus optimise l'évolutivité et l'efficacité de l'IA.
minute, lecture
Table des matières:
L’essor de l’intelligence artificielle (IA) a engendré une demande sans précédent de solutions de stockage évolutives, hautes performances et économiques pour les centres de données. Ce livre blanc présente une solution complète associant le matériel de Supermicro, les disques durs Exos équipés de la technologie Mozaic 3+™ basée sur HAMR de Seagate, et le logiciel QuantaStor d'OSNexus. Cette solution conjointe répond à la croissance exponentielle des besoins en stockage des données liée à l'IA, par son architecture robuste compatible avec les configurations à évolutivité verticale et horizontale. Parmi ses principaux avantages : une évolutivité améliorée qui permet de gérer l'augmentation des charges de travail d'IA, des performances exceptionnelles avec un débit élevé et une latence faible, une rentabilité optimisée par réduction du nombre de disques et de la consommation d'énergie, une plate-forme de gestion unifiée qui simplifie les opérations, des fonctionnalités de sécurité avancées pour la conformité et un impact environnemental limité grâce à des solutions de stockage peu énergivores.
L'évolution rapide de l'IA et de l'apprentissage automatique (ML, machine learning) a transformé en profondeur le paysage du stockage des données. Les avancées en termes de puissance de calcul, la démocratisation de l'accès pour les développeurs et la rapidité des outils de développement ont entraîné une explosion de l'innovation dans le domaine de l'IA. Alors que les modèles d'IA deviennent de plus en plus avancés, le besoin de solutions de stockage évolutives très performantes n'a jamais été aussi grand. Les données sont l'essence de l'IA, et la capacité à stocker, gérer et consulter efficacement de grandes quantités de données est essentielle pour entraîner des modèles d'IA et déployer des applications basées sur l'IA. Les solutions de stockage traditionnelles sont loin de répondre à ces besoins, ce qui nous pousse à développer de nouvelles architectures adaptées aux charges de travail d'IA.
Les charges de travail d'IA ont des exigences spécifiques que les solutions de stockage traditionnelles peinent à satisfaire. L'entraînement des modèles d'IA nécessite d'importants volumes de données, atteignant souvent l'échelle du pétaoctet. L'efficacité du processus d'entraînement repose en grande partie sur la rapidité d'extraction des données qui doivent être accessibles à la demande. De plus, les applications basées sur l'IA exécutent généralement des tâches de traitement portant sur de grands volumes de données qui nécessitent un débit élevé et une latence faible, pour pouvoir fournir des informations en temps réel.
Avec une telle intensité de calcul, les charges de travail d'IA génèrent une quantité considérable de métadonnées qu'il convient de gérer efficacement pour éviter les goulots d'étranglement. Les solutions de stockage traditionnelles, limitées dans leur évolutivité et leurs performances, ne sont pas adaptées à ces exigences. En général, elles ne sont pas suffisamment flexibles pour gérer des charges de travail dynamiques, ce qui les rend inefficaces et augmente les coûts d'exploitation.
L'innovation basée sur l'IA a besoin de solutions de stockage capables d'évoluer rapidement, de gérer de grands volumes de données non structurées et d'offrir un accès transparent à ces données. Par exemple, l'entraînement d'un modèle d'IA complexe implique un traitement itératif de grands ensembles de données pour affiner les algorithmes et gagner en précision. Le volume de données requis pour ces itérations peut, à lui seul, submerger les systèmes de stockage traditionnels, causant ainsi des problèmes de latence et d'efficacité globale des opérations d'IA.
De plus, les applications basées sur l'IA sont de plus en plus souvent déployées dans des environnements en temps réel où le traitement immédiat des données est essentiel. Cela inclut des applications telles que les véhicules autonomes, la maintenance prédictive et la santé personnalisée. Ces exemples d'utilisation requièrent des solutions de stockage qui offrent non seulement une grande capacité, mais aussi des performances exceptionnelles pour une analyse des données et une prise de décision instantanées.
La solution conjointe de Supermicro, Seagate et OSNexus associe matériel et logiciels de pointe afin d'offrir une infrastructure de stockage robuste, évolutive et économique pour les charges de travail d'IA. Les composants essentiels de cette solution sont les serveurs et systèmes JBOD de Supermicro, les disques durs Mozaic 3+ et SSD Nytro NVMe de Seagate et le logiciel QuantaStor d'OSNexus.
L'architecture de cette solution conjointe prend en charge les configurations à évolutivité verticale et horizontale, pour répondre à divers besoins de déploiement.
L'évolution vers le haut (ou verticale) consiste à augmenter la capacité d'un système de stockage ou d'un serveur unique en y ajoutant des ressources, telles que des processeurs, de la mémoire et/ou des disques de stockage. Cette approche optimise les performances des unités individuelles, mais elle a ses limites en termes d'évolutivité.
À l'inverse, l'évolution latérale (ou horizontale) consiste à ajouter des nœuds de stockage ou des serveurs à un système, ce qui répartit la charge de travail sur plusieurs unités. Cette approche offre une évolutivité quasi illimitée et permet aux systèmes de gérer des charges de travail d'IA plus importantes et plus complexes, au sein d'une architecture que l'on peut étendre lorsque la demande augmente.
Les configurations à évolutivité verticale sont idéales pour les petites applications sensibles au coût, avec un débit atteignant 5 à 10 Go/s. En revanche, les configurations à évolutivité horizontale sont conçues pour des déploiements plus vastes, avec des performances qui augmentent de façon linéaire à mesure que de nouveaux nœuds sont incorporés. Cette évolutivité permet à la solution d’atteindre un débit de plusieurs centaines de gigaoctets par seconde répondant aux exigences des charges de travail d'IA intensives.
L'intégration parfaite des serveurs Supermicro, des disques Seagate et du logiciel QuantaStor forme une solution de stockage cohérente et efficace. Cette architecture prend en charge à la fois le stockage de fichiers et le stockage d'objets, offrant aux organisations la liberté de choisir la configuration la mieux adaptée à leurs besoins spécifiques. La gestion unifiée fournie par QuantaStor garantit le fonctionnement harmonieux de tous les composants, avec à la clé des performances et une fiabilité optimales. La capacité de gérer des configurations à évolutivité verticale et horizontale au sein d'une seule et même plate-forme simplifie les opérations et réduit la complexité associée à la gestion de plusieurs systèmes de stockage.
L'architecture intègre des serveurs Supermicro, des disques durs Seagate Exos Mozaic 3+ et des SSD Seagate Nytro NVMe, le tout orchestré par le logiciel OSNexus QuantaStor. Cette combinaison répond aux lourdes exigences des charges de travail d'IA et de ML qui nécessitent un débit élevé, une faible latence et la capacité de gérer efficacement des ensembles de données extrêmement volumineux.
Considérations relatives à l'infrastructure de déploiement.
En fonction des exigences de performances et de capacité des charges de travail d'IA et de ML concernées, différentes configurations peuvent être nécessaires pour obtenir des résultats optimaux. Des facteurs tels que le volume de données traitées et la vitesse à laquelle les données sont accessibles détermineront le choix entre une configuration hybride ou 100 % Flash pour le scénario envisagé. En outre, les questions budgétaires et l'évolutivité requise vont influencer les choix de conception de l'architecture.
L'efficacité de la gestion et l'optimisation sont essentielles pour tirer le meilleur parti des charges de travail d'IA et de ML au sein de l'architecture de stockage. Les fonctionnalités de gestion avancées de QuantaStor simplifient les opérations en vous permettant de contrôler et de superviser intégralement des configurations diverses.
Il convient d'adapter les solutions de stockage aux spécificités des charges de travail d'IA et de ML concernées pour obtenir des performances optimales et le meilleur rapport coût/efficacité. Selon l'échelle et la complexité de la charge de travail, des configurations à évolutivité verticale, à évolutivité horizontale, ou mixtes peuvent être déployées pour répondre aux demandes spécifiques de différents secteurs et applications.
Les avancées technologiques intégrées dans cette solution sont essentielles à son efficacité. Les disques durs Seagate Exos Mozaic 3+ constituent une avancée significative en matière de technologie de stockage. Grâce à la technologie HAMR, ces disques atteignent une densité surfacique sans précédent et offrent ainsi une plus grande capacité de stockage pour un même encombrement physique. Cette avancée permet non seulement de répondre aux besoins de stockage de données en masse, mais également d'améliorer le rendement énergétique en réduisant le nombre de disques utilisés à quantité de données égale.
Les avantages des disques durs Mozaic 3+ en termes de coût total de possession sont considérables : ils offrent notamment une capacité de stockage multipliée par 3 pour un encombrement identique du centre de données, un coût par téraoctet réduit de 25 %, une consommation énergétique inférieure de 60 % par téraoctet et une réduction de 70 % du carbone incorporé par téraoctet (par rapport à des disques PMR de 10 To, capacité courante qui nécessite une montée en gamme dans les centres de données actuels). La faible consommation d'énergie de ces disques se traduit par une réduction des coûts énergétiques, tandis que leur densité supérieure limite l'espace physique occupé et entraîne donc des économies au niveau de l'infrastructure du centre de données. De plus, ils constituent une solution plus respectueuse de l'environnement de par leur faible quantité de carbone incorporé, en droite ligne des objectifs de développement durable que visent de plus en plus d'entreprises modernes.
L'intégration des SSD Seagate Nytro NVMe vient renforcer les performances. Ces disques ultrarapides sont essentiels pour gérer les opérations de lecture et d'écriture intensives typiques des charges de travail d'IA. Leur faible latence permet d'accéder aux données et de les traiter en temps réel, un point essentiel pour l'entraînement des modèles d'IA et le déploiement des applications basées sur l'IA. La conception à double port des SSD améliore la fiabilité, car elle assure un fonctionnement continu même en cas de défaillance de l'un des ports.
Le logiciel OSNexus QuantaStor vient encore améliorer la solution avec une gestion intelligente des données et des fonctionnalités de sécurité avancées. Les fonctionnalités de hiérarchisation automatique du logiciel garantissent le stockage des données au niveau le plus approprié, pour des performances et un coût optimisés. Le chiffrement de bout en bout et la conformité aux normes du secteur contribuent à protéger les données en répondant aux questions de sécurité et de confidentialité qui sont primordiales dans les applications basées sur l'IA, en particulier dans des secteurs comme la santé et la finance, où des données sensibles sont fréquemment traitées.
La solution conjointe de Supermicro, Seagate et OSNexus offre plusieurs avantages clés qui répondent aux besoins spécifiques des charges de travail d'IA et de ML. Cela inclut les avantages suivants :
Cette solution est suffisamment polyvalente pour prendre en charge un large éventail de cas d’utilisation dans divers secteurs. En voici quelques exemples :
La solution d'IA développée conjointement par Supermicro, Seagate et OSNexus offre une architecture de stockage complète, évolutive et économique, faite sur mesure pour répondre aux exigences spécifiques des charges de travail d'IA et de ML. Alliant des technologies matérielles et logicielles avancées, cette solution assure des performances, une fiabilité et une efficacité exceptionnelles, idéales pour les organisations qui souhaitent gagner un avantage concurrentiel grâce à l'IA. Qu'elle soit déployée dans le secteur de la santé, de la finance, des médias, de l'industrie ou de la recherche, cette solution fournit l'infrastructure robuste requise pour exploiter la nouvelle génération d'applications basées sur l'IA et ouvre des perceptives d'innovation par l'IA dans tous les secteurs.
Topologie | Produit | Modèle de résilience | Capacité brute | Capacité utilisable | Caractéristiques détaillées |
---|---|---|---|---|---|
Évolutivité verticale | Disque hybride SBB ; | Triple parité | 2 039 To bruts | 1 512 To utilisables | lien |
Évolutivité verticale | SBB 100 % Flash | Double parité (4d+2p) | 737 To bruts | 553 To utilisables | lien |
Évolutivité horizontale | Hyper 100 % Flash | EC2k+2m/REP3 | 1 106 To bruts | 533 To utilisables | lien |
Évolutivité horizontale | 4U/36 | EC4K+2m/REP3 | 3 974 To bruts | 2 513 To utilisables | lien |
Évolutivité horizontale | 4U/36 | EC8K+3m/REP3 | 8 342 To bruts | 5 786 To utilisables | lien |
Évolutivité horizontale | Chargement double nœud par le haut | EC8K+3m/REP3 | 1 981 To bruts | 8 406 To utilisables | lien |
Acronymes et informations complémentaires.
SBB : Storage Bridge Bay.
EC : Erasure Coding (Codage d'effacement).
Les termes « double parité » et « triple parité » désignent le nombre de blocs de parité utilisés pour assurer la redondance des données et la tolérance aux pannes.
Les chaînes numériques sont associées au modèle de résilience.