Étude de cas Academia Sinica
Une académie de recherche sur le climat fait appel à Seagate pour résoudre un problème lié aux volumes de données.
Academia Sinica est une institution de recherche sur le climat de premier plan basée à Taïwan. Les chercheurs de cette institution estiment qu'au cours des quatre prochaines années, leur volume de données sera multiplié par 16, atteignant alors plus de 10 Po. En raison de la quantité croissante de données utilisées pour les simulations, l'équipe a besoin d'un stockage fiable capable de suivre le rythme de cette augmentation. Les solutions polyvalentes et évolutives de Seagate répondent à ces besoins en constante évolution.
Atteindre zéro émission nette d'ici 2050 est un enjeu mondial imminent. Dans cet objectif, Taïwan fait avancer de manière proactive la législation relative au changement climatique et restructure ses départements chargés de l'environnement pour entamer une transition vers le « zéro émission nette ». L'équipe spécialiste du climat au Centre des changements environnementaux (RCEC) d'Academia Sinica, l'académie de recherche la plus importante de Taïwan, a mené des recherches pertinentes sur le climat dans cette optique en développant le modèle TaiESM (Taiwan Earth System Model).
Inclus à la phase 6 du projet d'intercomparaison des modèles couplés (CIMP6), financé par le programme mondial de recherche sur le climat (WCRP, World Climate Research Programme), TaiESM a été cité dans le sixième rapport d'évaluation (AR6) du groupe d'experts intergouvernemental sur l'évolution du climat (GIEC)\Groupe de travail I (WGI) des Nations Unies. Les données de simulation du modèle TaiESM sont partagées avec les institutions de recherche de différents pays via le portail reposant sur les systèmes de stockage Seagate. Pour l’heure, l’équipe spécialiste du climat du RCEC collabore avec de nombreuses équipes universitaires, dont celles de l’Institut océanographique de l'Université nationale de Taïwan (IONTU), en vue de continuer à améliorer les processus physiques et chimiques du modèle TaiESM.
La première phase du TaiESM a permis à l'équipe spécialiste du climat de participer à des échanges de données internationaux, et l'a même placée parmi les pays les mieux classés dans la plupart des évaluations de performance du modèle. La version actuelle du TaiESM est basée sur le CESM (Community Earth System Model) des États-Unis. Huang-Hsiung Hsu, PDG du Centre sur le changement climatique anthropique, a déclaré : « Le développement de notre propre modèle englobe [nos] caractéristiques, spécifications, technicités et succès. La prochaine étape de notre projet consiste à améliorer la première version de TaiESM afin d'obtenir un module de prévision climatique entièrement indépendant et développé par une équipe taïwanaise, des programmes fondamentaux aux modules internes, qui réponde aux besoins locaux et appartienne véritablement à Taïwan. »
Outre le développement de base du modèle, l'amélioration du TaiESM nécessite également de collecter les données de simulation climatique générées par d'autres unités météorologiques internationales pour comparaison avec le TaiESM et analyse. L'équipe a pour autre objectif d'être présente dans le monde entier par le biais de collaborations internationales qui produisent et diffusent des prédictions météorologiques crédibles sur le long terme, ainsi que des données exploitables. Une telle présence renforcerait sa réputation et sa notoriété à Taïwan et dans le monde entier, améliorant ainsi les possibilités de partenariats et d'échanges de données avec les autres pays.
Pour gérer une demande accrue de données de modélisation, l'équipe spécialiste du climat du TaiESM a besoin d'une solution de stockage de plus de 10 pétaoctets (Po) dans un avenir proche. Les taux de disponibilité du stockage existant et l’espace limité sur le serveur ne répondent plus aux exigences liées aux applications et aux charges de travail. En raison de l'augmentation des échanges et de l'amélioration de la collecte, l'équipe a besoin d'une solution offrant une disponibilité permanente, une grande rapidité et une protection des données renforcée.
Dans le cadre de la deuxième phase de développement du TaiESM, le Centre de recherche sur les changements environnementaux requiert une plus grande capacité de stockage, car il doit effectuer des analyses plus poussées et obtenir des résolutions visuelles plus élevées, tout en gérant un afflux d'informations structurées complexifié par la croissance et la prolifération des données.
L'espace, les performances et le taux de disponibilité de l'équipement de stockage existant ne répondaient plus aux exigences de l'équipe en matière d'applications et de charges de travail. Pour assurer la pérennité et l’évolutivité de leur stockage en vue de traiter davantage de données de recherche et de rapports d’analyse, une mise à niveau immédiate de l'équipement de stockage est indispensable.
La croissance des données générées par le centre de recherche a largement dépassé la capacité d'un institut de recherche standard. Aujourd'hui, le centre de recherche sur le changement climatique peut stocker environ 3 Po de données de recherche, et il prévoit qu'au cours des quatre prochaines années, la quantité de données climatiques augmentera encore d'au moins 10 Po. L’équipe spécialiste du climat effectue des simulations générant au moins deux à quatre téraoctets (To) de données par jour, et ses besoins exigent un échange continu de données climatiques, plutôt qu'un stockage des données en silos.
Dans le même temps, il est urgent d'améliorer la résolution de la modélisation. La version actuelle du TaiESM produit une résolution qui n'est pas idéale pour la recherche. Pour simuler avec précision la topographie et les conditions météorologiques telles que les typhons, l'équipe souhaite une résolution horizontale au moins quatre fois supérieure. Cette augmentation multiplierait alors par 16 le volume de données.
Reproduire les conditions météorologiques de manière encore plus réaliste et pratique dans le laboratoire de recherche sur le climat est un défi permanent en matière de ressources. L'équipe rencontre de grandes difficultés à simuler une moyenne à long terme des conditions météorologiques, car les températures terrestres et océaniques diffèrent. La technologie a fait progresser la capacité des unités de stockage et la précision des calculs. Aujourd'hui, avec une plus grande quantité de grilles ou de divisions terrestres, les prédictions de modèle ont été améliorées. Le traitement d'un plus grand nombre de données brutes permet d'accroître les possibilités d'utilisation des ressources, mais il crée aussi encore plus de données.
Pour atteindre une résolution visuelle de 25 km, l'équipe crée 32 à 64 To de données par jour. L'équipe spécialiste du climat d'Academia Sinica doit constamment ajuster et calibrer les réglages des modules et comparer les données générées par chaque réglage, ce qui produit encore plus de données. Un stockage des données efficace et fiable est essentiel pour l'équipe. Les pannes des disques durs engendraient un coût important, car il fallait régulièrement remplacer quatre à dix unités défectueuses par mois.
Pour l'équipe de recherche sur le climat, les données froides sont quasiment inexistantes. Academia Sinica nécessite une solution de stockage permanent pour toutes ces données. Les prévisions, les analyses, la reprise des prévisions et des analyses, ainsi que les données de plusieurs modèles sont stockées sur des serveurs dédiés et restent accessibles grâce à un système de fichiers distribués.
En raison de la croissance exponentielle du volume de données, l'équipe doit examiner attentivement ses besoins en capacité, en efficacité et en performance de stockage, ainsi que d'autres facteurs moins évidents, tels que l'encombrement du matériel et les exigences liées aux installations physiques.
Le système de stockage de données haute densité de Seagate, l'Exos X Series 5U84, a atteint des performances de lecture et d'écriture séquentielles de 7 Go et 5,5 Go au stade actuel des recherches de l'équipe spécialiste du climat. La solution intelligente ultra-dense de Seagate a également dépassé les attentes de l'équipe avec une réduction de 75 % de l'espace rack du centre de données et une diminution de 80 % du coût total de possession. La technologie ADAPT (Advanced Distributed Autonomic Protection Technology) de Seagate a également contribué à réduire de 93 % le temps de reconstruction du stockage en cas de panne d'un disque.
L'équipe de recherche sur le climat s'appuie sur l'architecture polyvalente de Seagate pour déployer une plate-forme à capacité élevée et très performante capable de s'adapter à la prolifération des données et de gérer efficacement les données de conservation et inutilisées grâce à des options de hiérarchisation des données en temps réel. La solution de Seagate offre à Academia Sinica un stockage évolutif avec des données toujours accessibles, tout en simplifiant les opérations et en optimisant les coûts.
En raison de la réduction des temps d'arrêt et des coûts de maintenance et informatiques, les équipes du TaiESM peuvent se concentrer sur l'amélioration des prévisions climatiques et gérer les données sans sacrifier les performances.
L'Exos X 5U84 garantit une disponibilité de 99,999 %, permettant à Academia Sinica de maintenir un niveau de fiabilité élevé. Le châssis 5U à densité maximale accueille 84 disques et peut s'étendre à 336 disques pour une capacité de stockage allant jusqu'à 8 Po. Il est conçu pour maximiser les performances des disques en les protégeant des vibrations, des interférences acoustiques, de la chaleur et des variations de courant. La technologie ADAPT permet de répartir les données de recherche climatique entre les disques, renforce la protection des données et accélère les reconstructions sans sacrifier les performances. Les temps d'arrêt sont ainsi réduits, ce qui prolonge le cycle de vie du produit et diminue les dépenses informatiques de réparation ou de remplacement.
Avec moins de temps d'arrêt et des coûts informatiques réduits, les équipes du TaiESM peuvent se concentrer sur l'amélioration du modèle de prévision climatique. Globalement, l'Exos X Series 5U84 optimise la gestion des grands volumes de données et réduit les lourdes dépenses de maintenance des équipements de stockage, de sorte que l'équipe spécialiste du climat puisse fournir des modèles climatologiques critiques à une communauté internationale toujours plus étendue.
Nos spécialistes en stockage sont à votre disposition pour vous aider à trouver la solution adaptée aux défis que vous rencontrez en matière de stockage des données.