Armazenamento de dados para IA
Armazenar e ativar dados massivos é crucial para a próxima onda de inovação de IA.
Os desenvolvedores de aplicativos estão correndo para treinar e implementar modelos de IA. O foco tem sido encontrar os dados certos e aumentar o poder da computação. Com a proliferação dos modelos e aplicativos de IA, encontrar a melhor maneira para armazenar as enormes quantidades de exabytes que eles irão gerar se torna um desafio urgente. O suporte a cargas de trabalho de IA requer uma combinação de tecnologias de memória e armazenamento importantes no fluxo de trabalho de dados de IA. Mas, basicamente, a IA em grande escala precisa de discos rígidos.
Alimentar a IA com os dados de que ela precisa para aprender, criar e se aprimorar requer uma ampla gama de tecnologias de armazenamento. De memórias de alto throughput a discos rígidos de alta capacidade, determinar a combinação de armazenamento certa para qualquer carga de carga de trabalho de IA significa equilibrar a necessidade por desempenho e escalabilidade.
Os clusters de computação com IA treinam, executam e otimizam modelos de linguagem. GPUs, CPUs, NPUs e TPUs estão intimamente ligadas a dispositivos de memória de alto desempenho, oferecendo throughput de terabytes e até petabytes por segundo para computação extrema. Os dados de entrada e saída que esses dispositivos usam e criam fluem para clusters de armazenamento em rede, onde são preservados a longo prazo, a maior parte em discos rígidos, para possibilitar treinamento contínuo, controle de qualidade e conformidade futuros.
Hoje, os inovadores de IA na vanguarda do setor também operam os maiores data centers de hiperescala e nuvem do mundo. Essas empresas escolhem armazenar 90% de seus exabytes¹ online em discos rígidos, pois entendem a relação preço-desempenho exclusiva que os discos rígidos oferecem para o armazenamento de capacidade massiva. Embora os SSDs também sejam uma tecnologia crucial, os discos rígidos continuarão armazenando a maioria dos dados à medida que mais arquiteturas otimizadas para IA forem implementadas.
Ao oferecer suporte a todo o fluxo de trabalho de dados de IA, os discos rígidos têm um papel crucial na validação de modelos de IA.
A concretização de todo o potencial da IA necessita de dados e do armazenamento que os mantém.
As pessoas e máquinas criarão de mais maneiras e em um ritmo mais rápido do que nunca à medida que a IA se proliferar, produzindo volumes massivos de dados.
A IA se aprimora em um ciclo virtuoso de realimentação de consumo de dados, geração de novo conteúdo e aprendizado com seu desempenho.
A Seagate está otimizando o armazenamento para IA, dando saltos sem precedentes em capacidade para oferecer suporte ao desenvolvimento e à arquitetura eficientes do data center.
Análise da Seagate das certificações da IDC Estudo com vários clientes, Cloud Infrastructure Index 2023: Compute and Storage Consumption by 100 Service Providers, novembro de 2023.
Análise da Seagate baseada na Forward Insights Q323 SSD Insights, agosto de 2023; IDC Worldwide Hard Disk Drive Forecast 2022-2027, abril de 2023, Doc. nº US50568323; TRENDFOCUS SDAS Long-Term Forecast, agosto de 2023.
Usando carbono incorporado total com um ciclo de vida de 5 anos.
Sara McAllister et al., “A Call for Research on Storage Emissions”, Hotcarbon.org, 2024.