Arquitetura de armazenamento avançada para capacitar a IA em data centers.
Desenvolvida para o futuro da IA, uma solução conjunta da Supermicro, Seagate e OSNexus foi projetada para gerar eficiência e escalabilidade de IA.
minuto(s) de leitura
Índice:
A ascensão da inteligência artificial (IA) gerou uma demanda sem precedentes por soluções de armazenamento de data center escaláveis, de alto desempenho e econômicas. Este whitepaper apresenta uma solução abrangente que combina o hardware da Supermicro, discos rígidos Seagate Exos habilitados pela tecnologia Mozaic 3+™ baseada em HAMR da Seagate e o software OSNexus QuantaStor. Essa solução conjunta atende ao crescimento explosivo nas necessidades de armazenamento de dados gerados por IA, fornecendo uma arquitetura robusta que oferece suporte a configurações de expansão horizontal e vertical. Os principais benefícios incluem escalabilidade aprimorada para acomodar cargas de trabalho de IA crescentes, desempenho excepcional com alto throughput e baixa latência, eficiência de custos otimizada com a redução de discos físicos e economia de energia, uma plataforma de gerenciamento unificada que simplifica as operações, recursos avançados de segurança para conformidade e impacto ambiental reduzido por meio de soluções de armazenamento de baixo consumo de energia.
A rápida evolução das tecnologias de IA e machine learning (ML) transformaram fundamentalmente o panorama do armazenamento de dados. Os avanços em poder computacional, acesso democratizado para desenvolvedores e ferramentas de desenvolvimento mais rápidas levaram a uma explosão de inovação gerada pela IA. À medida que os modelos de IA ficam mais avançados, a necessidade por soluções de armazenamento escaláveis e de alto desempenho nunca foi tão grande. Os dados são a base da IA, e a capacidade de armazenar, gerenciar e acessar enormes quantidades de dados com eficiência é crucial para treinar modelos de IA e implantar aplicativos de IA. As soluções de armazenamento tradicionais muitas vezes não conseguem atender a essas demandas, sendo necessário o desenvolvimento de novas arquiteturas sob medida para as necessidades das cargas de trabalho de IA.
As cargas de trabalho de IA apresentam desafios únicos que as soluções de armazenamento tradicionais têm dificuldade de superar. Os modelos de IA requerem grandes quantidades de dados para treinamento, muitas vezes atingindo uma escala de petabytes. Esses dados devem ser imediatamente acessíveis, visto que a eficiência do processo de treinamento depende amplamente da rápida recuperação de dados. Além disso, os aplicativos de IA costumam envolver tarefas de processamento de dados em grande escala, que exigem alto throughput e baixa latência para fornecer insights em tempo real.
A intensidade computacional das cargas de trabalho de IA também gera quantidades significativas de metadados, que devem ser gerenciados com eficiência para evitar gargalos. As soluções de armazenamento tradicionais, com sua escalabilidade e desempenho limitados, são inadequadas para essas demandas. Muitas vezes, elas não têm a flexibilidade para lidar com cargas de trabalho dinâmicas, levando a ineficiências e custos operacionais mais altos.
A inovação gerada pela IA precisa de soluções de armazenamento que possam ser expandidas rapidamente, lidar com grandes volumes de dados não estruturados e fornecer acesso integrado a esses dados. Por exemplo, treinar um modelo de IA complexo envolve processamento iterativo de conjuntos de dados amplos para aperfeiçoar algoritmos e aumentar a precisão. O enorme volume de dados necessário para essas iterações pode sobrecarregar os sistemas de armazenamento tradicionais, causando atrasos e reduzindo a eficiência geral das operações de IA.
Além disso, os aplicativos de IA estão, cada vez mais, implantados em ambientes de tempo real, nos quais o processamento de dados imediato é essencial. Isso inclui aplicações como veículos autônomos, manutenção preditiva e saúde personalizada. Esses casos de uso exigem soluções de armazenamento que não só ofereçam alta capacidade, mas também forneçam um desempenho excepcional para oferecer suporte à análise de dados instantânea e tomada de decisões.
A solução conjunta da Supermicro, Seagate e OSNexus combina hardware e software de ponta para fornecer uma infraestrutura de armazenamento robusta, escalável e econômica para cargas de trabalho de IA. Os componentes básicos dessa solução incluem JBODs e servidores Supermicro, discos rígidos Seagate Mozaic 3+, SSDs Seagate Nytro NVMe e software OSNexus QuantaStor.
A arquitetura da solução conjunta oferece suporte a configurações de expansão horizontal e vertical, atendendo a diversas necessidades de implementação.
A expansão vertical envolve aumentar a capacidade de um sistema ou servidor de armazenamento único com a adição de mais recursos, como CPUs, memória e/ou discos de armazenamento. Essa abordagem maximiza o desempenho de unidades individuais, mas tem limitações inerentes em termos de escalabilidade.
A expansão horizontal, por outro lado, envolve adicionar mais nós de armazenamento ou servidores a um sistema, distribuindo a carga de trabalho entre várias unidades. Essa abordagem possibilita uma escalabilidade praticamente ilimitada, permitindo que os sistemas lidem com cargas de trabalho de IA maiores e mais complexas ao expandir a arquitetura de forma integrada à medida que a demanda cresce.
As configurações de expansão vertical são ideais para aplicações menores com limite de custo, oferecendo throughput de até 5-10 GB/s. Por outro lado, as configurações de expansão horizontal são projetadas para implantações maiores, com o desempenho escalando linearmente à medida que nós adicionais são incorporados. Com essa escalabilidade, a solução pode atingir centenas de gigabytes por segundo em throughput, atendendo às demandas das cargas de trabalho de IA intensas.
A integração perfeita de servidores da Supermicro, discos da Seagate e software QuantaStor forma uma solução de armazenamento coesa e eficiente. Essa arquitetura oferece suporte a armazenamento de arquivos e de objetos, fornecendo às organizações a flexibilidade para escolher a configuração mais adequada para suas necessidades específicas. O gerenciamento unificado fornecido pela QuantaStor garante que todos os componentes funcionem em harmonia, proporcionando desempenho e confiabilidade otimizados. A capacidade de gerenciar configurações de expansão horizontal e vertical dentro de uma única plataforma simplifica as operações e reduz a complexidade associada à manutenção de vários sistemas de armazenamento.
A arquitetura inclui servidores Supermicro, discos rígidos Seagate Exos Mozaic 3+ e SSDs Seagate Nytro NVMe, tudo orquestrado pelo software OSNexus QuantaStor. Essa combinação atende às demandas intensas das cargas de trabalho de IA/ML, que exigem alto throughput, baixa latência e a capacidade de lidar com conjuntos de dados massivos de modo eficiente.
Considerações sobre a infraestrutura de implantação.
Dependendo dos requisitos de desempenho específicos e das necessidades de capacidade de dados das cargas de trabalho de IA/ML, diferentes configurações podem ser necessárias para alcançar os resultados ideais. Fatores como o volume de dados sendo processados e a velocidade na qual os dados precisam ser acessados ditarão se uma configuração híbrida ou totalmente flash será a melhor opção para o cenário. Além disso, considerações de orçamento e requisitos de escalabilidade influenciarão as escolhas de design para a arquitetura.
O gerenciamento e a otimização eficazes são cruciais para garantir que as cargas de trabalho de IA/ML tenham o melhor desempenho dentro da arquitetura de armazenamento. Os recursos de gerenciamento avançado da QuantaStor simplificam as operações, fornecendo controle abrangente e supervisão entre diversas configurações.
Diferentes cargas de trabalho de IA/ML exigem soluções de armazenamento adaptadas para alcançar o desempenho ideal e a relação custo-benefício. Dependendo da escala e da complexidade da carga de trabalho, configurações de expansão horizontal, expansão vertical ou mista podem ser implementadas para atender às demandas específicas de vários setores e aplicações.
Os avanços tecnológicos incorporados nesta solução são cruciais para sua eficácia. Os discos rígidos Seagate Exos Mozaic 3+ representam um avanço significativo na tecnologia de armazenamento. Ao utilizar a tecnologia HAMR, esses discos atingem uma densidade de área sem precedentes, garantindo uma maior capacidade de armazenamento dentro do mesmo volume físico. Esse avanço não só atende à necessidade de armazenamento de dados em grande escala, mas também aprimora a eficiência energética, já que menos discos são necessários para armazenar a mesma quantidade de dados.
As vantagens de TCO dos discos rígidos Mozaic 3+ são consideráveis, incluindo o triplo da capacidade de armazenamento no mesmo espaço físico do data center, com um custo por TB 25% inferior, um consumo de energia 60% mais baixo por TB e uma redução de 70% do carbono incorporado por TB (em comparação com discos PMR de 10 TB, uma capacidade de disco comum que precisa de upgrade nos data centers atualmente). O consumo de energia mais baixo dos discos se traduz em custos de energia reduzidos, e a densidade mais alta reduz a necessidade por espaço físico, levando a economias na infraestrutura do data center. Além disso, o baixo carbono incorporado dos discos os torna uma opção mais ecológica, em conformidade com as metas de sustentabilidade, que são cada vez mais importantes para as empresas modernas.
A integração dos SSDs Seagate Nytro NVMe adiciona outra camada de desempenho aprimorado. Esses discos de alta velocidade são essenciais para gerenciar as operações de leitura e gravação intensas típicas das cargas de trabalho de IA. A baixa latência garante que os dados possam ser acessados e processados em tempo real, o que é crucial para treinar modelos de IA e implantar aplicativos de IA. O design de porta dupla dos SSDs aumenta a confiabilidade, pois possibilita a operação contínua mesmo se uma porta falhar.
O software OSNexus QuantaStor aprimora ainda mais a solução ao fornecer gerenciamento inteligente de dados e recursos avançados de segurança. Os recursos de nivelamento automático do software garantem que os dados sejam armazenados na camada mais apropriada, otimizando desempenho e custo. A criptografia de ponta a ponta e a conformidade com os padrões do setor ajudam a proteger os dados tratando das preocupações com segurança e privacidade que são fundamentais em aplicações de IA, principalmente em setores como saúde e finanças, nos quais dados confidenciais são manipulados com frequência.
A solução conjunta da Supermicro, Seagate e OSNexus oferece vários benefícios importantes que atendem às necessidades específicas das cargas de trabalho de IA/ML. Esses benefícios incluem:
A solução é versátil o suficiente para oferecer suporte a uma ampla gama de casos de uso em vários setores. Alguns exemplos incluem:
A solução de IA conjunta desenvolvida pela Supermicro, Seagate e OSNexus oferece uma arquitetura de armazenamento abrangente, escalável e econômica adaptada para as demandas exclusivas das cargas de trabalho de IA/ML. Ao combinar tecnologias avançadas de hardware e software, a solução fornece desempenho, confiabilidade e eficiência excepcionais, tornando-a a escolha ideal para as organizações que desejam aproveitar a IA para obter uma vantagem competitiva. Seja implementada na área de saúde, finanças, mídia, fabricação ou pesquisa, essa solução fornece a infraestrutura robusta necessária para oferecer suporte à próxima geração de aplicativos de IA e trilhar o caminho para o futuro da inovação gerada por IA em todos os setores.
Topologia | Produto | Modelo de resiliência | Capacidade bruta | Capacidade utilizável | Especificação detalhada |
---|---|---|---|---|---|
Expansão horizontal | SBB híbrido; | Paridade tripla | 2.039 TB brutos | 1.512 TB úteis | link |
Expansão horizontal | SBB totalmente flash | Dupla paridade (4d+2p) | 737 TB brutos | 553 TB úteis | link |
Expansão vertical | Hyper totalmente flash | EC2k+2m/REP3 | 1.106 TB brutos | 533 TB úteis | link |
Expansão vertical | 4U/36 | EC4K+2m/REP3 | 3.974 TB brutos | 2.513 TB úteis | link |
Expansão vertical | 4U/36 | EC8K+3m/REP3 | 8.342 TB brutos | 5.786 TB úteis | link |
Expansão vertical | Carregamento superior de nó duplo | EC8K+3m/REP3 | 1.198 1TB brutos | 8.406 TB úteis | link |
Acrônimos e informações adicionais.
SBB: Baia de ponte de armazenamento.
EC: Codificação de apagamento
“Paridade dupla” e “paridade tripla” se referem ao número de blocos de paridade usados para fornecer redundância de dados e tolerância a falha.
As cadeias numéricas referem-se ao modelo de resiliência.