La IA depende del almacenamiento de datos de capacidad masiva.

Almacenar y activar datos masivos es fundamental para la próxima ola de innovación de la IA.

Maximizar el potencial de la IA requiere un equilibrio.

Los desarrolladores de aplicaciones se apresuran a entrenar e implementar modelos de IA. La atención se ha centrado en encontrar los datos correctos y aumentar la potencia informática. A medida que proliferan los modelos y aplicaciones de IA, descubrir cómo almacenar las cantidades masivas de exabytes que generarán se convierte en un desafío urgente. Admitir cargas de trabajo de IA requiere una combinación de importantes tecnologías de memoria y almacenamiento en todo el flujo de trabajo de datos de la IA. Pero, en última instancia, la IA a escala requiere unidades de disco duro.

Un espectro de memoria y almacenamiento habilita la IA.

Alimentar a la IA con los datos que necesita para aprender, crear y mejorar requiere una amplia gama de tecnologías de almacenamiento. Desde la memoria de alto rendimiento hasta las unidades de disco duro de gran capacidad, determinar la combinación de almacenamiento adecuada para cualquier carga de trabajo de la IA se trata de equilibrar las necesidades de rendimiento, costo y capacidad de expansión. 

La mayoría de los datos de IA terminan en unidades de disco duro.

Los clústeres de computación de la IA entrenan, ejecutan y optimizan modelos de lenguaje. Las GPU, CPU y TPU están estrechamente vinculadas con los dispositivos de memoria de alto rendimiento, lo que ofrece una producción de terabytes e incluso petabytes por segundo para una computación extrema. Los datos de entrada y salida que estas usan y crean fluyen hacia los clústeres de almacenamiento en red donde se conservan a largo plazo, principalmente en unidades de disco duro, para respaldar la repetición de entrenamiento, el control de calidad y el cumplimiento en el futuro.

Los centros de datos más grandes del mundo eligen unidades de disco duro.

Actualmente, los innovadores de la IA más avanzados también gestionan los centros de datos de hiperescala y en la nube más grandes del mundo. Estas empresas eligen almacenar el 90 % de sus exabytes¹ en línea en las unidades de disco duro porque comprenden el valor único de la relación precio-rendimiento que ofrecen para el almacenamiento de capacidad masiva. Aunque las unidades SSD también son una tecnología fundamental, las unidades de disco duro seguirán almacenando la mayoría de los datos a medida que se implementen más arquitecturas optimizadas para la IA.

Por qué las unidades de disco duro son ideales para la IA a gran escala.

La explosión de datos de la era de la IA exige un almacenamiento masivo y escalable. Aunque las unidades de estado sólido (SSD) son importantes para las cargas de trabajo de baja latencia, la IA a escala se ejecuta en unidades de disco duro. Tres factores clave explican por qué.

Economías de escala.

Según el costo por TB, los discos duros son 6 veces más eficientes que las unidades SSD; esto los convierte en la opción lógica para las construcciones de almacenamiento de datos de la IA.²

Producción de exabytes a escala.

En términos de capital, la fabricación de las unidades de disco duro es 9 veces más eficiente que la industria las NAND.³

Sostenibilidad a escala.

Las unidades de disco duro usan 4 veces menos potencia operativa por terabyte y tienen 10 veces menos carbono incorporado que las unidades SSD.⁴

Las unidades de disco duro son la columna vertebral del almacenamiento de datos de la IA.

Al admitir todo el flujo de trabajo de datos de IA, las unidades de disco duro desempeñan un papel crucial en la validación de los modelos de IA.

  1. Análisis de Seagate del estudio multicliente de IDC, Índice de infraestructura de nube 2023: Consumo de computación y almacenamiento por parte de 100 proveedores de servicios, noviembre de 2023.

  2. Análisis de Seagate basado en Forward Insights Q323 SSD Insights, agosto 2023; IDC Worldwide Hard Disk Drive Forecast 2022-2027, abril de 2023, Doc. #US50568323; TENDENCIA SDAS Long-Term Forecast, agosto de 2023.

  3. Uso de carbono incorporado total con un ciclo de vida de 5 años.

  4. Sara McAllister et al., "A Call for Research on Storage Emissions” (Un llamado a la investigación sobre las emisiones de almacenamiento), Hotcarbon.org, 2024.