Almacenamiento de datos para la inteligencia artificial (IA)
Almacenar y activar datos masivos es fundamental para la próxima ola de innovación de la IA.
Los desarrolladores de aplicaciones se apresuran a entrenar e implementar modelos de IA. La atención se ha centrado en encontrar los datos correctos y aumentar la potencia informática. A medida que proliferan los modelos y aplicaciones de IA, descubrir cómo almacenar las cantidades masivas de exabytes que generarán se convierte en un desafío urgente. Admitir cargas de trabajo de IA requiere una combinación de importantes tecnologías de memoria y almacenamiento en todo el flujo de trabajo de datos de la IA. Pero, en última instancia, la IA a escala requiere unidades de disco duro.
Alimentar a la IA con los datos que necesita para aprender, crear y mejorar requiere una amplia gama de tecnologías de almacenamiento. Desde la memoria de alto rendimiento hasta las unidades de disco duro de gran capacidad, determinar la combinación de almacenamiento adecuada para cualquier carga de trabajo de la IA se trata de equilibrar las necesidades de rendimiento, costo y capacidad de expansión.
Los clústeres de computación de la IA entrenan, ejecutan y optimizan modelos de lenguaje. Las GPU, CPU y TPU están estrechamente vinculadas con los dispositivos de memoria de alto rendimiento, lo que ofrece una producción de terabytes e incluso petabytes por segundo para una computación extrema. Los datos de entrada y salida que estas usan y crean fluyen hacia los clústeres de almacenamiento en red donde se conservan a largo plazo, principalmente en unidades de disco duro, para respaldar la repetición de entrenamiento, el control de calidad y el cumplimiento en el futuro.
Actualmente, los innovadores de la IA más avanzados también gestionan los centros de datos de hiperescala y en la nube más grandes del mundo. Estas empresas eligen almacenar el 90 % de sus exabytes¹ en línea en las unidades de disco duro porque comprenden el valor único de la relación precio-rendimiento que ofrecen para el almacenamiento de capacidad masiva. Aunque las unidades SSD también son una tecnología fundamental, las unidades de disco duro seguirán almacenando la mayoría de los datos a medida que se implementen más arquitecturas optimizadas para la IA.
Al admitir todo el flujo de trabajo de datos de IA, las unidades de disco duro desempeñan un papel crucial en la validación de los modelos de IA.
Para aprovechar todo el potencial de la IA se necesitan datos y el almacenamiento que los respalda.
Las personas y las máquinas crearán de formas diversas y más rápidas que nunca a medida que la IA prolifere, lo cual producirá volúmenes masivos de datos.
La IA mejora en un círculo virtuoso de consumo de datos, generación de nuevos contenidos y aprendizaje a partir de su rendimiento.
Seagate está optimizando el almacenamiento para la IA, logrando avances sin precedentes en la capacidad para respaldar la arquitectura y el desarrollo eficientes de centros de datos.
Análisis de Seagate del estudio multicliente de IDC, Índice de infraestructura de nube 2023: Consumo de computación y almacenamiento por parte de 100 proveedores de servicios, noviembre de 2023.
Análisis de Seagate basado en Forward Insights Q323 SSD Insights, agosto 2023; IDC Worldwide Hard Disk Drive Forecast 2022-2027, abril de 2023, Doc. #US50568323; TENDENCIA SDAS Long-Term Forecast, agosto de 2023.
Uso de carbono incorporado total con un ciclo de vida de 5 años.
Sara McAllister et al., "A Call for Research on Storage Emissions” (Un llamado a la investigación sobre las emisiones de almacenamiento), Hotcarbon.org, 2024.