La IA impulsa un crecimiento de datos sin precedentes.

A medida que los modelos avancen y la IA se vuelve omnipresente, la creación de datos crecerá exponencialmente.

La creación y la innovación explotarán con la IA.

La IA generativa está marcando el comienzo de una nueva era en la que los contenidos multimedia de gran riqueza proliferan en casi todas las facetas de la vida cotidiana, desde los juegos personalizados hasta el procesamiento de imágenes médicas, la productividad y las comunicaciones empresariales, y más.

Las aplicaciones de IA que permiten a los usuarios crear, analizar y desarrollar son cada vez más accesibles, lo que desata el crecimiento de los datos impulsado por la IA. Y esto es solo el comienzo. Las personas y las máquinas generarán datos a un ritmo sin precedentes a medida que escalen los casos de uso innovadores.

La IA es un multiplicador de la fuerza del crecimiento de los datos.

La IA siempre ha sido consumidora de datos. Ahora es una poderosa creadora de datos.

En solo un año y medio, la IA creó 15 mil millones de imágenes.¹ Para 2028, la creación de imágenes y videos con modelos de IA crecerá 167 veces.² En última instancia, la era de la IA está provocando un importante punto de inflexión en el crecimiento de los datos impulsado por tres factores clave: contenido más interactivo, más replicación y una retención más larga.

Contenido más interactivo.

El potencial transformador de la IA reside en modelos multimodales que consumen y producen contenidos multimedia enriquecidos.

Más replicación.

Los datos de IA se copian innumerables veces a medida que los modelos se entrenan y producen resultados.

Mayor retención.

La conservación de los datos fomenta el desarrollo de la IA y proporciona transparencia.

Contenido más interactivo.

El potencial transformador de la IA reside en modelos multimodales que consumen y producen contenidos multimedia enriquecidos.

The smart chatbots and search summaries we use today are mere baby steps in AI's growth. The real transformative potential lies in multimodal AI models that consume and produce rich media.

Los datos más enriquecidos, como imágenes, audio, video y animación 3D, generan resultados más interactivos que pueden admitir experiencias más potentes e intuitivas. A medida que las aplicaciones de IA multimodal amplíen su alcance y capacidades, las personas y las empresas podrán crear a un ritmo sin precedentes.

La futura IA de contenido multimedia interactiva repercutirá en todos los sectores.
  • Gráficos en movimiento 3D de alta resolución para juegos
  • Video ultra HD para sets virtuales en el cine, con extras animados
  • Generadores CAD en 3D y simuladores de física para arquitectura, ingeniería, construcción y fabricación
  • Asistentes médicos de IA en radiología, oncología y cirugía
  • Síntesis molecular para el descubrimiento y prueba de medicamentos
  • Publicidad hiperpersonalizada, juegos y experiencias en línea
Todo este contenido multimedia interactivo se utilizará para mejorar los modelos de IA de próxima generación.

En este nuevo mundo en el que podemos crear horas de contenido, miles de imágenes y terabytes de datos, sucederán tres cosas. Más personas usarán la IA para crear contenido cada vez más intensivo en datos. La IA absorberá todos esos datos para entrenar a la próxima generación de modelos; y la cantidad de datos que el mundo crea y almacena se disparará.

Más replicación.

Los datos de IA se copian innumerables veces a medida que los modelos se entrenan y producen resultados.

Enabling successful AI models and applications requires more data replication. Whether to ensure model quality through checkpointing, distribute applications geographically, iterate outputs, or modify them into multiple formats, copying data is integral to AI as models are dispersed across cloud and enterprise environments.

Generar y duplicar contenido nuevo es solo una parte de la replicación que se produce a lo largo del ciclo de vida de los datos de IA. Las huellas de datos se multiplican durante el proceso de desarrollo y producción de IA y se expanden exponencialmente una vez que la IA se implementa y comienza a generar contenido. A lo largo del ciclo, todo el ecosistema de datos se duplica repetidamente para cumplir con la normativa.

La replicación multiplica los datos en cada paso.
  • A medida que los datos se descubren, se recopilan y se etiquetan para el entrenamiento, también se duplican.
  • Los puntos de control regulares durante la el entrenamiento respaldan el progreso; esto genera cientos de archivos pesados en una ejecución de entrenamiento típica.
  • Cuando se implementan modelos y aplicaciones, sus datos se copian en numerosos nodos e instancias.
  • Cada vez más personas usarán la IA para crear e iterar múltiples conceptos, experimentos y versiones.
Mayor retención.

La conservación de los datos fomenta el desarrollo de la IA y proporciona transparencia.

The data an AI model consumes and creates is a treasure trove of model behavior, usage patterns, and raw material. The more data we preserve, the better we can train and optimize models to produce better quality output.

El entrenamiento de un modelo comienza con un gran grupo de datos etiquetados. Guardar los datos a lo largo de la ejecución del entrenamiento, incluidos los datos de los puntos de control, puede proporcionar información sobre el comportamiento futuro del modelo. Una vez que el modelo se implementa y genera resultados, cada solicitud y respuesta es una fuente valiosa para evaluar el rendimiento del modelo, ajustarlo y preparar la siguiente ejecución de entrenamiento.

Los datos deben conservarse en cada punto razonable del ciclo de datos. 
  • La mejora y el desarrollo de la IA requieren datos e información actualizados, pero los datos conservados pueden proporcionarlos.
  • En el futuro, una IA más inteligente podrá extraer información de los datos almacenados y crear así nuevo valor. 
  • Las leyes de derechos de autor exigen que las obras cuenten con una licencia de uso; la conservación de los datos proporciona un rastro auditable.
  • Las normativas exigen un almacenamiento seguro para demostrar el cumplimiento de las directrices éticas, legales y de privacidad.
La IA fiable depende de la transparencia de los datos.

Mantener los datos a largo plazo es fundamental para establecer la fiabilidad de un modelo de IA. Documentar cada decisión que toma el modelo y analizar los resultados ayuda a los desarrolladores a detectar desviaciones y alucinaciones del modelo.

Hacer un seguimiento de los errores hasta regresar a los datos de entrenamiento puede ayudar a descomprimir los procesos de toma de decisiones de un modelo determinado y proporcionar datos para el reciclaje y la optimización. Todos estos puntos de datos deben conservarse y compartirse para proporcionar pruebas objetivas y transparentes del rendimiento del modelo.