A IA gera um crescimento de dados sem precedentes.

À medida que os modelos avançarem e a IA se tornar abrangente, a criação de dados crescerá exponencialmente.

A criação e a inovação vão explodir com a IA.

A IA generativa está promovendo uma nova era em que a mídia avançada se prolifera em quase todas as facetas da vida cotidiana, de jogos personalizados a processamento de imagens médicas, produtividade e comunicações corporativas e muito mais.

Os aplicativos de IA que capacitam os usuários a criar, analisar e desenvolver estão ficando mais acessíveis, gerando um crescimento de dados impulsionado pela IA. E isso é só o começo. Pessoas e máquinas irão gerar dados em um ritmo sem precedentes, à medida que casos de uso inovadores crescem.

A IA é um multiplicador de força de crescimento de dados.

A IA sempre foi uma consumidora de dados. Agora, é uma poderosa criadora de dados.

Em apenas um ano e meio, a IA criou 15 bilhões de imagens..¹ Até 2028, a criação de imagem e vídeo com modelos de IA crescerá 167 vezes.² Por fim, a era da IA está gerando um grande ponto de inflexão de crescimento de dados impulsionado por três fatores principais: conteúdo mais avançado, mais replicação e retenção mais longa.

Conteúdo mais avançado.

O potencial transformador da IA está em modelos multimodais que consomem e produzem mídia avançada.

Mais replicação.

Os dados de IA são copiados inúmeras vezes à medida que os modelos são treinados e produzem saídas.

Retenção mais longa.

Preservar dados incentiva o desenvolvimento da IA e fornece transparência.

Conteúdo mais avançado.

O potencial transformador da IA está em modelos multimodais que consomem e produzem mídia avançada.

The smart chatbots and search summaries we use today are mere baby steps in AI's growth. The real transformative potential lies in multimodal AI models that consume and produce rich media.

Entradas mais elaboradas, como imagens, áudio, vídeo e animação 3D, criam saídas mais interativas que podem proporcionar experiências mais fortes e intuitivas. À medida que os aplicativos de IA multimodais expandirem em escopo e recursos, as pessoas e empresas poderão criar em um ritmo sem precedentes.

A futura IA de mídia avançada afetará diferentes ramos de atividade em inúmeros aspectos.
  • Gráficos em movimento 3D de alta resolução para jogos
  • Vídeo em Ultra HD para sets virtuais de filmagem completos com figurantes animados
  • Geradores de CAD 3D e simuladores de física para arquitetura, engenharia, construção e fabricação
  • Assistentes médicos com IA em radiologia, oncologia e cirurgia
  • Síntese molecular para descoberta e teste de medicamentos
  • Publicidade, jogos e experiências online hiperpersonalizados
Toda essa mídia avançada será usada para aprimorar os modelos de IA de próxima geração.

Nesse novo mundo em que podemos criar horas de conteúdo, milhares de imagens e terabytes de dados, três coisas vão acontecer. Mais pessoas usarão a IA para criar conteúdo com volume cada vez mais intenso de dados; a IA absorverá todos esses dados para treinar a próxima geração de modelos; e a quantidade de dados que o mundo cria e armazena vai explodir.

Mais replicação.

Os dados de IA são copiados inúmeras vezes à medida que os modelos são treinados e produzem saídas.

Enabling successful AI models and applications requires more data replication. Whether to ensure model quality through checkpointing, distribute applications geographically, iterate outputs, or modify them into multiple formats, copying data is integral to AI as models are dispersed across cloud and enterprise environments.

A geração e duplicação de conteúdo novo é apenas uma parte da replicação que ocorre durante o ciclo de vida dos dados de IA. Os volumes de dados se acumulam durante o processo de desenvolvimento e produção de IA e se expandem exponencialmente quando os modelos são implantados e começam a gerar conteúdo. Ao longo do ciclo, o ecossistema inteiro de dados é duplicado repetidamente para conformidade com normas.

A replicação multiplica os dados a cada etapa.
  • À medida que os dados são descobertos, agrupados e rotulados para treinamento, eles também são duplicados.
  • Pontos de verificação regulares durante o treinamento registram o progresso em backups, criando centenas de arquivos pesados em uma rodada de treinamento típica.
  • Quando modelos e aplicativos são implantados, seus dados são copiados em inúmeros nós e instâncias.
  • Cada vez mais pessoas usarão a IA para criar e iterar vários conceitos, experimentos e versões.
Retenção mais longa.

Preservar dados incentiva o desenvolvimento da IA e fornece transparência.

The data an AI model consumes and creates is a treasure trove of model behavior, usage patterns, and raw material. The more data we preserve, the better we can train and optimize models to produce better quality output.

O treinamento de um modelo começa com um grande conjunto de dados rotulados. Salvar dados durante uma rodada de treinamento, incluindo dados de ponto de verificação, pode fornecer insights sobre o comportamento futuro do modelo. Depois que o modelo é implantado e gera resultados, cada solicitação e resposta é uma fonte valiosa para avaliar o desempenho do modelo, ajustar o modelo e preparar a próxima rodada de treinamento.

Os dados devem ser preservados em todo ponto razoável dentro do ciclo de dados. 
  • Aprimorar e desenvolver a IA requer novos dados e insights, e os dados preservados podem fornecê-los.
  • Uma IA mais inteligente no futuro poderá extrair insights de dados armazenados, criando novo valor. 
  • As leis de direitos autorais exigem que os materiais sejam licenciadas para uso; a preservação dos dados fornece um histórico auditável.
  • Os regulamentos exigem armazenamento seguro para demonstrar conformidade com diretrizes de privacidade, legais e éticas.
Uma IA confiável depende da transparência dos dados.

Manter os dados por um longo prazo é crucial para consolidar a confiabilidade de um modelo de IA. Documentar cada decisão que o modelo toma e analisar os resultados ajuda os desenvolvedores a detectar deslizes e alucinações desse modelo.

Rastrear os erros até os dados de treinamento pode ajudar a entender os processos de tomada de decisão de um determinado modelo e fornecer dados para retreinamento e otimização. Todos esses pontos de dados devem ser preservados e compartilhados para fornecer evidências objetivas e transparentes do desempenho do modelo.