AI 데이터는 무한 루프로 흐릅니다.

이러한 선순환을 통해 실행 중인 모델을 지속적으로 생성 및 반복할 수 있습니다.

AI 데이터의 무한 루프.

AI는 데이터를 소비하는 동시에 생성합니다. 사실, AI 모델은 모델 자체에서 생성된 데이터와 소스에서 수집된 새로운 데이터 등 신뢰할 수 있는 데이터를 사용하여 향상됩니다. 데이터 생산 및 소비의 이러한 무한 루프는 더 스마트한 애플리케이션과 더 나은 출력으로 이어집니다.

이는 데이터의 가치와 데이터 사용 방식을 근본적으로 바꿉니다. 이 무한 루프에서 더 많은 데이터를 저장하면 AI가 더 향상됩니다.

데이터는 모든 단계에서 AI에 필수적입니다.

새로 수집된 데이터 소스와 함께 AI가 생성하는 모든 답변, 콘텐츠 또는 아티팩트는 다음 학습 라운드를 위한 입력의 일부가 되어 출력을 개선하는 지속적인 루프를 구동합니다. 대규모 데이터 센터 배포에서는 AI 데이터 루프의 6단계가 스토리지와 메모리 장치의 조합으로 활성화됩니다

1. 소스 데이터

데이터를 정의하고 찾으며 준비하는 것부터 시작됩니다.

데이터 세트는 작고 구조화된 데이터베이스부터 인터넷 자체에 이르기까지 무엇이든 될 수 있습니다. 네트워크 하드 드라이브는 원시 데이터를 장기간 보존하고 데이터를 보호합니다. 네트워크 SSD는 즉시 액세스 가능한 데이터 계층 역할을 합니다.

2. 모델 훈련

다음으로, 모델은 저장된 데이터에 대한 학습을 통해 배웁니다.

학습은 모델이 수렴되고 체크포인트로 보호되는 시행착오 과정입니다. 학습에는 고속 데이터 액세스가 필요합니다. 이 컴퓨팅 집약적 단계에서는 학습을 위해 HBM, DRAM, 로컬 SSD를 사용합니다. 네트워크 하드 드라이브와 SSD는 모델 학습을 보호하고 개선하기 위해 체크포인트를 저장합니다.

3. 콘텐츠 생성

추론 프로세스는 학습된 모델을 사용하여 출력을 생성합니다.

응용 분야에 따라 모델은 채팅, 이미지 분석 또는 비디오 제작과 같은 작업에 사용될 수 있습니다. 이러한 반복적인 생성을 가능하게 하는 기본 스토리지 요소는 HBM, DRAM, 로컬 SSD입니다.

4. 콘텐츠 저장

반복 프로세스는 스토리지를 필요로 하는 검증된 새로운 데이터를 생성합니다.

이 데이터는 지속적인 개선, 품질 보증 및 규정 준수를 위해 저장됩니다. 하드 드라이브는 생성된 콘텐츠의 복제된 버전을 저장하고 보호합니다. 네트워크 SSD는 속도에 맞는 데이터 계층을 제공합니다.

5. 데이터 보존

복제된 데이터 세트는 여러 지역과 환경에 걸쳐 보관됩니다.

저장된 데이터는 신뢰할 수 있는 AI의 중추로, 이를 통해 데이터 과학자는 모델이 예상대로 작동하는지 확인할 수 있습니다. 하드 드라이브는 장기 저장 및 데이터 보호가 필요한 데이터의 주요 원동력입니다. 네트워크 SSD는 하드 드라이브를 로컬 SSD 레이어에 연결하고 데이터가 생태계 내에서 이동하는 데 도움이 되는 성능 개스킷으로 사용됩니다.

6. 데이터 재사용

소스, 모델 및 추론 데이터는 다음 단계의 노력을 촉진합니다.

콘텐츠 출력은 모델에 피드백을 제공하여 정확도를 향상하고 새로운 모델을 활성화합니다. 네트워크 하드 드라이브와 SSD는 지리적으로 분산된 AI 데이터 생성을 지원합니다. 원시 데이터 세트와 결과는 새로운 작업 흐름의 소스가 됩니다.

AI 작업 부하에는 다양한 스토리지가 필요합니다.

DRAM, 하드 드라이브, SSD와 같은 메모리 및 스토리지 기술은 AI 데이터 작업 흐름 전반에 걸쳐 중요한 역할을 합니다. 각 단계에서는 각 작업 부하의 성능과 확장성 요구 사항을 지원하기 위해 이러한 장치의 최적화된 조합이 필요합니다.