AI용 데이터 스토리지
차세대 AI 혁신을 위해서는 대량의 데이터를 저장하고 활성화하는 것이 매우 중요합니다.
앱 개발자는 AI 모델을 교육하고 배포하기 위해 경쟁하고 있습니다. 초점은 적절한 데이터를 찾고 컴퓨팅 성능을 높이는 데 맞춰져 있습니다. AI 모델과 응용 분야가 확산됨에 따라 이를 통해 생성될 막대한 양의 엑사바이트를 저장하는 방법을 파악하는 것이 시급한 과제가 되었습니다. AI 작업 부하를 지원하려면 AI 데이터 작업 흐름 전반에 걸쳐 중요한 메모리 및 스토리지 기술이 필요합니다. 그러나 궁극적으로 대규모 AI에는 하드 드라이브가 필요합니다.
AI가 학습하고, 생성하고, 향상하는 데 필요한 데이터를 공급하려면 광범위한 스토리지 기술이 필요합니다. 고처리량 메모리에서 대용량 하드 드라이브에 이르기까지 모든 AI 작업 부하에 적합한 스토리지 조합을 결정하는 것은 성능, 비용 및 확장성 대한 요구 사항의 균형을 맞추는 것입니다.
AI 컴퓨팅 클러스터는 언어 모델을 학습하고 실행하며 최적화합니다. GPU, CPU, NPU 및 TPU는 고성능 메모리 장치와 밀접하게 결합되어 극한의 계산을 위해 초당 테라바이트 및 심지어 페타바이트의 처리량을 제공합니다. 이러한 장치가 사용하고 생성하는 입력 및 출력 데이터는 네트워크로 연결된 스토리지 클러스터로 흘러가 주로 하드 드라이브에 장기 보존되어 향후 재학습, 품질 관리 및 규정 준수를 지원합니다.
오늘날 가장 발전된 AI 혁신가들은 세계 최대의 하이퍼스케일 및 클라우드 데이터 센터도 운영하고 있습니다. 이러한 기업은 온라인 엑사바이트¹의 90%를 하드 드라이브에 저장합니다. 하드 드라이브가 대용량 스토리지에 제공하는 고유한 가격 대비 성능 가치를 이해하고 있기 때문입니다. SSD도 중요한 기술이지만 AI에 최적화된 아키텍처가 더 많이 배포됨에 따라 하드 드라이브가 대부분의 데이터를 계속 저장할 것입니다.
하드 드라이브는 전체 AI 데이터 작업 흐름을 지원하여 AI 모델을 검증하는 데 중요한 역할을 합니다.
AI의 잠재력을 최대한 실현하려면 데이터와 이를 지탱하는 스토리지가 필요합니다.
AI가 확장됨에 따라 사람과 기계는 그 어느 때보다 빠른 속도로 더 많은 방식으로 데이터를 만들어 방대한 양의 데이터를 생성합니다.
AI는 데이터를 소비하고, 새로운 콘텐츠를 생성하고, 성과를 통해 학습하는 선순환 피드백 루프를 통해 향상됩니다.
Seagate는 AI를 위한 스토리지를 최적화하여 효율적인 데이터 센터 아키텍처 및 구축을 지원하기 위해 용량을 전례 없이 획기적으로 늘립니다.
Seagate의 분석, IDC의 Multi-Client Study, Cloud Infrastructure Index 2023: 100개 서비스 공급업체의 컴퓨팅 및 스토리지 소비량, 2023년 11월.
Seagate’s analysis based on Forward Insights Q323 SSD Insights, 2023년 8월; IDC Worldwide Hard Disk Drive Forecast 2022-2027, 2023년 4월, Doc. #US50568323; TRENDFOCUS SDAS 장기 전망, 2023년 8월 기반.
5년 수명 주기로 총 내재 탄소 사용.
Sara McAllister et al., “A Call for Research on Storage Emissions,” Hotcarbon.org, 2024.