Penyimpanan Data untuk AI
Menyimpan dan mengaktifkan data berkapasitas besar sangat penting untuk gelombang inovasi AI berikutnya.
Pengembang aplikasi berlomba untuk melatih dan menggunakan model AI. Fokusnya adalah menemukan data yang tepat dan meningkatkan daya komputasi. Seiring berkembangnya model dan aplikasi AI, mencari cara untuk menyimpan exabyte dalam jumlah besar yang akan mereka hasilkan menjadi tantangan yang mendesak. Mendukung beban kerja AI memerlukan perpaduan antara memori dan teknologi penyimpanan penting di seluruh alur kerja data AI. Namun pada akhirnya, AI dalam skala besar memerlukan hard disk.
Memasukkan data yang dibutuhkan AI untuk dipelajari, dibuat, dan ditingkatkan memerlukan berbagai teknologi penyimpanan. Mulai dari memori throughput tinggi hingga hard disk berkapasitas tinggi, menentukan gabungan penyimpanan yang tepat untuk setiap beban kerja AI artinya menyeimbangkan kebutuhan akan performa dan skalabilitas.
Kluster komputasi AI melatih, menjalankan, dan mengoptimalkan model bahasa. GPU, CPU, dan TPU dipadukan secara ketat dengan perangkat memori beperforma tinggi, menawarkan throughput terabyte dan bahkan petabyte per detik untuk komputasi ekstrem. Data input dan output yang mereka gunakan serta buat mengalir ke dalam kluster penyimpanan jaringan yang disimpan dalam jangka panjang, sebagian besar di hard disk, untuk mendukung pelatihan ulang, kontrol kualitas, dan kepatuhan pada masa mendatang.
Saat ini, para inovator AI tercanggih juga mengoperasikan pusat data hyperscale dan cloud terbesar di dunia. Perusahaan ini memilih untuk menyimpan 90% exabyte¹ online mereka pada hard disk karena mereka memahami nilai harga terhadap performa unik yang ditawarkan hard disk untuk penyimpanan berkapasitas besar. Meskipun SSD juga merupakan teknologi penting, hard disk akan terus menyimpan sebagian besar data karena lebih banyak arsitektur yang dioptimalkan untuk AI digunakan.
Dengan mendukung seluruh alur kerja data AI, hard disk memainkan peran penting dalam memvalidasi model AI.
Menyadari potensi penuh AI memerlukan data, dan penyimpanan yang mendukungnya.
Orang dan mesin akan membuat lebih banyak cara secara lebih cepat dari sebelumnya seiring perkembangan AI, menghasilkan volume data yang sangat besar.
AI meningkat dalam lingkaran umpan balik yang baik dari penggunaan data, menghasilkan konten baru, dan belajar dari performanya.
Seagate mengoptimalkan penyimpanan untuk AI, membuat lompatan kemajuan yang belum pernah terjadi sebelumnya dalam hal kapasitas untuk mendukung arsitektur dan pengembangan pusat data yang efisien.
Analisis Seagate terhadap IDC Multi-Client Study, Cloud Infrastructure Index 2023: Compute and Storage Consumption by 100 Service Providers, November 2023.
Analisis Seagate berdasarkan Forward Insights Q323 SSD Insights, Agu. 2023; IDC Worldwide Hard Disk Drive Forecast 2022-2027, Apr. 2023, Doc. #US50568323; TRENDFOCUS SDAS Long-Term Forecast, Aug. 2023.
Menggunakan total kandungan karbon dengan siklus hidup 5 tahun.
Sara McAllister dkk., “Panggilan untuk Penelitian tentang Emisi Penyimpanan,” Hotcarbon.org, 2024.