Geavanceerde opslagarchitectuur als krachtvoer voor AI in datacenters.
De gezamenlijke oplossing van Supermicro, Seagate en OSNexus is ontworpen voor de toekomst van AI en gemaakt om zowel de efficiëntie als schaalbaarheid van AI te bevorderen.
minuut/minuten leestijd
Inhoudsopgave:
Door de opkomst van artificiële intelligentie (AI) is een ongeziene vraag ontstaan naar schaalbare, krachtige en voordelige opslagoplossingen voor datacenters. In dit whitepaper wordt een uitgebreide oplossing voorgesteld die hardware van Supermicro, Exos harde schijven met HAMR-gebaseerde Mozaic 3+™ technologie van Seagate en QuantaStor-software van OSNexus combineert. Deze gezamenlijke oplossing speelt in op de explosieve toename van de opslagbehoeften voor AI-aangestuurde gegevens en biedt een robuuste architectuur die zowel op- als uitschaalbare configuraties ondersteunt. Belangrijkste voordelen zijn onder meer verbeterde schaalbaarheid om de toenemende AI-werkbelasting aan te kunnen, uitzonderlijke prestaties met hoge doorvoer en lage latentie, geoptimaliseerde rentabiliteit door het gebruik van minder fysieke schijven en energiebesparingen, een uniform beheerplatform dat de werkzaamheden vereenvoudigt, geavanceerde beveiligingsfuncties voor regelnaleving en minder impact op het milieu dankzij energiezuinige opslagoplossingen.
De snelle evolutie van AI- en machine learning (ML)-technologieën heeft het landschap van gegevensopslag fundamenteel veranderd. Vooruitgang in rekenkracht, gedemocratiseerde toegang voor ontwikkelaars en snellere ontwikkeltools hebben geleid tot een explosieve toename van door AI aangestuurde innovatie. Naarmate AI-modellen geavanceerder worden, is de behoefte aan schaalbare, krachtige opslagoplossingen nog nooit zo groot geweest. Gegevens vormen de ruggengraat van AI, en het vermogen om enorme hoeveelheden gegevens efficiënt op te slaan, te beheren en er toegang toe te krijgen is cruciaal voor het trainen van AI-modellen en het implementeren van AI-toepassingen. Traditionele opslagoplossingen voldoen vaak niet aan deze eisen, waardoor nieuwe architecturen moeten worden ontwikkeld die zijn afgestemd op de behoeften van AI-werkbelastingen.
AI-werkbelastingen brengen unieke uitdagingen met zich mee waar traditionele opslagoplossingen moeite mee hebben. Voor de training van AI-modellen zijn enorme hoeveelheden gegevens nodig, vaak zelfs op petabyteschaal. Deze gegevens moeten eenvoudig toegankelijk zijn, aangezien de efficiëntie van het trainingsproces sterk afhangt van het snel ophalen van gegevens. Bovendien omvatten AI-toepassingen vaak grootschalige gegevensverwerkingstaken die een hoge doorvoer en lage latentie vereisen om in real time inzichten te leveren.
De rekenintensiteit van AI-werkbelastingen genereert ook aanzienlijke hoeveelheden metadata, die efficiënt moeten worden beheerd om knelpunten te voorkomen. Traditionele opslagoplossingen, met hun beperkte schaalbaarheid en prestaties, zijn niet geschikt voor deze vereisten. Ze missen vaak de flexibiliteit om dynamische werkbelastingen aan te kunnen, wat leidt tot inefficiëntie en hogere operationele kosten.
Innovatie op basis van AI vereist opslagoplossingen die snel geschaald kunnen uitbreiden, grote hoeveelheden ongestructureerde gegevens kunnen verwerken en vlotte toegang tot deze gegevens kunnen bieden. Het trainen van een complex AI-model omvat bijvoorbeeld het iteratief verwerken van enorme gegevenssets om algoritmen te verfijnen en de nauwkeurigheid ervan te verbeteren. De enorme hoeveelheid gegevens die voor deze iteraties nodig is, kan traditionele opslagsystemen overweldigen, waardoor vertragingen ontstaan en de algehele efficiëntie van AI-activiteiten afneemt.
Bovendien worden AI-toepassingen steeds vaker ingezet in realtime omgevingen waar onmiddellijke gegevensverwerking van cruciaal belang is. Hieronder vallen toepassingen zoals autonome voertuigen, voorspellend onderhoud en gepersonaliseerde gezondheidszorg. Deze gebruikssituaties vereisen opslagoplossingen die niet alleen een hoge opslagcapaciteit bieden, maar ook uitzonderlijke prestaties leveren om onmiddellijke gegevensanalyse en besluitvorming te ondersteunen.
De gezamenlijke oplossing van Supermicro, Seagate en OSNexus combineert geavanceerde hardware en software om een robuuste, schaalbare en voordelige opslaginfrastructuur voor AI-werkbelasting te creëren. De kerncomponenten van deze oplossing zijn servers en JBOD's van Supermicro, Mozaic 3+ harde schijven en Nytro NVMe SSD's van Seagate, en QuantaStor-software van OSNexus.
De architectuur van de gezamenlijke oplossing ondersteunt zowel op- als uitschaalbare configuraties, zodat aan verschillende implementatiebehoeften kan worden voldaan.
Bij opschalen (of verticaal schalen) wordt de opslagcapaciteit van één opslagsysteem of server vergroot door meer bronnen toe te voegen, zoals CPU's, geheugen en/of opslagschijven. Deze aanpak maximaliseert de prestaties van individuele eenheden, maar heeft inherente beperkingen wat betreft schaalbaarheid.
Uitschalen (of horizontaal schalen) daarentegen houdt in dat er meer opslagnodes of servers aan een systeem worden toegevoegd, waardoor de werkbelasting over meerdere eenheden wordt verdeeld. Deze aanpak maakt een vrijwel onbeperkte schaalbaarheid mogelijk, waardoor systemen grotere, complexere AI-werkbelastingen aankunnen door de architectuur naadloos uit te breiden naarmate de vraag toeneemt.
Opschaalbare configuraties zijn ideaal voor kleinere, kostengevoelige toepassingen en bieden een doorvoersnelheid tot 5-10GB/s. Uitschaalbare configuraties zijn eerder ontworpen voor grotere implementaties, waarbij de prestaties lineair geschaald uitbreiden naarmate er meer nodes worden toegevoegd. Dankzij deze schaalbaarheid kan de oplossing een doorvoersnelheid van honderden gigabytes per seconde bereiken, waardoor aan de vereisten van intensieve AI-werkbelastingen wordt voldaan.
De naadloze integratie van Supermicro-servers, Seagate-schijven en QuantaStor-software vormt een samenhangende en efficiënte opslagoplossing. Deze architectuur ondersteunt zowel bestands- als objectopslag, waardoor organisaties de flexibiliteit hebben om de meest geschikte configuratie voor hun specifieke behoeften te kiezen. Het uniforme beheer van QuantaStor zorgt ervoor dat alle componenten harmonieus samenwerken en optimale prestaties en betrouwbaarheid leveren. De mogelijkheid om zowel op- als uitschaalbare configuraties binnen één platform te beheren, vereenvoudigt de werkzaamheden en vermindert de complexiteit die gepaard gaat met het onderhoud van meerdere opslagsystemen.
De architectuur bestaat uit Supermicro-servers, Seagate Exos Mozaic 3+ harde schijven en Seagate Nytro NVMe SSD's, die allemaal worden georkestreerd door QuantaStor-software van OSNexus. Deze combinatie voldoet aan de hoge vereisten van AI/ML-werkbelastingen, die niet alleen een hoge doorvoer en lage latentie vereisen, maar ook het vermogen om enorme gegevenssets efficiënt te verwerken.
Overwegingen voor de implementatie-infrastructuur.
Afhankelijk van de specifieke prestatievereisten en behoeften aan gegevenscapaciteit van AI/ML-werkbelastingen, kunnen verschillende configuraties nodig zijn om optimale resultaten te behalen. Factoren zoals de hoeveelheid gegevens die wordt verwerkt en de snelheid waarmee gegevens moeten worden geopend, bepalen of een hybride of all-flash configuratie het meest geschikt is voor het scenario. Daarnaast zullen budgettaire overwegingen en schaalbaarheidsvereisten de ontwerpkeuzes voor de architectuur beïnvloeden.
Effectief beheer en optimalisering zijn essentieel om ervoor te zorgen dat AI/ML-werkbelastingen maximaal presteren binnen de opslagarchitectuur. De geavanceerde beheerfuncties van QuantaStor stroomlijnen de activiteiten en bieden uitgebreide controle en overzicht over verschillende configuraties.
Verschillende AI/ML-werkbelastingen vereisen op maat gemaakte opslagoplossingen om optimale prestaties en kostenefficiëntie te bereiken. Afhankelijk van de schaal en complexiteit van de werkbelasting kunnen opschaalbare, uitschaalbare of gemengde configuraties worden ingezet om aan de specifieke vereisten van verschillende sectoren en toepassingen te voldoen.
De technologische vooruitgang in deze oplossing is essentieel voor de doeltreffendheid ervan. De Seagate Exos Mozaic 3+ harde schijven betekenen een grote sprong voorwaarts in opslagtechnologie. Dankzij de HAMR-technologie beschikken deze schijven over een ongeziene oppervlaktedichtheid, waardoor er meer kan worden opgeslagen op hetzelfde fysieke formaat. Deze vooruitgang komt niet tegemoet aan de behoefte aan grootschalige gegevensopslag, maar verbetert ook de energie-efficiëntie omdat er minder schijven nodig zijn om dezelfde hoeveelheid gegevens op te slaan.
De TCO-voordelen van Mozaic 3+ harde schijven zijn aanzienlijk, waaronder 3× de opslagcapaciteit in dezelfde datacenterruimte voor 25% minder kosten per TB, met 60% lager energieverbruik per TB en 70% minder opgenomen koolstof per TB (in vergelijking met PMR-schijven van 10 TB, een veelgebruikte schijfcapaciteit die nu in datacenters toe is aan een upgrade). Het lagere energieverbruik van de schijven vertaalt zich in lagere energiekosten, terwijl er door de hogere dichtheid minder behoefte is aan fysieke ruimte. Dit leidt tot besparingen in de infrastructuur van datacenters. Door de lagere opgenomen koolstof van de harde schijven zijn ze bovendien een milieuvriendelijkere keuze, die aansluit bij duurzaamheidsdoelstellingen die steeds belangrijker worden voor moderne bedrijven.
De integratie van Seagate Nytro NVMe SSD's voegt nog een laag van verbeterde prestaties toe. Deze snelle solid-state-schijven zijn essentieel voor het beheer van de intensieve lees- en schrijfbewerkingen die kenmerkend zijn voor AI-werkbelastingen. Hun lage latentie zorgt ervoor dat gegevens in real time kunnen worden opgevraagd en verwerkt, wat cruciaal is voor het trainen van AI-modellen en het implementeren van AI-toepassingen. Doordat de SSD's met twee poorten zijn uitgerust, zijn ze betrouwbaarder, omdat dit een permanente werking mogelijk maakt, zelfs als één poort uitvalt.
QuantaStor-software van OSNexus breidt de oplossing verder uit met intelligent gegevensbeheer en geavanceerde beveiligingsfuncties. De mogelijkheden die de software biedt voor automatische opslag in lagen zorgen ervoor dat gegevens op de meest geschikte laag worden opgeslagen, om zo de prestaties en de kosten te optimaliseren. De end-to-end versleuteling en naleving van industriestandaarden helpen gegevens te beschermen door de beveiligings- en privacyproblemen aan te pakken die van het grootste belang zijn bij AI-toepassingen, met name in sectoren zoals de gezondheidszorg en de financiële sector, waar vaak gevoelige gegevens worden verwerkt.
De gezamenlijke oplossing van Supermicro, Seagate en OSNexus biedt verschillende kernvoordelen die inspelen op de specifieke behoeften van AI/ML-werkbelastingen. Daarbij gaat het om voordelen zoals:
De oplossing is veelzijdig genoeg om tal van gebruikssituaties in verschillende sectoren te ondersteunen. Enkele voorbeelden:
De gezamenlijke AI-oplossing ontwikkeld door Supermicro, Seagate en OSNexus biedt een uitgebreide, geschaald uitbreidbare en voordelige opslagarchitectuur die is afgestemd op de unieke vereisten van AI/ML-werkbelastingen. Door de combinatie van geavanceerde hardware- en softwaretechnologieën biedt de oplossing uitzonderlijke prestaties, betrouwbaarheid en efficiëntie, waardoor het een ideale keuze is voor organisaties die AI willen gebruiken om een concurrentievoordeel te behalen. Of deze oplossing nu wordt ingezet in de gezondheidszorg, financiën, media, productie of onderzoek, ze biedt de robuuste infrastructuur die nodig is om de volgende generatie AI-toepassingen te ondersteunen en de weg vrij te maken voor de toekomst van innovatie op basis van AI in alle sectoren.
Topologie | Product | Model voor veerkracht | Onbewerkte capaciteit | Bruikbare capaciteit | Gedetailleerde specificatie |
---|---|---|---|---|---|
Opschalen | Hybride SBB; | Drievoudige pariteit | 2039 TB onbewerkt | 1512 TB bruikbaar | link |
Opschalen | SBB All-flash | Dubbele pariteit (4D+2P) | 737 TB onbewerkt | 553 TB bruikbaar | link |
Uitschalen | Hyper All-flash | EC2k+2m/REP3 | 1106 TB onbewerkt | 533 TB bruikbaar | link |
Uitschalen | 4U/36 | EC4K+2m/REP3 | 3974 TB onbewerkt | 2513 TB bruikbaar | link |
Uitschalen | 4U/36 | EC8K+3m/REP3 | 8342 TB onbewerkt | 5786 TB bruikbaar | link |
Uitschalen | Twee nodes, toploading | EC8K+3m/REP3 | 11.981 TB onbewerkt | 8406 TB bruikbaar | link |
Acroniemen en aanvullende informatie.
SBB: Storage Bridge Bay.
EC: Erasure Coding.
"Dubbele pariteit" en "drievoudige pariteit" verwijzen naar het aantal pariteitsblokken dat wordt gebruikt om gegevensredundantie en fouttolerantie te bieden.
Numerieke reeksen hebben betrekking op het model voor veerkracht.