De groei en verspreiding van gegevens
Bedrijven staan voor grote uitdagingen door de gestage proliferatie van gegevens. Door de verspreiding van gegevens in de periferie te beheren, krijgen bedrijven de kans om meer waarde te halen uit hun steeds groter wordende gegevenssets.
Er worden steeds meer gegevens gecreëerd. Daarom moeten bedrijven nieuwe manieren vinden om die ongeziene toename aan informatie te beheren en tegelijk hun bedrijfsresultaten te verbeteren. Die constante stroom van gegevens is afkomstig uit bronnen zoals fabriekssensoren, smartphones van consumenten en Internet of Things (IoT)-apparaten in de periferie. De manier waarop bedrijven omgaan met de toenemende groei en verspreiding van gegevens zal een enorme invloed hebben op hun succes in de toekomst.
Zoals het Rethink Data-rapport van Seagate aangeeft, breiden het gegevensvolume, het aantal gegevensbronnen en het gegevensverkeer zich sneller uit dan veel bedrijven aankunnen. Het beheer van de toenemende gegevensstroom vereist echter inzicht in de manier waarop netwerken zich ontwikkelen. Bedrijven moeten begrijpen hoe gegevens in de periferie passen in het hedendaagse ecosysteem voor gegevensverwerking.
Gegevensgroei is het percentage waarmee de algehele datasfeer in de loop van de tijd toeneemt. Dit omvat elke bron van gegevens. Bij verspreiding van gegevens draait het daarentegen om het aantal datacenters en verwerkingslocaties, maar ook om de geografische spreiding van de gegevens. Verspreiding doet zich op verschillende plaatsen voor: van eindpuntapparaten tot de periferie en van openbare tot private clouds.
In de komende jaren zullen drie factoren grotendeels verantwoordelijk zijn voor de groei en verspreiding van gegevens. Ten eerste is er het toenemende gebruik van analyses. Business Analytics en applicaties op basis van kunstmatige intelligentie (AI) zijn slechts twee voorbeelden van bedrijfsanalysetools die meer gegevens nodig hebben op verschillende locaties. Ten tweede stijgt door de proliferatie van IoT-apparaten het aantal gegevensbronnen en neemt het gegevensverkeer naar de kerninfrastructuur, zoals on-premises servers en cloudservers, toe. Tot slot wordt informatie die zich normaal op lokale apparaten of schijven bevindt door initiatieven voor cloudmigratie overgeheveld naar gecentraliseerde datacenterservers in de openbare en private cloud voor toegankelijkheids- en analysedoeleinden.
De toenemende eisen die aan de IT-infrastructuur van bedrijven worden gesteld, weerspiegelen hoe deze grotere vraag naar analyses, IoT en actieve gegevens vanzelf tot meer verspreiding leidt. Het Rethink Data-rapport van Seagate laat zien hoe zowel de verspreiding als versnippering van gegevens toenemen.
Tegenwoordig vindt ongeveer 30% van de gegevensopslag plaats in interne datacenters, 20% in datacenters van derden en 19% in de periferie. Gegevensopslag vindt ook plaats in cloudopslagruimten of op andere locaties, wat nog eens 30% vertegenwoordigt. Deze verspreiding zal de komende twee jaar waarschijnlijk niet veranderen, wat betekent dat de opslagomgevingen van bedrijven in de nabije toekomst verspreid zullen blijven.
Zodra bedrijven duidelijk inzicht krijgen in hoe de hoeveelheid informatie en het aantal locaties ervan zich vermenigvuldigen, kunnen ze beheerstrategieën beginnen te ontwikkelen waarin alle gegevensbronnen, waaronder de periferie, zijn opgenomen.
De periferie is geen ding, maar een locatie. De periferie is de buitengrens van het netwerk, waar besluitvorming in real-time plaatsvindt. De periferie bevindt zich zo dicht mogelijk bij de eigenlijke gegevensbron, die vaak honderden of duizenden kilometers verwijderd is van het dichtstbijzijnde bedrijfs- of clouddatacenter.
Het Rethink Data-rapport geeft aan dat nu er steeds meer perifere gegevensbronnen bijkomen, er overal apparaten en sensoren te vinden zijn, van productielijnen tot kantoorgebouwen. Edge computing werd in eerste instantie beschouwd als “een gedecentraliseerde slingerbeweging”, zoals Bob Gill, Research Vice President bij Gartner, in 2018 in een paper vermeldde. Volgens Gill heeft decentralisatie via de periferie twee kritieke clouduitdagingen opgelost: de kosten en de latentie. Perifere verwerking kan sneller verlopen wanneer gegevens niet van en naar een cloudserver hoeven te worden verplaatst, en in veel gevallen kan het ook goedkoper gebeuren. Dit betekent dat bedrijven een deel van de analytische waarde van perifere gegevens in de periferie kunnen ontsluiten, voor real-time besluitvorming, voordat ze deze doorsturen naar datacenters in de kern of de cloud om nog meer waarde te ontsluiten.
De miljarden IoT-apparaten die overal zijn ingezet, verbeteren de mogelijkheden voor het verzamelen van gegevens exponentieel. Tegelijk heeft de vooruitgang op het gebied van software en hardware AI praktischer, rendabeler en toegankelijker gemaakt voor het gemiddelde bedrijf. Innovaties in faciliteiten voor perifere datacenters stellen bedrijven ook in staat om enorme hoeveelheden waarde te ontsluiten in de periferie.
Als bedrijven echter willen profiteren van de voordelen van de volledige waarde van gegevens, moeten ze niet alleen perifere gegevens kunnen verzamelen, opslaan en verwerken, maar ook meer gegevens van de periferie kunnen overbrengen naar datacenters in de kern.
Naarmate de groei en verspreiding van gegevens buiten het traditionele datacenter toenemen, zal de cloud met de periferie gaan samensmelten. Het Rethink Data-rapport gaf het al aan: hoewel er wordt verwacht dat perifere gegevens slechts tijdelijk worden opgeslagen tot ze zijn geanalyseerd of verwerkt voordat relevante gegevens naar de kern worden verplaatst, betekent dit echter niet dat er in de toekomst een keuze moet worden gemaakt tussen de cloud of de periferie. De cloud en de periferie zullen eerder als één geheel samenwerken.
De opslag van gegevens in de periferie groeit sneller dan de opslag van gegevens in de kern. Tegelijk zal de hoeveelheid gegevens die organisaties van de periferie naar de kern overbrengt de komende twee jaar echter toenemen van 8% tot 16%.
Om die toegenomen verwerking van perifere gegevens – zowel in de periferie als later in datacenters in de kern – te kunnen beheren, moeten plannen voor informatiebeheer een snellere gegevensoverdracht mogelijk maken, van a tot z. Gegevensmobiliteit moet worden gefaciliteerd in eindpunten, de periferie, en private, openbare of sectorclouds.
Om te voorkomen dat gegevenssilo's ontstaan en gegevens ontoegankelijk worden voor de grotere bedrijfsgegevensinfrastructuur, moeten bedrijven de gegevensopslag in de periferie beheren en organiseren. De periferie kan bijzonder gevoelig zijn voor silo’s als het verkeer van eindpuntapparaten niet goed gecoördineerd is.
Maar de voordelen van gegevens en verwerking in de periferie zijn groot. Er kan met name meer informatie worden verzameld en samengesteld voor diepgaande analyse door AI- en bedrijfsanalysesoftware dan met een model dat uitsluitend gericht is op de infrastructuur van een on-premises datacenter of datacenter in de cloud.
Om de groei en verspreiding van de periferie beter te kunnen beheren, zullen bedrijven een perifere architectuur moeten gebruiken die opslag en analyse van latentiegevoelige informatie in real time kan uitvoeren, maar ook gedistribueerde verwerking mogelijk maakt om streaminggegevens uit de periferie te analyseren.
Zoals het Rethink Data-rapport benadrukt, wordt innovatie niet bepaald door trends. Het creëren van waarde binnen beperkingen is de drijfveer voor nieuwe oplossingen. En dat is precies wat groei en verspreiding in de periferie doen voor bedrijven en hun IT-partners. Bedrijven kunnen een ongekende gegevensgroei verwachten als gevolg van de enorme toename van het aantal IoT-apparaten en het toegenomen gebruik van bedrijfsanalyses en AI-tools. Om groei en verspreiding te beginnen te beheren en er profijt uit te halen, hebben bedrijven een solide plan voor gegevensbeheer en een rendabele technologiestack nodig. Samen moet dit ervoor zorgen dat gegevens eenvoudig en tijdig tussen de periferie en de kern worden verplaatst, afhankelijk van de waarde die aan de gegevens moet worden onttrokken.
Ontdek meer over de manier waarop bedrijven meer van hun beschikbare bedrijfsgegevens aan het werk kunnen zetten in het volledige Rethink Data-rapport van Seagate.