El crecimiento y la expansión de los datos
Las empresas están en contra de los grandes desafíos que presenta la continua proliferación de los datos. Gestionar la expansión de los datos en la periferia ofrece a las empresas una oportunidad de extraer más valor de sus conjuntos de datos que van creciendo día a día.
Con un crecimiento sin precedentes en la creación de los datos, las empresas enfrentan el desafío de encontrar nuevas formas de gestionar los crecientes volúmenes de información mientras que los usan para mejorar sus resultados empresariales. Esta constante transmisión de datos proviene de fuentes como los sensores de las fábricas, los teléfonos inteligentes de los consumidores y los dispositivos del Internet de las cosas (IdC) en la periferia. La manera en la que las empresas enfrenten el crecimiento y la expansión de los datos tendrá un impacto decisivo en el éxito que tengan en el futuro.
Tal como se advierte en el informe para Reimaginar los datos de Seagate, el volumen, las fuentes y el tráfico de los datos se están expandiendo mucho más rápido de lo que muchas empresas pueden controlar. Pero para gestionar el creciente flujo de datos se debe entender cómo están evolucionando las redes. Las empresas deben entender cómo encajan los datos de la periferia en el ecosistema de la computación de hoy.
El crecimiento de los datos es el porcentaje que aumenta la esfera de datos global con el tiempo. Esto abarca cada fuente de datos. Por el contrario, la expansión de los datos se trata del número de centros de datos y las ubicaciones de procesamiento, así como hasta dónde se están difundiendo los datos geográficamente. La expansión existe a través de varias configuraciones: desde los dispositivos de punto final a través de la periferia y hasta las nubes públicas y privadas.
Tres factores serán los principales responsables del crecimiento y la expansión de los datos en los próximos años. El primero es el aumento del uso del análisis. La analítica empresarial y las aplicaciones de la inteligencia artificial (IA) son solo dos ejemplos de las herramientas del análisis empresarial que requieren más datos en diferentes ubicaciones. El segundo es que la proliferación de los dispositivos del IdC está aumentando el número de las fuentes de los datos e incrementando el tráfico de datos en el núcleo de la infraestructura, como por ejemplo en los servidores locales y en la nube. Por último, las iniciativas de migración a la nube están tomando información que de otra manera existiría en los dispositivos locales o en las unidades de la nube pública centralizada y en los servidores de los centros de datos de la nube con fines de accesibilidad y análisis.
El aumento de la demanda de la infraestructura de la TI empresarial refleja cómo el crecimiento de la analítica, el IdC y los datos en movimiento provocan de forma natural una mayor expansión. El informe para Reimaginar los datos de Seagate muestra que tanto la expansión como la fragmentación están en aumento.
En la actualidad, aproximadamente el 30 % del almacenamiento de los datos se lleva a cabo en los centros de datos internos, el 20 % en los centros de datos de terceros y el 19 % en la periferia. El almacenamiento de datos también se lleva a cabo en los repositorios de la nube o en otras ubicaciones, lo que representa el otro 30 %. Esta distribución probablemente no va a cambiar en los próximos dos años, esto significa que los entornos del almacenamiento empresarial van a permanecer dispersos en un futuro cercano.
Una vez que las empresas obtienen una visión clara respecto a cuánta información y ubicaciones se están multiplicando, pueden comenzar a desarrollar estrategias de gestión que abarquen todas las fuentes de los datos, incluida la periferia.
La periferia no es un objeto, es una ubicación. La periferia es el límite exterior de la red en donde se lleva a cabo la toma de decisiones en tiempo real. La periferia está ubicada tan cerca de la fuente de datos auténtica como es posible, por lo general se encuentra a cientos o miles de millas de distancia del centro de datos empresarial o en la nube más cercano.
En el informe para Reimaginar los datos se indica que debido a que las fuentes de datos en la periferia se multiplicaron, los dispositivos y los sensores están por todas partes: desde la fabricación de líneas de producción hasta los edificios de oficinas. En un principio, la computación en la periferia había sido vista como "una oscilación descentralizada del péndulo", señaló Bob Gill, vicepresidente de investigación en Gartner, en un artículo en el 2018. De acuerdo a Gil, la descentralización a través de la periferia resolvió dos importantes desafíos de la nube: el costo y la latencia. Procesar la periferia puede ser más rápido cuando los datos no tienen que viajar hacia y desde un servidor en la nube, y en muchos casos, esto puede ser más económico. Esto significa que las empresas pueden desbloquear algunos valores del análisis de los datos de la periferia en la periferia, para tomar decisiones en tiempo real, antes de enviarlos a los centros de datos en el núcleo o en la nube para desbloquear mayor valor.
Millones de dispositivos del IdC en el campo están mejorando exponencialmente sus capacidades para recopilar datos. Por su parte, los avances de software y hardware han hecho que la IA sea más práctica, rentable y accesible para la empresa promedio. Las innovaciones en las instalaciones de los centros de datos en la periferia también les permiten a las empresas desbloquear cantidades masivas del valor en la periferia.
Para que las empresas se beneficien de todo el valor de los datos, no solo deben ser capaces de recopilar, almacenar y procesar datos en la periferia, sino que también deben transferir datos desde la periferia a los centros de datos centrales.
A medida que aumente el crecimiento y la expansión de los datos fuera del centro de datos tradicional, la nube comenzará a fusionarse con la periferia. Tal como se observó en el informe para Reimaginar los datos, la expectativa de que los datos de la periferia sean almacenados solo por un corto periodo, hasta que sean analizados o procesados antes de mover los datos más importantes al núcleo, no significa que el futuro sea la nube contra la periferia. En lugar de eso, serán la nube y la periferia trabajando como uno solo.
El almacenamiento de datos en la periferia ha crecido a un ritmo más rápido que el almacenamiento de datos en el núcleo. Al mismo tiempo, el volumen de datos que las organizaciones transfieren desde la periferia hacia el núcleo está configurado para que aumente del 8 % al 16 % en los próximos dos años.
Para gestionar este aumento en el procesamiento de datos en la periferia (tanto en la periferia y posteriormente en los centros de datos centrales), los planes para gestionar la información deben permitir una transmisión de datos más rápida y fácil de principio a fin. La movilidad de los datos debe facilitarse a través de los puntos finales, la periferia y las nubes privadas, públicas o industriales.
Para evitar que los datos comiencen a aislarse y sean inaccesibles para la infraestructura de datos empresariales más grande, las empresas deben gestionar y organizar el almacenamiento de datos en la periferia. La periferia puede ser particularmente susceptible a los silos si el tráfico de los dispositivos de punto final no se coordina adecuadamente.
Sin embargo, los beneficios de los datos y la computación en la periferia son enormes. En concreto, cuando la IA y el software de analítica empresarial realizan un análisis exhaustivo pueden recopilar y conservar más información que cuando se sigue un modelo que se dedica únicamente a la infraestructura de los centros de datos locales o en la nube.
Para gestionar el crecimiento y la expansión de los datos en la periferia de manera más efectiva, las empresas deberán utilizar una arquitectura de la periferia que pueda almacenar y analizar información sensible a la latencia en tiempo real, mientras que también permita distribuir la computación para realizar análisis de transmisión de datos desde la periferia.
Tal como se subraya en el informe para Reimaginar los datos, las tendencias no impulsan la innovación. Crear valor bajo limitaciones es lo que motiva las soluciones nuevas. Y esto es precisamente lo que el crecimiento y la expansión en la periferia están haciendo por las empresas y sus socios de la TI. Las empresas pueden esperar ver un crecimiento de datos sin precedentes debido al alza masiva de dispositivos del IdC y el aumento en el uso de la analítica empresarial y las herramientas de la IA. Para comenzar a gestionar y a sacarle provecho al crecimiento y a la expansión, las empresas necesitan un plan de gestión de datos sólido y un montón de tecnología rentable. Ambos deben permitir que los datos se muevan fácilmente entre la periferia y el núcleo, en el momento indicado, dependiendo del valor que se deba extraer de los datos.
Conozca más acerca de cómo las empresas pueden poner más de sus datos empresariales disponibles a trabajar en el informe para Reimaginar los datos de Seagate.