O crescimento e a expansão dos dados
As empresas estão diante de grandes desafios com a contínua expansão dos dados. O gerenciamento da expansão dos dados na borda oferece às empresas uma chance de extrair mais valor de seus conjuntos de dados em constante crescimento.
Com um aumento sem precedentes na criação de dados, as empresas estão sendo desafiadas a encontrar novas maneiras de gerenciar este aumento no volume de informações e usá-las para melhorar seus resultados de negócios. Esse fluxo constante de dados vem de fontes como sensores em fábricas, smartphones de consumidores e dispositivos da Internet das coisas (IoT) na borda. A forma como as empresas lidam com o contínuo crescimento e expansão dos dados terá um enorme impacto em seu sucesso mais à frente.
Como é observado no relatório Rethink Data da Seagate, o volume, as fontes e o tráfego de dados estão se expandindo rapidamente, em um ritmo que muitas empresas não podem acompanhar. Mas para gerenciar o crescente fluxo de dados é preciso entender como as redes estão evoluindo. As empresas devem entender como os dados na borda se encaixam no atual ecossistema de computação.
Crescimento de dados é a porcentagem em que a esfera de dados como um todo aumenta ao longo do tempo. Isso envolve todas as fontes de dados. Por outro lado, a expansão de dados diz respeito ao número de data centers e locais de processamento, bem como à distância na qual os dados estão se espalhando geograficamente. A expansão ocorre em diferentes configurações: dos dispositivos de endpoint ao longo da borda até as nuvens públicas e privadas.
Há três principais fatores responsáveis pelo crescimento e expansão de dados no decorrer dos próximos anos. O primeiro é o aumento no uso de análise. Aplicações de análise de negócios e inteligência artificial (IA) são apenas dois exemplos de ferramentas de análise corporativa que requerem mais dados em diferentes locais. O segundo, a proliferação de dispositivos de IoT, está aumentando o número de fontes de dados e aumentando o tráfego de dados para a infraestrutura de núcleo, como servidores locais e em nuvem. Por fim, as iniciativas de migração para nuvem estão levando informações que, de outra forma, existiriam somente em dispositivos ou discos locais, para servidores centralizados de data center de nuvem pública e privada, para fins de acessibilidade e análise.
As demandas mais altas sobre a infraestrutura de TI corporativa refletem a forma como esse crescimento em análise, IoT e dados em movimento levam naturalmente a uma maior expansão. O relatório Rethink Data mostra como a expansão e a fragmentação estão aumentando.
Hoje, aproximadamente 30% do armazenamento de dados ocorre em data centers internos, 20% em data centers de terceiros e 19% na borda. O armazenamento de dados também ocorre em repositórios de nuvem ou outros locais, representando outros 30%. Essa distribuição não deverá mudar nos próximos dois anos, o que significa que os ambientes de armazenamento corporativo continuarão dispersos, até onde podemos prever.
Uma vez que as empresas obtiverem insights claros sobre como a quantidade e os locais de informações estão se multiplicando, elas poderão começar a desenvolver estratégias de gerenciamento que englobem todas as fontes de dados, incluindo a borda.
A borda não é um objeto, mas um local. A borda é a fronteira externa da rede, onde ocorre a tomada de decisões em tempo real. A borda está localizada o mais perto possível da fonte de dados real, o que, geralmente, fica a centenas de milhares de quilômetros de distância do data center corporativo ou de nuvem mais próximo.
Segundo o relatório Rethink Data, à medida que as fontes de dados na borda se proliferarem, os dispositivos e sensores estarão localizados em todo lugar, de linhas de produção de manufatura a edifícios de escritórios. No início, a computação de borda era vista como “um balanço descentralizado do pêndulo", como Bob Gill, vice-presidente de pesquisa da Gartner, escreveu em um artigo em 2018. De acordo com Gill, a descentralização por meio da borda solucionava dois desafios importantes da nuvem: custo e latência. O processamento na borda pode ser mais rápido já que os dados não precisam ir e voltar de um servidor de nuvem e, em muitos casos, também pode ser mais barato. Isso significa que as empresas podem obter parte do valor de análise dos dados em borda ainda na borda, para a tomada de decisões em tempo real, antes de enviá-los a data centers de núcleo ou em nuvem para obter ainda mais valor.
Bilhões de dispositivos IoT em campo estão aprimorando as capacidades de coleta de dados exponencialmente. Enquanto isso, os avanços em software e hardware tornaram a IA mais prática, econômica e acessível para a empresa média. As inovações nas instalações de data center na borda também possibilitam que as empresas obtenham enormes quantidades de valor na borda.
No entanto, para as empresas acessarem os benefícios do valor total dos dados, elas precisam ser capazes não só de coletar, armazenar e processar dados na borda, como também transferir mais dados da borda aos data centers no núcleo.
À medida que o crescimento e a expansão de dados fora do data center tradicional aumentar, a nuvem começará a se mesclar com a borda. Como observado no relatório Rethink Data, a expectativa de que os dados na borda serão armazenados apenas por um curto período de tempo (até que sejam analisados ou processados antes de mover dados relevantes para o núcleo) não significa que o futuro é a nuvem versus a borda. Em vez disso, trata-se da nuvem e da borda trabalhando como uma só.
O armazenamento de dados na borda está crescendo a um ritmo mais rápido do que o armazenamento de dados no núcleo. Ao mesmo tempo, entretanto, o volume de dados que as organizações transferem da borda para o núcleo deverá aumentar de 8% a 16% nos próximos dois anos.
Para gerenciar esse elevado processamento de dados na borda (na borda e, mais tarde, nos data centers de núcleo), os planos de gerenciamento de informações devem possibilitar a transmissão mais rápida e fácil de dados do início ao fim. A mobilidade de dados deve ser facilitada entre endpoints, a borda e as nuvens privada, pública ou setorial.
Para evitar que os dados fiquem isolados e inacessíveis à infraestrutura maior de dados corporativos, as empresas precisam gerenciar e organizar o armazenamento de dados na borda. A borda pode ser especialmente suscetível a silos de dados, se o tráfego gerado pelos dispositivos de endpoint não for coordenado adequadamente.
Entretanto, os benefícios dos dados e da computação na borda são profundos. Em particular, mais informações podem ser coletadas e selecionadas para análise profunda por um software de análise de negócios e IA do que em um modelo dedicado unicamente à infraestrutura de data center local ou em nuvem.
Para gerenciar o crescimento e expansão da borda de maneira mais eficaz, as empresas precisarão empregar uma arquitetura de borda que possa armazenar e analisar em tempo real informações sensíveis a latência, ao mesmo tempo em que permite que a computação distribuída realize análise de dados transferidos da borda.
Como o relatório Rethink Data destaca, a inovação não é estimulada por tendências. Criar valor sob restrições é o que produz novas soluções. E é exatamente isso que o crescimento e expansão na borda estão fazendo para as empresas e seus parceiros de TI. As empresas deverão ver um crescimento de dados sem precedentes devido ao enorme salto nos dispositivos IoT e ao maior uso de ferramentas de análise de negócios e IA. Para começar a gerenciar e lucrar com o crescimento e expansão, as empresas precisam de um plano sólido de gerenciamento de dados e uma pilha econômica de tecnologia. Juntos, eles permitirão que os dados se movimentem com facilidade entre a borda e o núcleo, no momento certo, dependendo de qual valor deve ser extraído dos dados.
Leia mais sobre como as empresas podem colocar mais dos seus dados corporativos disponíveis para trabalhar no relatório Rethink Data completo da Seagate.