A gravidade dos dados é a capacidade de um corpo de dados atrair aplicações, serviços e outros data.
A força da gravidade, neste contexto, pode ser pensada como a forma como software, serviços e lógica de negócios são atraídos para dados relativos à sua massa (a quantidade de dados). Quanto maior a quantidade de dados, mais aplicações, serviços e outros dados serão atraídos por eles e mais rapidamente serão desenhados.
Em termos práticos, movendo dados mais longe e com mais frequência impactos carga de trabalho desempenho, portanto faz sentido que os dados para sejam reunidos e para aplicações e serviços associados sejam localizados nas proximidades. Este é um dos motivos pelos quais os aplicativos de Internet das coisas (IoT) precisam ser hospedados o mais próximo possível de onde os dados que eles usam estão sendo gerados e armazenados.
Hyperconvergence é um termo que é frequentemente usado para ilustrar o conceito de gravidade dos dados. Em a hyper-converged infraestrutura, computação, recursos de rede e virtualização estão fortemente integrados com o armazenamento de dados dentro de uma caixa de hardware de commodities. Quanto maior a quantidade de dados, e mais outros dados podem estar conectados a eles -- mais valor os dados têm para a análise.
A história da gravidade dos dados
O especialista em TI Dave McCrory cunhou o termo gravidade dos dados como uma analogia para a forma física que objetos com mais massa atraem naturalmente objetos com menos massa.
De acordo com McCrory, a gravidade dos dados está se movendo para a nuvem. Como mais e mais negócios internos e externos data é movido para a nuvem ou gerado lá, análise de dados ferramentas são também cada vez mais baseados na nuvem. Sua explicação do termo diferencia entre gravidade de dados naturalmente ocorrida e mudanças similares criadas através de forças externas, tais como legislação, estrangulamento e preços manipuladores, que McCrory se refere como gravidade de dados artificiais.
McCrory publicou recentemente o Índice de Gravidade dos Dados, um relatório que mede, quantifica e prevê a intensidade da gravidade dos dados para as Empresas Globais 2000 da Forbes em 53 metros e 23 indústrias. O relatório inclui uma fórmula de gravidade dos dados com patente pendente e uma metodologia baseada em milhares de atributos das presenças das empresas Global 2000 em cada localidade, along with variables for each location including
- Gross domestic product (GDP)
- Population
- Number of employees
- Technographic data
- IT spend
- Average bandwidth and latency
- Data flows