Um data shadow é o corpo coletivo de dados que é automaticamente gerado e gravado à medida que vamos percorrendo nossas vidas, em vez de intencionalmente criado. As fontes incluem sensores e vigilância IP, metadados de comunidades e mecanismos de segurança e autenticação, entre outras possibilidades. Sombra, neste contexto, significa seguir: A nossa sombra de dados segue-nos.
Dados relacionados com a vigilância é um condutor particular para os requisitos de capacidade de armazenamento. Estes dados são frequentemente registados e armazenados a longo prazo, proporcionando um registo persistente das actividades online e no mundo físico. Os dados apresentam uma preocupação com a privacidade dos indivíduos e um fardo para os ombros de TI, pois empurram as demandas de armazenamento e potencialmente expõem dados sensíveis.
Os indivíduos são gravados em vídeo de alta resolução para porções significativas de seus dias em muitos lugares. Espera-se que o número desses arquivos de dados e seu tamanho aumente conforme aumenta o número de dispositivos, sua resolução e outros detalhes de dados. Este volume massivo de dados exige consideração nas políticas de privacidade, propriedade, retenção e eliminação de dados. Administradores que não estão adequadamente cientes do problema ou que não estão mantendo a política são responsáveis por vazamentos, caso dados que deveriam ter sido retidos e descartados ou, alternativamente, responsáveis por falhas de conformidade caso dados que deveriam ter sido salvos sejam encontrados ausentes.