Linhagem de dados é o histórico dos dados, incluindo onde os dados viajaram através da sua existência dentro de uma organização. A linhagem de dados é uma parte obrigatória da conformidade com as políticas de dados corporativos e governamentais. O rastreamento do histórico dos dados é obtido através da documentação e do software da linhagem de dados. Sem uma forma de identificar onde os erros de dados são introduzidos no ambiente, é difícil para os administradores de dados identificar e corrigir problemas de qualidade de dados.
Com ferramentas eficazes, a governança de dados pode ser facilitada através da documentação de toda a viagem dos dados pela organização. A documentação da linhagem de dados ajuda a simplificar duas das principais preocupações de governança de dados para os efeitos das mudanças nos dados: análise da causa raiz e análise do impacto nos negócios (BIA). O entendimento claro das causas e impactos das questões com os dados é auxiliado pelo conhecimento de tudo o que aconteceu com os dados desde que eles vieram a ser.
No desenvolvimento de software, o rastreamento da linhagem de dados pode ajudar a conciliar as dificuldades entre as melhores práticas de desenvolvimento ágil, regulamentos de governança de dados e política de dados da empresa. Ferramentas e procedimentos de linhagem de dados ajudam a rastrear onde as falhas de dados foram introduzidas, o que pode facilitar os diagnósticos e correções. Implementar o rastreamento da linhagem de dados pode ser difícil e muitas vezes visto como uma prioridade baixa, no entanto, uma correção mais precoce significa menos propagação de erros, o que significa que a implementação de ferramentas de linhagem de dados no início do processo muitas vezes prova que vale a pena o esforço.