A ingestão de dados é o processo de obtenção e importação dados para uso imediato ou armazenamento em uma base de dados. Ingerir algo é "tomar algo ou absorver algo"
Dados podem ser transmitidos em tempo real ou ingeridos em lotes. Quando os dados são ingeridos em tempo real, cada item de dados é importado à medida que é emitido pela fonte. Quando os dados são ingeridos em lotes, os itens de dados são importados em pedaços discretos em intervalos periódicos de tempo. Um processo efetivo de ingestão de dados começa pela priorização das fontes de dados, validação de arquivos individuais e encaminhamento dos itens de dados para o destino correto.
Quando existem numerosas fontes de dados de grandes dimensões em diversos formatos (as fontes podem muitas vezes ser em centenas e os formatos em dezenas), pode ser um desafio para as empresas ingerir dados a uma velocidade razoável e processá-los eficientemente para manter uma vantagem competitiva. Para isso, os fornecedores oferecem programas de software que são adaptados a ambientes específicos de computação ou aplicações de software. Quando a ingestão de dados é automatizada, o software usado para realizar o processo também pode incluir preparação de dados recursos para estruturar e organizar os dados para que possam ser analisados na hora certa ou posteriormente por business intelligence (BI) e análise de negócios (BA) programs.