Digitalização é o processo de conversão de informação para um formato digital . Neste formato, a informação é organizada em unidades discretas de dados (chamadas bit s) que podem ser endereçadas separadamente (geralmente em grupos de múltiplos bits chamados byte s). Estes são os dados binários que computadores e muitos dispositivos com capacidade computacional (como câmeras digitais s e aparelhos auditivos digitais s) podem processar.
Texto e imagens podem ser digitalizadas de forma similar: um scanner captura uma imagem (que pode ser uma imagem de texto) e a converte para um arquivo de imagem, como um bitmap . Um programa de reconhecimento óptico de caracteres ( OCR ) analisa uma imagem de texto para áreas claras e escuras a fim de identificar cada letra alfabética ou dígito numérico, e converte cada caractere em um código ASCII.
Digitalização de áudio e vídeo utiliza um dos muitos processos de conversão analógico-digital em que um sinal continuamente variável ( analógico ) é alterado, sem alterar seu conteúdo essencial, em um sinal multinível (digital). O processo de amostragem mede a amplitude (intensidade do sinal) de uma forma de onda analógica em marcadores de tempo igualmente espaçados e representa as amostras como valores numéricos para entrada como dados digitais.
Digitalização da informação facilita a preservação, acesso e compartilhamento. Por exemplo, um documento histórico original pode ser acessível apenas a pessoas que visitam sua localização física, mas se o conteúdo do documento for digitalizado, ele pode ser disponibilizado para pessoas em todo o mundo. Há uma tendência crescente para a digitalização de dados histórica e culturalmente significativos.
De acordo com um artigo em The Guardian em março de 2007, se toda a linguagem falada desde o início dos tempos fosse digitalizada, ele consumiria cinco exabytes de espaço de armazenamento. O total de informação digital, em 2006 foi estimado em 161 bilhões de exabytes. Só o correio electrónico constituía seis exabytes desse número.