Ruído estatístico

Ruído estatístico é uma variabilidade inexplicável dentro de uma amostra de dados. O termo ruído, neste contexto, veio do processamento de sinais onde foi usado para se referir à energia elétrica ou eletromagnética indesejada que degrada a qualidade dos sinais e dos dados. A presença de ruído significa que os resultados da amostragem podem não ser duplicados se o processo for repetido.

Dados ruidosos são dados que se tornam sem sentido pela existência de demasiada variação. É assumido que o sinal (dados determinísticos ou significativos) está presente mas obscurecido pelo ruído (dados aleatórios). Originalmente considerado como referindo-se a dados corruptos, dados ruidosos agora se referem a qualquer dado que não é legível por máquina. Como tal, inclui texto não estruturado bem como quaisquer dados que tenham sido alterados de alguma forma que já não sejam compatíveis com o programa utilizado para a sua criação.  

O problema de separar o ruído do sinal tem sido há muito um foco nas estatísticas, para que os dados significativos pudessem informar os investigadores. No entanto, muitas vezes, a porção de dados ruidosos que é significativa é muito pequena para ser útil.

Num contexto não científico, as pessoas usam frequentemente o termo ruído estatístico para rejeitar dados que não lhes agradam ou que estão de acordo com as suas expectativas.