Uma matriz de confusão é uma tabela que delineia diferentes previsões e resultados de testes e os contrasta com valores do mundo real. Matrizes de confusão são usadas em estatísticas, mineração de dados, modelos de aprendizagem de máquinas e outras aplicações de inteligência artificial (IA). Uma matriz de confusão também pode ser chamada de matriz de erro.
Matrizes de Confusão são usadas para tornar a análise profunda dos dados estatísticos mais rápida e os resultados mais fáceis de ler através da visualização clara dos dados. As tabelas podem ajudar a analisar falhas em estatísticas, mineração de dados, forenses e testes médicos. Uma análise completa ajuda os usuários a decidir quais resultados indicam como os erros são feitos em vez de simplesmente avaliar o desempenho.
Matrizes de Confusão usam um formato simples para registrar as previsões. Nas linhas de uma matriz de confusão para um modelo de aprendizagem de máquina, as possíveis previsões são alinhadas no lado direito e as atualidades ao longo da parte superior. Nas linhas debaixo das actualidades, as previsões ou resultados são registados. Os resultados podem incluir o correcto indicação de um positivo como um verdadeiro positivo ou um negativo como um verdadeiro negativo, bem como um positivo incorrecto como um falso positivo ou um negativo incorrecto como um falso negativo.
Below é um exemplo simples de uma matriz de confusão que pode ser usada para delinear resultados de testes de gravidez: