Scatter plot

Um gráfico de dispersão é um conjunto de pontos plotados em um eixo horizontal e vertical.

Scatter plots são importantes nas estatísticas porque podem mostrar a extensão da correlação, se houver, entre os valores das quantidades ou fenômenos observados (chamados variáveis). Se não existe correlação entre as variáveis, os pontos aparecem dispersos aleatoriamente no plano de coordenadas. Se existir uma grande correlação, os pontos concentram-se perto de uma linha reta. Os gráficos de dispersão são ferramentas úteis de visualização de dados para ilustrar uma tendência.

Besides mostrando a extensão da correlação, um gráfico de dispersão mostra o sentido da correlação:

  • Se a variável vertical (ou y-ei>-eixo) aumenta conforme a variável horizontal (ou x-eixo) aumenta, a correlação é positiva.
  • Se a variável y-eixo diminui à medida que a variável x-eixo aumenta ou vice-versa, a correlação é negativa.
  • Se for impossível estabelecer um dos critérios acima, então a correlação é zero.

A correlação positiva máxima possível é +1 ou +100%, quando todos os pontos de um gráfico de dispersão se encontram exatamente ao longo de uma linha reta com uma inclinação positiva. A correlação negativa máxima possível é -1 ou -100%, neste caso todos os pontos se encontram exatamente ao longo de uma linha reta com inclinação negativa.

Correlação é freqüentemente confundida com causalidade, seja acidentalmente (como resultado de hipóteses falsas ou não comprovadas) ou deliberadamente (com intenção de enganar). No entanto, no sentido puro, enquanto um gráfico de dispersão pode revelar a natureza e extensão da correlação, nada diz sobre a causalidade.

Veja também: teoria do gráfico, pictograma, gráfico de barras, gráfico ponto-a-ponto, gráfico de sparkline, gráfico de séries temporais