Coeficiente de correlação

Um coeficiente de correlação é uma medida estatística do grau em que as mudanças no valor de uma variável predizem mudanças no valor de outra. Em variáveis positivamente correlacionadas, o valor aumenta ou diminui em tandem. Em variáveis negativamente correlacionadas, o valor de uma aumenta à medida que o valor da outra diminui. Um exemplo … Ler mais

Correlação positiva

Uma correlação positiva é uma relação entre duas variáveis de tal forma que seus valores aumentam ou diminuem juntos.  Correlação é expressa em um intervalo de +1 a -1, conhecido como o coeficiente de correlação. Em uma correlação positiva perfeita, expressa como +1, um aumento ou diminuição em uma variável sempre prevê a mesma mudança … Ler mais

O viés de disponibilidade

O viés de disponibilidade é a tendência humana de pensar que os exemplos de coisas que vêm prontamente à mente são mais representativos do que realmente é o caso. O fenómeno psicológico é apenas um dos vários vieses cognitivos que dificultam o pensamento crítico e, como resultado, a validade das nossas decisões. O viés de … Ler mais

Causa

Aausação, ou causalidade, é a capacidade de uma variável influenciar outra. A primeira variável pode trazer a segunda à existência ou pode causar a incidência da segunda variável a flutuar. Aausação é freqüentemente confundida com correlação, o que indica até que ponto duas variáveis tendem a aumentar ou diminuir em paralelo. No entanto, a correlação … Ler mais

Lei do Zipf

A Lei do Zipf é uma distribuição estatística em certos conjuntos de dados, tais como palavras num corpus linguístico, em que as frequências de certas palavras são inversamente proporcionais às suas fileiras. Nomeado para o linguista George Kingsley Zipf, que por volta de 1935 foi o primeiro a chamar a atenção para este fenómeno, a … Ler mais

Teoria da carga cognitiva (CLT)

Teoria da carga cognitiva (CLT) é o conceito de que a informação deve ser apresentada a um ritmo e nível de dificuldade que corresponda à forma como o cérebro humano processa a informação. Quando um instrutor leva o CLT em consideração, ele ou ela procura propositalmente diminuir as exigências sobre as capacidades de processamento do … Ler mais

Distribuição normal

Uma distribuição normal é uma disposição de um conjunto de dados em que a maioria dos valores se agrupam no meio da faixa e o restante se afina simetricamente em direção a extremos. Altura é um exemplo simples de algo que segue um padrão de distribuição normal: A maioria das pessoas é de altura média, … Ler mais

Literacia de dados

A literacia de dados é a capacidade de obter informações significativas a partir dos dados, assim como a literacia em geral é a capacidade de obter informações a partir da palavra escrita. A complexidade da análise de dados, especialmente no contexto de grandes dados, significa que a literacia de dados requer algum conhecimento de matemática … Ler mais

Anonimização de dados

Anonimização de dados é o uso de uma ou mais técnicas projetadas para tornar impossível — ou pelo menos mais difícil — identificar um determinado indivíduo a partir de dados armazenados relacionados a ele.  A finalidade da anonimização de dados é proteger a privacidade do indivíduo e tornar legal para governos e empresas compartilhar seus … Ler mais

Arbitragem da informação

A arbitragem da informação é um instrumento para criar oportunidades no mercado, identificando tendências à frente das outras e agindo sobre elas. Um objetivo importante da arbitragem de informação é fazer previsões precisas sobre o que os clientes vão querer a seguir. Arbitrage é uma palavra francesa que se refere a uma decisão de um árbitro … Ler mais