A distribuição normal (ou distribuição gaussiana) é a distribuição de probabilidade mais importante nas estatísticas. Ele descreve quantos fenômenos naturais são distribuídos – resultados de testes, alturas, erros de medição, retornos de ações – e é a base da maioria das inferências estatísticas e testes de hipóteses.
A Fórmula
A função de densidade de probabilidade para uma distribuição normal é:
f(x) = (1 / (σ√(2π))) × e^(-(x-μ)²/(2σ²))
Onde:
- μ (mu) = média (centro da distribuição)
- σ (sigma) = desvio padrão (spread da distribuição)
- x = o valor que você está avaliando
- e ≈ 2,71828
- π ≈ 3,14159
A forma é curva em sino e cerca de 68% dos valores estão dentro de 1 desvio padrão da média, 95% dentro de 2 desvios padrão e 99,7% dentro de 3 desvios padrão (a regra 68-95-99,7).
Exemplo trabalhado
Um teste padronizado tem média 100 e desvio padrão 15. Qual é a probabilidade de uma pontuação aleatória ser inferior a 115?
Primeiro, converta para uma pontuação z:
z = (115 - 100) / 15 = 1.0
Um escore z de 1,0 significa 115 é um desvio padrão acima da média. Usando uma tabela ou calculadora normal padrão, P(z ≤ 1,0) ≈ 0,8413 ou 84,13%.
Portanto, cerca de 84% dos participantes têm pontuação abaixo de 115.
Principais Propriedades
A distribuição normal é definida inteiramente pela sua média e desvio padrão. Mudar a média move a curva para a esquerda ou para a direita; aumentar o desvio padrão o achata e amplia. A área total sob a curva é sempre igual a 1.
Qualquer distribuição normal pode ser convertida na distribuição normal padrão (média 0, desvio padrão 1) usando a fórmula de pontuação z acima. Essa padronização permite usar uma tabela normal universal.
Quando usar
Use a distribuição normal quando:
- Clusters de dados em torno de um valor central
- Os valores seguem um histograma em forma de sino
- Aplica-se o Teorema do Limite Central (médias amostrais de qualquer distribuição aproximada da normal)
- Você está fazendo testes de hipóteses ou intervalos de confiança
A maioria dos dados contínuos do mundo real segue aproximadamente uma distribuição normal, tornando-os o carro-chefe das estatísticas aplicadas.
Pontas
Verifique a normalidade usando um histograma ou gráfico QQ antes de assumir que os dados são normais. Se os dados estiverem muito distorcidos ou apresentarem valores discrepantes, a distribuição normal pode não ser apropriada. Para dados não normais, use testes não paramétricos ou transformação de dados.
Use nossa calculadora de distribuição normal para encontrar probabilidades, percentis e pontuações z instantaneamente.