O desvio padrão é a medida de dispersão mais amplamente utilizada nas estatísticas. Ele informa a que distância um valor típico está da média – se seus dados estão fortemente agrupados ou amplamente dispersos. Depois de fazer o cálculo manualmente uma vez, o conceito se torna intuitivo.
O que o desvio padrão lhe diz
Se uma turma de alunos tiver uma pontuação média no exame de 70 com um desvio padrão de 5, a maioria das pontuações ficará entre 65 e 75. Se o desvio padrão fosse 20, as pontuações variariam muito mais amplamente – de 50 a 90 e além.
Um pequeno desvio padrão significa consistência. Um grande significa variabilidade.
População vs Desvio Padrão da Amostra
Existem duas versões, e escolher a correta é importante:
Desvio padrão populacional (σ): Use quando você tiver dados de cada membro do grupo de seu interesse. Divide por n.
Desvio(s) padrão(ões) da amostra: Use quando seus dados forem uma amostra extraída de uma população maior. Divide por n − 1 (correção de Bessel, que leva em conta a incerteza introduzida pela amostragem).
Na prática, quase sempre você usa o desvio padrão da amostra — a menos que esteja analisando um censo completo ou um conjunto de dados controlado sem membros faltantes.
Cálculo passo a passo
Conjunto de dados: 4, 7, 13, 2, 1 (uma amostra de 5 valores)
Etapa 1: Calcule a média
Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4
Etapa 2: Encontre cada desvio da média
Subtraia a média de cada valor:
| Valor (x) | Desvio (x − x̄) |
|---|---|
| 4 | 4 − 5,4 = −1,4 |
| 7 | 7 − 5,4 = +1,6 |
| 13 | 13 − 5,4 = +7,6 |
| 2 | 2 − 5,4 = −3,4 |
| 1 | 1 − 5,4 = −4,4 |
Etapa 3: Eleve ao quadrado cada desvio
A quadratura elimina sinais negativos e enfatiza desvios maiores:
| Desvio | Desvio quadrático |
|---|---|
| −1,4 | 1.96 |
| +1.6 | 2.56 |
| +7.6 | 57.76 |
| −3,4 | 11.56 |
| −4,4 | 19.36 |
Etapa 4: Somar os desvios quadrados
Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2
Etapa 5: Divida por n − 1 (para desvio padrão da amostra)
Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3
Etapa 6: Calcule a raiz quadrada
Standard deviation (s) = √23.3 = 4.83
Interpretação: os valores neste conjunto de dados normalmente ficam a cerca de 4,83 unidades da média de 5,4.
A fórmula escrita
Desvio padrão da amostra:
s = √[ Σ(x − x̄)² / (n − 1) ]
Desvio padrão populacional:
σ = √[ Σ(x − μ)² / n ]
Onde μ (mu) é a média da população.
A regra empírica (regra 68-95-99,7)
Para dados que seguem uma distribuição normal, o desvio padrão tem uma relação confiável com a proporção de dados dentro de cada intervalo:
| Faixa | Proporção de dados |
|---|---|
| Média ± 1 DP | ~68% |
| Média ± 2 DP | ~95% |
| Média ± 3 DP | ~99,7% |
Exemplo aplicado: As pontuações de QI têm média de 100 e DP de 15.
- 68% das pessoas pontuam entre 85 e 115
- Pontuação de 95% entre 70 e 130
- Pontuação de 99,7% entre 55 e 145
Esta regra se aplica apenas a dados normalmente distribuídos. Para distribuições distorcidas ou de cauda pesada, use a desigualdade de Chebyshev.
Variância vs Desvio Padrão
Variância é o desvio quadrático (etapa 5 acima) — o desvio padrão é sua raiz quadrada. Ambos medem a dispersão, mas o desvio padrão é expresso nas mesmas unidades dos dados originais, tornando-os mais interpretáveis.
Se seus dados estiverem em quilogramas, seu desvio padrão estará em quilogramas. Sua variação está em quilogramas quadrados, o que é mais difícil de interpretar de forma significativa.
Aplicativos comuns
Finanças: Medição da volatilidade do investimento. Uma ação com retornos diários com um SD alto é mais volátil – maior ganho potencial e maior perda potencial.
Controle de qualidade: A fabricação usa SD para garantir que os produtos permaneçam dentro da tolerância. Um processo com SD muito grande produz muitos itens defeituosos.
Educação: Padronização das pontuações dos testes. Uma pontuação z informa quantos desvios padrão uma pontuação está acima ou abaixo da média: z = (x - média) / DP.
Ciência: Expressar incerteza de medição e comparar resultados experimentais.
Atalho para cálculo
Para grandes conjuntos de dados, utilize a fórmula computacional que evita calcular desvios individualmente:
s² = [Σx² − (Σx)²/n] / (n − 1)
Isto é matematicamente equivalente, mas requer apenas duas passagens pelos dados, em vez de três.
Use nossa Calculadora de desvio padrão para calcular SD, variância e um detalhamento completo de qualquer conjunto de dados inserido.