O desvio padrão é a medida de dispersão mais amplamente utilizada nas estatísticas. Ele informa a que distância um valor típico está da média – se seus dados estão fortemente agrupados ou amplamente dispersos. Depois de fazer o cálculo manualmente uma vez, o conceito se torna intuitivo.

O que o desvio padrão lhe diz

Se uma turma de alunos tiver uma pontuação média no exame de 70 com um desvio padrão de 5, a maioria das pontuações ficará entre 65 e 75. Se o desvio padrão fosse 20, as pontuações variariam muito mais amplamente – de 50 a 90 e além.

Um pequeno desvio padrão significa consistência. Um grande significa variabilidade.

População vs Desvio Padrão da Amostra

Existem duas versões, e escolher a correta é importante:

Desvio padrão populacional (σ): Use quando você tiver dados de cada membro do grupo de seu interesse. Divide por n.

Desvio(s) padrão(ões) da amostra: Use quando seus dados forem uma amostra extraída de uma população maior. Divide por n − 1 (correção de Bessel, que leva em conta a incerteza introduzida pela amostragem).

Na prática, quase sempre você usa o desvio padrão da amostra — a menos que esteja analisando um censo completo ou um conjunto de dados controlado sem membros faltantes.

Cálculo passo a passo

Conjunto de dados: 4, 7, 13, 2, 1 (uma amostra de 5 valores)

Etapa 1: Calcule a média

Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4

Etapa 2: Encontre cada desvio da média

Subtraia a média de cada valor:

Valor (x) Desvio (x − x̄)
4 4 − 5,4 = −1,4
7 7 − 5,4 = +1,6
13 13 − 5,4 = +7,6
2 2 − 5,4 = −3,4
1 1 − 5,4 = −4,4

Etapa 3: Eleve ao quadrado cada desvio

A quadratura elimina sinais negativos e enfatiza desvios maiores:

Desvio Desvio quadrático
−1,4 1.96
+1.6 2.56
+7.6 57.76
−3,4 11.56
−4,4 19.36

Etapa 4: Somar os desvios quadrados

Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2

Etapa 5: Divida por n − 1 (para desvio padrão da amostra)

Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3

Etapa 6: Calcule a raiz quadrada

Standard deviation (s) = √23.3 = 4.83

Interpretação: os valores neste conjunto de dados normalmente ficam a cerca de 4,83 unidades da média de 5,4.

A fórmula escrita

Desvio padrão da amostra:

s = √[ Σ(x − x̄)² / (n − 1) ]

Desvio padrão populacional:

σ = √[ Σ(x − μ)² / n ]

Onde μ (mu) é a média da população.

A regra empírica (regra 68-95-99,7)

Para dados que seguem uma distribuição normal, o desvio padrão tem uma relação confiável com a proporção de dados dentro de cada intervalo:

Faixa Proporção de dados
Média ± 1 DP ~68%
Média ± 2 DP ~95%
Média ± 3 DP ~99,7%

Exemplo aplicado: As pontuações de QI têm média de 100 e DP de 15.

  • 68% das pessoas pontuam entre 85 e 115
  • Pontuação de 95% entre 70 e 130
  • Pontuação de 99,7% entre 55 e 145

Esta regra se aplica apenas a dados normalmente distribuídos. Para distribuições distorcidas ou de cauda pesada, use a desigualdade de Chebyshev.

Variância vs Desvio Padrão

Variância é o desvio quadrático (etapa 5 acima) — o desvio padrão é sua raiz quadrada. Ambos medem a dispersão, mas o desvio padrão é expresso nas mesmas unidades dos dados originais, tornando-os mais interpretáveis.

Se seus dados estiverem em quilogramas, seu desvio padrão estará em quilogramas. Sua variação está em quilogramas quadrados, o que é mais difícil de interpretar de forma significativa.

Aplicativos comuns

Finanças: Medição da volatilidade do investimento. Uma ação com retornos diários com um SD alto é mais volátil – maior ganho potencial e maior perda potencial.

Controle de qualidade: A fabricação usa SD para garantir que os produtos permaneçam dentro da tolerância. Um processo com SD muito grande produz muitos itens defeituosos.

Educação: Padronização das pontuações dos testes. Uma pontuação z informa quantos desvios padrão uma pontuação está acima ou abaixo da média: z = (x - média) / DP.

Ciência: Expressar incerteza de medição e comparar resultados experimentais.

Atalho para cálculo

Para grandes conjuntos de dados, utilize a fórmula computacional que evita calcular desvios individualmente:

s² = [Σx² − (Σx)²/n] / (n − 1)

Isto é matematicamente equivalente, mas requer apenas duas passagens pelos dados, em vez de três.

Use nossa Calculadora de desvio padrão para calcular SD, variância e um detalhamento completo de qualquer conjunto de dados inserido.