A variância mede a dispersão de um conjunto de números em relação à sua média. É um dos conceitos mais importantes em estatística – utilizado em finanças para medir o risco de investimento, em ciência para avaliar a consistência experimental e na análise de dados quotidiana.

O que é variação?

A variância é a média das diferenças quadradas da média. Uma variação baixa significa que os pontos de dados estão agrupados em torno da média. Uma alta variação significa que eles estão amplamente difundidos.

Existem dois tipos:

  • Variância populacional (σ²) — usada quando você tem dados para toda a população
  • Variação amostral (s²) — usada quando seus dados são uma amostra de uma população maior

Na prática, você quase sempre usará a variação amostral.

A Fórmula da Variância

Variância Populacional

σ² = Σ(xᵢ - μ)² / N

Onde:

  • xᵢ = cada ponto de dados
  • μ = a média da população
  • N = número de pontos de dados

Variância da amostra

s² = Σ(xᵢ - x̄)² / (n - 1)

Onde:

  • x̄ = a média amostral
  • n - 1 = graus de liberdade (correção de Bessel)

O CODE0 na variância amostral corrige o fato de que uma amostra tende a subestimar a verdadeira dispersão da população.

Exemplo passo a passo

Conjunto de dados: 4, 8, 6, 5, 3, 2, 8, 9, 2, 5

Etapa 1: Calcule a média

Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
     = 52 / 10
     = 5.2

Etapa 2: subtraia a média de cada valor e eleve ao quadrado o resultado

Valor Valor - Média (Valor − Média)²
4 4 − 5,2 = −1,2 1.44
8 8 − 5,2 = 2,8 7.84
6 6 − 5,2 = 0,8 0.64
5 5 − 5,2 = −0,2 0.04
3 3 − 5,2 = −2,2 4.84
2 2 − 5,2 = −3,2 10.24
8 8 − 5,2 = 2,8 7.84
9 9 − 5,2 = 3,8 14.44
2 2 − 5,2 = −3,2 10.24
5 5 − 5,2 = −0,2 0.04

Etapa 3: Somar as diferenças quadradas

Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
             = 57.6

Etapa 4: Divida por n − 1 (variância da amostra)

s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4

A variação da amostra é 6,4.

Variância vs Desvio Padrão

O desvio padrão é simplesmente a raiz quadrada da variância:

s = √s² = √6.4 ≈ 2.53

O desvio padrão é expresso nas mesmas unidades dos dados originais, facilitando a interpretação. Se seus dados estiverem em quilogramas, o desvio padrão estará em quilogramas. A variação está em quilogramas². É por isso que o desvio padrão é mais comumente relatado – mas a variância é usada em muitos cálculos estatísticos.

População vs Amostra: Quando usar cada um

Situação Usar
Você tem dados para cada membro do grupo Variância populacional (÷ N)
Seus dados são uma amostra de um grupo maior Variância amostral (÷ n − 1)
Comparando com outros testes estatísticos Geralmente variação amostral
Seu conjunto de dados é a imagem completa Variância populacional

Em caso de dúvida, use a variação da amostra. A maioria dos conjuntos de dados do mundo real são amostras.

Por que compensamos as diferenças

Você pode se perguntar: por que não apenas calcular a média das diferenças brutas em relação à média?

O problema é que os desvios positivos e negativos se anulam. Para o conjunto de dados acima, alguns valores estão acima da média e outros abaixo. Se você somar todos sem elevar ao quadrado, sempre obterá zero.

A quadratura remove os sinais negativos, de modo que todos os desvios contribuem positivamente para o spread total.

Aplicações Práticas

Finanças: A variação do portfólio mede o risco de investimento. Uma carteira com variância de 0,04 é menos arriscada do que uma com variância de 0,16 – mesmo que ambas tenham o mesmo retorno esperado.

Controle de qualidade: um processo de fabricação com baixa variação produz resultados mais consistentes. Alta variação significa resultados imprevisíveis.

Ciência: Em experimentos, a alta variação entre medições repetidas sugere erro de medição ou variáveis ​​não controladas.

Análise esportiva: A variação de desempenho do jogador informa se um jogador é consistente (baixa variação) ou entremeado (alta variação).

Erros Comuns

Usando N em vez de n − 1 para amostras — Isso subestima a verdadeira variância populacional. Sempre use n − 1 para dados de amostra.

Esquecer de elevar ao quadrado — Um erro comum é calcular a média das diferenças brutas em vez das diferenças quadradas.

Variação confusa com intervalo — O intervalo é simplesmente o máximo menos o mínimo. A variação é responsável por todos os pontos de dados, não apenas pelos extremos.

Referência rápida

Fórmula Quando usar
CÓDIGO0 População completa
CÓDIGO0 Amostra da população
CÓDIGO0 Para obter o desvio padrão

Leia a seguir