Varianta măsoară cât de răspândit este un set de numere față de media lor. Este unul dintre cele mai importante concepte din statistică - folosit în finanțe pentru a măsura riscul investițiilor, în știință pentru a evalua consistența experimentală și în analiza datelor de zi cu zi.

Ce este variația?

Varianta este media diferențelor pătrate față de medie. O variație scăzută înseamnă că punctele de date se grupează strâns în jurul mediei. O variație mare înseamnă că sunt răspândite pe scară largă.

Există două tipuri:

  • Varianța populației (σ²) — folosită atunci când aveți date pentru întreaga populație
  • Varianța eșantionului (s²) — folosită atunci când datele dvs. sunt un eșantion dintr-o populație mai mare

În practică, aproape întotdeauna veți folosi variația eșantionului.

Formula variației

Varianta populației

σ² = Σ(xᵢ - μ)² / N

Unde:

  • xᵢ = fiecare punct de date
  • μ = media populației
  • N = numărul de puncte de date

Varianta eșantionului

s² = Σ(xᵢ - x̄)² / (n - 1)

Unde:

  • x̄ = media eșantionului
  • n - 1 = grade de libertate (corecția lui Bessel)

CODE0 în varianța eșantionului corectează pentru faptul că un eșantion tinde să subestimeze răspândirea reală a populației.

Exemplu pas cu pas

Set de date: 4, 8, 6, 5, 3, 2, 8, 9, 2, 5

Pasul 1: Calculați media

Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
     = 52 / 10
     = 5.2

Pasul 2: Scădeți media din fiecare valoare și rezultatul la pătrat

Valoare Valoare − Medie (Valoare − Medie)²
4 4 − 5,2 = −1,2 1.44
8 8 − 5,2 = 2,8 7.84
6 6 − 5,2 = 0,8 0.64
5 5 − 5,2 = −0,2 0.04
3 3 − 5,2 = −2,2 4.84
2 2 − 5,2 = −3,2 10.24
8 8 − 5,2 = 2,8 7.84
9 9 − 5,2 = 3,8 14.44
2 2 − 5,2 = −3,2 10.24
5 5 − 5,2 = −0,2 0.04

Pasul 3: Însumați diferențele la pătrat

Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
             = 57.6

Pasul 4: Împărțirea la n − 1 (varianța eșantionului)

s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4

Varianta eșantionului este de 6,4.

Varianta față de abaterea standard

Abaterea standard este pur și simplu rădăcina pătrată a varianței:

s = √s² = √6.4 ≈ 2.53

Abaterea standard este exprimată în aceleași unități ca și datele originale, ceea ce face mai ușor de interpretat. Dacă datele dumneavoastră sunt în kilograme, abaterea standard este în kilograme. Varianta este în kilograme². Acesta este motivul pentru care abaterea standard este raportată mai frecvent, dar varianța este utilizată în multe calcule statistice.

Populație vs eșantion: când să le folosiți fiecare

Situaţie Utilizare
Aveți date pentru fiecare membru al grupului Varianța populației (÷ N)
Datele dvs. sunt un eșantion dintr-un grup mai mare Varianța eșantionului (÷ n − 1)
Comparativ cu alte teste statistice De obicei, variația eșantionului
Setul dvs. de date este imaginea completă Varianta populatiei

Dacă aveți îndoieli, utilizați varianța eșantionului. Majoritatea seturilor de date din lumea reală sunt mostre.

De ce pătram diferențele

S-ar putea să vă întrebați: de ce nu faceți doar o medie a diferențelor brute față de medie?

Problema este că abaterile pozitive și negative se anulează. Pentru setul de date de mai sus, unele valori sunt deasupra mediei, iar altele sunt sub. Dacă le adunați pe toate fără a le pătra, obțineți întotdeauna zero.

Pătratul îndepărtează semnele negative, astfel încât toate abaterile contribuie pozitiv la răspândirea totală.

Aplicații practice

Finanțe: Varianta portofoliului măsoară riscul investiției. Un portofoliu cu varianță de 0,04 este mai puțin riscant decât unul cu varianță de 0,16 – chiar dacă ambele au același randament așteptat.

Controlul calității: Un proces de fabricație cu variație redusă produce rezultate mai consistente. Varianta mare înseamnă rezultate imprevizibile.

Știință: În experimente, variația mare între măsurători repetate sugerează o eroare de măsurare sau variabile necontrolate.

Analitica sportivă: Varianta performanței jucătorului vă spune dacă un jucător este consecvent (varianță scăzută) sau striată (varianță mare).

Greșeli frecvente

** Folosind N în loc de n - 1 pentru eșantioane** — Aceasta subestimează adevărata varianță a populației. Utilizați întotdeauna n − 1 pentru datele eșantionului.

Uitând să pătrați — O eroare comună este media diferențelor brute, mai degrabă decât a diferențelor la pătrat.

Confuză variația cu intervalul — Intervalul este pur și simplu maximul minus minimul. Varianta ține cont de toate punctele de date, nu doar de extreme.

Referință rapidă

Formula Când să utilizați
COD0 Populație completă
COD0 Eșantion din populație
COD0 Pentru a obține abaterea standard

Citiți în continuare