Varians måler hvor spredt et sett med tall er fra gjennomsnittet. Det er et av de viktigste konseptene i statistikk – brukt i finans for å måle investeringsrisiko, i vitenskap for å vurdere eksperimentell konsistens og i daglige dataanalyse.

Hva er varians?

Varians er gjennomsnittet av kvadrerte forskjeller fra gjennomsnittet. En lav varians betyr at datapunktene klynger seg tett rundt gjennomsnittet. En høy varians betyr at de er vidt spredt.

Det er to typer:

  • Befolkningsvarians (σ²) — brukes når du har data for hele populasjonen
  • Sample varians (s²) — brukes når dataene dine er et utvalg fra en større populasjon

I praksis vil du nesten alltid bruke prøvevarians.

Variansformelen

Befolkningsvariasjon

σ² = Σ(xᵢ - μ)² / N

Hvor:

  • xᵢ = hvert datapunkt
  • μ = gjennomsnittet av befolkningen
  • N = antall datapunkter

Eksempelvarians

s² = Σ(xᵢ - x̄)² / (n - 1)

Hvor:

  • x̄ = prøvegjennomsnittet
  • n - 1 = frihetsgrader (Bessels korreksjon)

CODE0 i utvalgsvarians korrigerer for det faktum at et utvalg har en tendens til å undervurdere den sanne spredningen av populasjonen.

Trinn-for-trinn eksempel

Datasett: 4, 8, 6, 5, 3, 2, 8, 9, 2, 5

Trinn 1: Beregn gjennomsnittet

Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
     = 52 / 10
     = 5.2

Trinn 2: Trekk gjennomsnittet fra hver verdi og kvadrer resultatet

Verdi Verdi − Middel (Verdi − Gjennomsnitt)²
4 4 − 5,2 = −1,2 1.44
8 8 − 5,2 = 2,8 7.84
6 6 - 5,2 = 0,8 0.64
5 5 − 5,2 = −0,2 0.04
3 3 − 5,2 = −2,2 4.84
2 2 − 5,2 = −3,2 10.24
8 8 − 5,2 = 2,8 7.84
9 9 − 5,2 = 3,8 14.44
2 2 − 5,2 = −3,2 10.24
5 5 − 5,2 = −0,2 0.04

Trinn 3: Legg sammen de kvadratiske forskjellene

Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
             = 57.6

Trinn 4: Del med n − 1 (utvalgsvarians)

s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4

Prøveavviket er 6,4.

Varians vs standardavvik

Standardavvik er rett og slett kvadratroten av variansen:

s = √s² = √6.4 ≈ 2.53

Standardavvik uttrykkes i samme enheter som de opprinnelige dataene, noe som gjør det lettere å tolke. Hvis dataene dine er i kilogram, er standardavviket i kilogram. Variansen er i kilogram². Dette er grunnen til at standardavvik er mer vanlig rapportert - men varians brukes i mange statistiske beregninger.

Befolkning vs prøve: Når du skal bruke hver

Situasjon Bruk
Du har data for hvert medlem av gruppen Befolkningsavvik (÷ N)
Dataene dine er et utvalg fra en større gruppe Eksempelvarians (÷ n − 1)
Sammenligning med andre statistiske tester Vanligvis prøvevariasjon
Datasettet ditt er det komplette bildet Befolkningsvariasjon

Når du er i tvil, bruk prøvevarians. De fleste datasett i den virkelige verden er prøver.

Hvorfor vi kvadrerer forskjellene

Du lurer kanskje på: hvorfor ikke bare snitte de rå forskjellene fra gjennomsnittet?

Problemet er at positive og negative avvik opphever seg. For datasettet ovenfor er noen verdier over gjennomsnittet og noen er under. Legger du alle sammen uten å kvadrere, får du alltid null.

Kvadring fjerner de negative fortegnene, så alle avvik bidrar positivt til den totale spredningen.

Praktiske bruksområder

Finans: Porteføljeavvik måler investeringsrisiko. En portefølje med varians på 0,04 er mindre risikabel enn en med varians på 0,16 – selv om begge har samme forventet avkastning.

Kvalitetskontroll: En produksjonsprosess med lav varians gir mer konsistent produksjon. Høy varians betyr uforutsigbare resultater.

Vitenskap: I eksperimenter tyder høy varians mellom gjentatte målinger på målefeil eller ukontrollerte variabler.

Sportsanalyse: Spillerprestasjonsvarians forteller deg om en spiller er konsekvent (lav varians) eller streaky (høy varians).

Vanlige feil

Bruk av N i stedet for n − 1 for utvalg — Dette undervurderer den sanne populasjonsvariansen. Bruk alltid n − 1 for eksempeldata.

Å glemme å kvadrere — En vanlig feil er å beregne gjennomsnittet av de rå forskjellene i stedet for de kvadratiske forskjellene.

Forvirrende varians med rekkevidde — Rekkevidde er ganske enkelt maksimum minus minimum. Varians står for alle datapunkter, ikke bare ytterpunktene.

Hurtigreferanse

Formel Når du skal bruke
KODE0 Full befolkning
KODE0 Utvalg fra populasjon
KODE0 For å få standardavvik

Les neste