Sådan beregnes standardafvigelse — trin for trin

Standardafvigelse er det mest anvendte mål for spredning i statistik. Det fortæller dig, hvor langt en typisk værdi ligger fra gennemsnittet - om dine data er tæt klynget eller vidt spredt. Når du har gennemarbejdet beregningen i hånden én gang, bliver konceptet intuitivt.

Hvad standardafvigelse fortæller dig

Hvis en klasse af studerende har en gennemsnitlig eksamensscore på 70 med en standardafvigelse på 5, falder de fleste scores mellem 65 og 75. Hvis standardafvigelsen var 20, ville scorerne variere meget bredere - fra 50 til 90 og derover.

En lille standardafvigelse betyder konsistens. En stor betyder variation.

Population vs Sample Standard Deviation

Der er to versioner, og det er vigtigt at vælge den rigtige:

Befolkningsstandardafvigelse (σ): Bruges, når du har data for hvert medlem af gruppen, du holder af. Dividerer med n.

Standardafvigelse(r): Bruges, når dine data er en stikprøve fra en større population. Dividerer med n − 1 (Bessels korrektion, som tager højde for den usikkerhed, der er indført ved stikprøven).

I praksis bruger du næsten altid prøvestandardafvigelse - medmindre du analyserer en komplet folketælling eller et kontrolleret datasæt uden manglende medlemmer.

Trin-for-trin-beregning

Datasæt: 4, 7, 13, 2, 1 (et eksempel på 5 værdier)

Trin 1: Beregn middelværdien

Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4

Trin 2: Find hver afvigelse fra middelværdien

Træk middelværdien fra hver værdi:

Værdi (x)	Afvigelse (x − x̄)
4	4 − 5,4 = −1,4
7	7 - 5,4 = +1,6
13	13 - 5,4 = +7,6
2	2 − 5,4 = −3,4
1	1 − 5,4 = −4,4

Trin 3: Kvadret hver afvigelse

Kvadrering eliminerer negative tegn og understreger større afvigelser:

Afvigelse	Kvadratafvigelse
−1.4	1.96
+1.6	2.56
+7.6	57.76
−3.4	11.56
−4.4	19.36

Trin 4: Sum de kvadrerede afvigelser

Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2

Trin 5: Divider med n − 1 (for prøvestandardafvigelse)

Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3

Trin 6: Tag kvadratroden

Standard deviation (s) = √23.3 = 4.83

Fortolkning: Værdier i dette datasæt ligger typisk omkring 4,83 enheder væk fra gennemsnittet på 5,4.

Formlen skrevet ud

Eksempel på standardafvigelse:

s = √[ Σ(x − x̄)² / (n − 1) ]

Befolkningsstandardafvigelse:

σ = √[ Σ(x − μ)² / n ]

Hvor μ (mu) er befolkningsgennemsnittet.

Den empiriske regel (68-95-99.7 regel)

For data, der følger en normalfordeling, har standardafvigelsen et pålideligt forhold til andelen af data inden for hvert område:

Rækkevidde	Andel af data
Middel ± 1 SD	~68 %
Middel ± 2 SD	~95 %
Middel ± 3 SD	~99,7 %

Anvendt eksempel: IQ-score har et gennemsnit på 100 og SD på 15.

68% af mennesker scorer mellem 85 og 115
95 % score mellem 70 og 130
99,7 % score mellem 55 og 145

Denne regel gælder kun for normalfordelte data. For skæve eller tunge halefordelinger, brug Chebyshevs ulighed i stedet.

Varians vs standardafvigelse

Varians er den kvadrerede afvigelse (trin 5 ovenfor) — standardafvigelsen er dens kvadratrod. Begge måler spredning, men standardafvigelsen er udtrykt i de samme enheder som de originale data, hvilket gør dem mere fortolkelige.

Hvis dine data er i kilogram, er din standardafvigelse i kilogram. Din varians er i kilogram-kvadrat, hvilket er sværere at fortolke meningsfuldt.

Almindelige applikationer

Finans: Måling af investeringsvolatilitet. En aktie med daglige afkast med et højt SD er mere volatil – højere potentiel gevinst og højere potentiel tab.

Kvalitetskontrol: Fremstilling bruger SD for at sikre, at produkter forbliver inden for tolerancen. En proces med SD for stor producerer for mange defekte varer.

Uddannelse: Standardisering af testresultater. En z-score fortæller dig, hvor mange standardafvigelser en score ligger over eller under middelværdien: z = (x − middelværdi) / SD.

Videnskab: Udtrykker måleusikkerhed og sammenligning af eksperimentelle resultater.

Genvej til beregning

For store datasæt skal du bruge beregningsformlen, som undgår at beregne afvigelser individuelt:

s² = [Σx² − (Σx)²/n] / (n − 1)

Dette er matematisk ækvivalent, men kræver kun to gennemløb af dataene i stedet for tre.

Brug vores Standard Deviation Calculator til at beregne SD, varians og en fuldstændig opdeling for ethvert datasæt, du indtaster.