Standardafvigelse er det mest anvendte mål for spredning i statistik. Det fortæller dig, hvor spredte værdier er omkring middelværdien. Denne vejledning forklarer det fra de første principper med gennemarbejdede eksempler.

Hvad standardafvigelse fortæller dig

Middelværdien fortæller dig midten af ​​et datasæt. Standardafvigelse fortæller dig, hvor langt værdier typisk afviger fra dette centrum.

Lav standardafvigelse → værdier samlet tæt omkring middelværdien Høj standardafvigelse → værdier spredt ud fra gennemsnittet

To eksamensklasser har begge et gennemsnit på 70 %, men:

  • Klasse A: score på 68, 69, 70, 71, 72 — SD ≈ 1,4 (meget konsistent)
  • Klasse B: score på 40, 55, 70, 85, 100 - SD ≈ 22,4 (meget variabel)

Samme middelværdi, meget forskellige fordelinger.

Formlen

Der er to versioner afhængigt af, om du har hele populationen eller en stikprøve.

Populationsstandardafvigelse (σ)

Bruges, når du har data for hvert medlem af gruppen.

σ = √((Σ(x_i - μ)^2) / (N))

Eksempel på standardafvigelse (s)

Bruges, når dine data er en stikprøve fra en større population (det mest almindelige tilfælde).

s = √( Σ(x_i − x̄)² / (n − 1) )

Nævneren er n − 1 (ikke n) for at korrigere for den skævhed, der kommer ved at estimere en populationsparameter fra en stikprøve. Dette kaldes Bessels rettelse.

Trin-for-trin-beregning

Datasæt: Testresultater for 6 elever: 72, 85, 68, 91, 74, 80

Trin 1: Find middelværdien

x̄ = (72 + 85 + 68 + 91 + 74 + 80) / (6) = (470) / (6) = 78.33

Trin 2: Find hver afvigelse fra gennemsnittet

Score Afvigelse (x − x̄) Kvadratafvigelse
72 −6.33 40.07
85 +6.67 44.49
68 −10.33 106.71
91 +12.67 160.53
74 −4,33 18.75
80 +1.67 2.79

Trin 3: Sum de kvadrerede afvigelser

Σ(x - x̄)^2 = 40.07 + 44.49 + 106.71 + 160.53 + 18.75 + 2.79 = 373.34

Trin 4: Divider med n − 1 (eksempel)

(373.34) / (6 - 1) = (373.34) / (5) = 74.67

Trin 5: Tag kvadratroden

s = √(74.67) = 8.64

Standardafvigelsen er 8,64 point. En typisk elevscore er omkring 8-9 point væk fra klassegennemsnittet.

68-95-99.7-reglen

For normalfordelte data (klokkekurve) har standardafvigelsen et forudsigeligt forhold til spredningen:

  • 68 % af værdierne falder inden for 1 SD af middelværdien
  • 95 % af værdierne falder inden for 2 SD af middelværdien
  • 99,7% af værdierne falder inden for 3 SD af gennemsnittet

Anvendt på vores eksempel (gennemsnit = 78,33, SD = 8,64):

  • 68 % af scores: 78,33 ± 8,64 → 69,7 til 86,97
  • 95 % af scores: 78,33 ± 17,28 → 61,05 til 95,61
  • 99,7 % af scores: 78,33 ± 25,92 → 52,41 til 104,25

Varians vs standardafvigelse

Varians er den kvadrerede standardafvigelse: s² = 74,67 i vores eksempel.

Hvorfor bruge standardafvigelse i stedet for varians?

  • Standardafvigelse er i de samme enheder som dine data (point, dollars, meter)
  • Varians er i kvadratiske enheder - sværere at fortolke praktisk
  • "Den gennemsnitlige score afvigede med 8,64 point" er meningsfuld; "variansen var 74,67 point²" er ikke

Anvendelser i den virkelige verden

Finans: En aktie med daglige afkast i gennemsnit på 0,05 % og SD på 1,2 % er meget mere risikabel end en aktie med samme gennemsnitlige afkast og SD på 0,3 %. Standardafvigelse er grundlaget for volatilitetsmåling.

Fremstilling: En fabrik, der producerer bolte med en måldiameter på 10 mm og SD på 0,02 mm er langt mere konsekvent end en med SD på 0,5 mm. Kvalitetskontrol er afhængig af SD.

Medicin: Kliniske forsøg rapporterer SD sammen med midler til at vise, hvor konsekvent en behandling fungerede på tværs af patienter.

Vejret: "Gennemsnitstemperatur 18°C ​​med SD 4°C" fortæller dig langt mere end gennemsnittet alene - du ved, hvad du skal pakke.

Z-score

En z-score konverterer enhver værdi til standardafvigelsesenheder, hvilket muliggør sammenligning på tværs af forskellige datasæt:

z = /x - x̄s

En elev scorer 91 i vores eksempel:

z = (91 - 78.33) / (8.64) = (12.67) / (8.64) = +1.47

Denne score er 1,47 standardafvigelser over gennemsnittet - bedre end omkring 93% af klassen.

Beregn standardafvigelsen nu

Vores statistikberegner beregner standardafvigelse, varians, middelværdi, median, tilstand og mere fra ethvert datasæt, du indtaster. Indsæt dine numre og få fulde resultater med det samme.