Standardavvikelse är det mest använda måttet på spridning i statistiken. Den talar om för dig hur långt ett typiskt värde ligger från medelvärdet – om dina data är tätt klustrade eller brett spridda. När du har arbetat igenom beräkningen för hand en gång blir konceptet intuitivt.

Vad standardavvikelsen säger dig

Om en klass av elever har ett genomsnittligt provpoäng på 70 med en standardavvikelse på 5, faller de flesta poäng mellan 65 och 75. Om standardavvikelsen var 20 skulle poängen variera mycket bredare - från 50 till 90 och däröver.

En liten standardavvikelse betyder konsekvens. En stor betyder variation.

Population vs Sample Standard Deviation

Det finns två versioner, och det är viktigt att välja rätt:

Befolkningsstandardavvikelse (σ): Använd när du har data för varje medlem i gruppen du bryr dig om. Dividerar med n.

Sample standardavvikelse(er): Använd när din data är ett urval från en större population. Dividerar med n − 1 (Bessels korrigering, som redogör för den osäkerhet som uppstår genom provtagning).

I praktiken använder du nästan alltid exempel på standardavvikelse - såvida du inte analyserar en fullständig folkräkning eller en kontrollerad datauppsättning utan saknade medlemmar.

Steg-för-steg-beräkning

Datamängd: 4, 7, 13, 2, 1 (ett urval av 5 värden)

Steg 1: Beräkna medelvärdet

Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4

Steg 2: Hitta varje avvikelse från medelvärdet

Subtrahera medelvärdet från varje värde:

Värde (x) Avvikelse (x − x̄)
4 4 − 5,4 = −1,4
7 7 − 5,4 = +1,6
13 13 − 5,4 = +7,6
2 2 − 5,4 = −3,4
1 1 − 5,4 = −4,4

Steg 3: Kvadrera varje avvikelse

Kvadrering eliminerar negativa tecken och betonar större avvikelser:

Avvikelse Kvadratavvikelse
−1.4 1.96
+1.6 2.56
+7.6 57.76
−3.4 11.56
−4.4 19.36

Steg 4: Summa de kvadratiska avvikelserna

Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2

Steg 5: Dividera med n − 1 (för provets standardavvikelse)

Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3

Steg 6: Ta kvadratroten

Standard deviation (s) = √23.3 = 4.83

Tolkning: Värden i denna datauppsättning ligger vanligtvis cirka 4,83 enheter från medelvärdet på 5,4.

Formeln utskriven

Exempel på standardavvikelse:

s = √[ Σ(x − x̄)² / (n − 1) ]

Standardavvikelse för befolkningen:

σ = √[ Σ(x − μ)² / n ]

Där μ (mu) är populationsmedelvärdet.

Den empiriska regeln (68-95-99.7-regeln)

För data som följer en normalfördelning har standardavvikelsen ett tillförlitligt samband med andelen data inom varje område:

Räckvidd Andel data
Medelvärde ± 1 SD ~68 %
Medelvärde ± 2 SD ~95 %
Medelvärde ± 3 SD ~99,7 %

Tillämpat exempel: IQ-poäng har ett medelvärde på 100 och SD på 15.

  • 68 % av människorna får mellan 85 och 115
  • 95 % poäng mellan 70 och 130
  • 99,7 % poäng mellan 55 och 145

Denna regel gäller endast normalfördelad data. Använd Chebyshevs ojämlikhet i stället för skeva eller tunga fördelningar.

Varians vs standardavvikelse

Varians är den kvadratiska avvikelsen (steg 5 ovan) — standardavvikelsen är dess kvadratrot. Båda mäter spridning, men standardavvikelsen uttrycks i samma enheter som originaldata, vilket gör den mer tolkningsbar.

Om din data är i kilogram är din standardavvikelse i kilogram. Din varians är i kilogram i kvadrat, vilket är svårare att tolka meningsfullt.

Vanliga applikationer

Finans: Mätning av investeringsvolatilitet. En aktie med daglig avkastning med ett högt SD är mer volatil – högre potentiell vinst och högre potentiell förlust.

Kvalitetskontroll: Tillverkning använder SD för att säkerställa att produkterna håller sig inom toleransen. En process med för stor SD ger för många defekta föremål.

Utbildning: Standardisering av testresultat. En z-poäng talar om hur många standardavvikelser en poäng ligger över eller under medelvärdet: z = (x − medelvärde) / SD.

Vetenskap: Uttrycker mätosäkerhet och jämför experimentella resultat.

Genväg för beräkning

För stora datamängder, använd beräkningsformeln som undviker att beräkna avvikelser individuellt:

s² = [Σx² − (Σx)²/n] / (n − 1)

Detta är matematiskt likvärdigt men kräver bara två genomgångar i data istället för tre.

Använd vår Standard Deviation Calculator för att beräkna SD, varians och en fullständig uppdelning för alla datauppsättningar du anger.