Standardavvikelse är det mest använda måttet på spridning i statistiken. Den talar om för dig hur långt ett typiskt värde ligger från medelvärdet – om dina data är tätt klustrade eller brett spridda. När du har arbetat igenom beräkningen för hand en gång blir konceptet intuitivt.
Vad standardavvikelsen säger dig
Om en klass av elever har ett genomsnittligt provpoäng på 70 med en standardavvikelse på 5, faller de flesta poäng mellan 65 och 75. Om standardavvikelsen var 20 skulle poängen variera mycket bredare - från 50 till 90 och däröver.
En liten standardavvikelse betyder konsekvens. En stor betyder variation.
Population vs Sample Standard Deviation
Det finns två versioner, och det är viktigt att välja rätt:
Befolkningsstandardavvikelse (σ): Använd när du har data för varje medlem i gruppen du bryr dig om. Dividerar med n.
Sample standardavvikelse(er): Använd när din data är ett urval från en större population. Dividerar med n − 1 (Bessels korrigering, som redogör för den osäkerhet som uppstår genom provtagning).
I praktiken använder du nästan alltid exempel på standardavvikelse - såvida du inte analyserar en fullständig folkräkning eller en kontrollerad datauppsättning utan saknade medlemmar.
Steg-för-steg-beräkning
Datamängd: 4, 7, 13, 2, 1 (ett urval av 5 värden)
Steg 1: Beräkna medelvärdet
Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4
Steg 2: Hitta varje avvikelse från medelvärdet
Subtrahera medelvärdet från varje värde:
| Värde (x) | Avvikelse (x − x̄) |
|---|---|
| 4 | 4 − 5,4 = −1,4 |
| 7 | 7 − 5,4 = +1,6 |
| 13 | 13 − 5,4 = +7,6 |
| 2 | 2 − 5,4 = −3,4 |
| 1 | 1 − 5,4 = −4,4 |
Steg 3: Kvadrera varje avvikelse
Kvadrering eliminerar negativa tecken och betonar större avvikelser:
| Avvikelse | Kvadratavvikelse |
|---|---|
| −1.4 | 1.96 |
| +1.6 | 2.56 |
| +7.6 | 57.76 |
| −3.4 | 11.56 |
| −4.4 | 19.36 |
Steg 4: Summa de kvadratiska avvikelserna
Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2
Steg 5: Dividera med n − 1 (för provets standardavvikelse)
Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3
Steg 6: Ta kvadratroten
Standard deviation (s) = √23.3 = 4.83
Tolkning: Värden i denna datauppsättning ligger vanligtvis cirka 4,83 enheter från medelvärdet på 5,4.
Formeln utskriven
Exempel på standardavvikelse:
s = √[ Σ(x − x̄)² / (n − 1) ]
Standardavvikelse för befolkningen:
σ = √[ Σ(x − μ)² / n ]
Där μ (mu) är populationsmedelvärdet.
Den empiriska regeln (68-95-99.7-regeln)
För data som följer en normalfördelning har standardavvikelsen ett tillförlitligt samband med andelen data inom varje område:
| Räckvidd | Andel data |
|---|---|
| Medelvärde ± 1 SD | ~68 % |
| Medelvärde ± 2 SD | ~95 % |
| Medelvärde ± 3 SD | ~99,7 % |
Tillämpat exempel: IQ-poäng har ett medelvärde på 100 och SD på 15.
- 68 % av människorna får mellan 85 och 115
- 95 % poäng mellan 70 och 130
- 99,7 % poäng mellan 55 och 145
Denna regel gäller endast normalfördelad data. Använd Chebyshevs ojämlikhet i stället för skeva eller tunga fördelningar.
Varians vs standardavvikelse
Varians är den kvadratiska avvikelsen (steg 5 ovan) — standardavvikelsen är dess kvadratrot. Båda mäter spridning, men standardavvikelsen uttrycks i samma enheter som originaldata, vilket gör den mer tolkningsbar.
Om din data är i kilogram är din standardavvikelse i kilogram. Din varians är i kilogram i kvadrat, vilket är svårare att tolka meningsfullt.
Vanliga applikationer
Finans: Mätning av investeringsvolatilitet. En aktie med daglig avkastning med ett högt SD är mer volatil – högre potentiell vinst och högre potentiell förlust.
Kvalitetskontroll: Tillverkning använder SD för att säkerställa att produkterna håller sig inom toleransen. En process med för stor SD ger för många defekta föremål.
Utbildning: Standardisering av testresultat. En z-poäng talar om hur många standardavvikelser en poäng ligger över eller under medelvärdet: z = (x − medelvärde) / SD.
Vetenskap: Uttrycker mätosäkerhet och jämför experimentella resultat.
Genväg för beräkning
För stora datamängder, använd beräkningsformeln som undviker att beräkna avvikelser individuellt:
s² = [Σx² − (Σx)²/n] / (n − 1)
Detta är matematiskt likvärdigt men kräver bara två genomgångar i data istället för tre.
Använd vår Standard Deviation Calculator för att beräkna SD, varians och en fullständig uppdelning för alla datauppsättningar du anger.