La deviazione standard è la misura della diffusione più utilizzata nelle statistiche. Ti dice quanto un valore tipico si trova dalla media, se i tuoi dati sono strettamente raggruppati o ampiamente sparsi. Dopo aver eseguito il calcolo manualmente una volta, il concetto diventa intuitivo.
Cosa ti dice la deviazione standard
Se una classe di studenti ha un punteggio medio dell’esame pari a 70 con una deviazione standard di 5, la maggior parte dei punteggi è compresa tra 65 e 75. Se la deviazione standard fosse 20, i punteggi varierebbero molto più ampiamente, da 50 a 90 e oltre.
Una piccola deviazione standard significa coerenza. Uno grande significa variabilità.
Popolazione vs Deviazione standard campionaria
Esistono due versioni e scegliere quella giusta è importante:
Deviazione standard della popolazione (σ): da utilizzare quando disponi di dati per ogni membro del gruppo che ti interessa. Divide per n.
Deviazione standard del campione: Da utilizzare quando i dati sono un campione tratto da una popolazione più ampia. Divide per n − 1 (correzione di Bessel, che tiene conto dell'incertezza introdotta dal campionamento).
In pratica, si utilizza quasi sempre la deviazione standard del campione, a meno che non si stia analizzando un censimento completo o un set di dati controllato senza membri mancanti.
Calcolo passo dopo passo
Set di dati: 4, 7, 13, 2, 1 (un campione di 5 valori)
Passaggio 1: calcolare la media
Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4
Passaggio 2: trova ogni deviazione dalla media
Sottrai la media da ciascun valore:
| Valore (x) | Deviazione (x − x̄) |
|---|---|
| 4 | 4 − 5,4 = −1,4 |
| 7 | 7 − 5,4 = +1,6 |
| 13 | 13 − 5,4 = +7,6 |
| 2 | 2 − 5,4 = −3,4 |
| 1 | 1 − 5,4 = −4,4 |
Passaggio 3: quadra ogni deviazione
La quadratura elimina i segni negativi ed enfatizza le deviazioni maggiori:
| Deviazione | Deviazione quadrata |
|---|---|
| −1.4 | 1.96 |
| +1.6 | 2.56 |
| +7.6 | 57.76 |
| −3.4 | 11.56 |
| −4.4 | 19.36 |
Passaggio 4: somma le deviazioni al quadrato
Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2
Passaggio 5: dividere per n − 1 (per la deviazione standard del campione)
Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3
Passaggio 6: calcola la radice quadrata
Standard deviation (s) = √23.3 = 4.83
Interpretazione: i valori in questo set di dati si trovano generalmente a circa 4,83 unità dalla media di 5,4.
La formula scritta
Deviazione standard del campione:
s = √[ Σ(x − x̄)² / (n − 1) ]
Deviazione standard della popolazione:
σ = √[ Σ(x − μ)² / n ]
Dove μ (mu) è la media della popolazione.
La regola empirica (regola 68-95-99.7)
Per i dati che seguono una distribuzione normale, la deviazione standard ha una relazione affidabile con la proporzione dei dati all'interno di ciascun intervallo:
| Allineare | Proporzione dei dati |
|---|---|
| Media ± 1 DS | ~68% |
| Media ± 2 DS | ~95% |
| Media ± 3 DS | ~99,7% |
Esempio applicato: i punteggi del QI hanno una media di 100 e una deviazione standard di 15.
- Il 68% delle persone ottiene un punteggio compreso tra 85 e 115
- Punteggio del 95% compreso tra 70 e 130
- 99,7% punteggio compreso tra 55 e 145
Questa regola si applica solo ai dati distribuiti normalmente. Per distribuzioni asimmetriche o con coda pesante, utilizzare invece la disuguaglianza di Chebyshev.
Varianza rispetto alla deviazione standard
Varianza è la deviazione quadrata (passaggio 5 sopra) — la deviazione standard è la sua radice quadrata. Entrambi misurano la dispersione, ma la deviazione standard è espressa nelle stesse unità dei dati originali, rendendoli più interpretabili.
Se i tuoi dati sono in chilogrammi, la tua deviazione standard è in chilogrammi. La tua varianza è in chilogrammi quadrati, che è più difficile da interpretare in modo significativo.
Applicazioni comuni
Finanza: misurazione della volatilità degli investimenti. Un titolo con rendimenti giornalieri con una SD elevata è più volatile: guadagno potenziale più elevato e perdita potenziale più elevata.
Controllo qualità: La produzione utilizza SD per garantire che i prodotti rimangano entro i limiti di tolleranza. Un processo con SD troppo grande produce troppi articoli difettosi.
Istruzione: Standardizzazione dei punteggi dei test. Un punteggio z indica quante deviazioni standard un punteggio si trova sopra o sotto la media: z = (x − media) / DS.
Scienza: esprimere l'incertezza di misura e confrontare i risultati sperimentali.
Scorciatoia per il calcolo
Per set di dati di grandi dimensioni, utilizzare la formula di calcolo che evita di calcolare le deviazioni individualmente:
s² = [Σx² − (Σx)²/n] / (n − 1)
Ciò è matematicamente equivalente ma richiede solo due passaggi dei dati anziché tre.
Utilizza il nostro Calcolatore della deviazione standard per calcolare SD, varianza e una suddivisione completa per qualsiasi set di dati inserito.