Come calcolare la deviazione standard: passo dopo passo

La deviazione standard è la misura della diffusione più utilizzata nelle statistiche. Ti dice quanto un valore tipico si trova dalla media, se i tuoi dati sono strettamente raggruppati o ampiamente sparsi. Dopo aver eseguito il calcolo manualmente una volta, il concetto diventa intuitivo.

Cosa ti dice la deviazione standard

Se una classe di studenti ha un punteggio medio dell’esame pari a 70 con una deviazione standard di 5, la maggior parte dei punteggi è compresa tra 65 e 75. Se la deviazione standard fosse 20, i punteggi varierebbero molto più ampiamente, da 50 a 90 e oltre.

Una piccola deviazione standard significa coerenza. Uno grande significa variabilità.

Popolazione vs Deviazione standard campionaria

Esistono due versioni e scegliere quella giusta è importante:

Deviazione standard della popolazione (σ): da utilizzare quando disponi di dati per ogni membro del gruppo che ti interessa. Divide per n.

Deviazione standard del campione: Da utilizzare quando i dati sono un campione tratto da una popolazione più ampia. Divide per n − 1 (correzione di Bessel, che tiene conto dell'incertezza introdotta dal campionamento).

In pratica, si utilizza quasi sempre la deviazione standard del campione, a meno che non si stia analizzando un censimento completo o un set di dati controllato senza membri mancanti.

Calcolo passo dopo passo

Set di dati: 4, 7, 13, 2, 1 (un campione di 5 valori)

Passaggio 1: calcolare la media

Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4

Passaggio 2: trova ogni deviazione dalla media

Sottrai la media da ciascun valore:

Valore (x)	Deviazione (x − x̄)
4	4 − 5,4 = −1,4
7	7 − 5,4 = +1,6
13	13 − 5,4 = +7,6
2	2 − 5,4 = −3,4
1	1 − 5,4 = −4,4

Passaggio 3: quadra ogni deviazione

La quadratura elimina i segni negativi ed enfatizza le deviazioni maggiori:

Deviazione	Deviazione quadrata
−1.4	1.96
+1.6	2.56
+7.6	57.76
−3.4	11.56
−4.4	19.36

Passaggio 4: somma le deviazioni al quadrato

Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2

Passaggio 5: dividere per n − 1 (per la deviazione standard del campione)

Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3

Passaggio 6: calcola la radice quadrata

Standard deviation (s) = √23.3 = 4.83

Interpretazione: i valori in questo set di dati si trovano generalmente a circa 4,83 unità dalla media di 5,4.

La formula scritta

Deviazione standard del campione:

s = √[ Σ(x − x̄)² / (n − 1) ]

Deviazione standard della popolazione:

σ = √[ Σ(x − μ)² / n ]

Dove μ (mu) è la media della popolazione.

La regola empirica (regola 68-95-99.7)

Per i dati che seguono una distribuzione normale, la deviazione standard ha una relazione affidabile con la proporzione dei dati all'interno di ciascun intervallo:

Allineare	Proporzione dei dati
Media ± 1 DS	~68%
Media ± 2 DS	~95%
Media ± 3 DS	~99,7%

Esempio applicato: i punteggi del QI hanno una media di 100 e una deviazione standard di 15.

Il 68% delle persone ottiene un punteggio compreso tra 85 e 115
Punteggio del 95% compreso tra 70 e 130
99,7% punteggio compreso tra 55 e 145

Questa regola si applica solo ai dati distribuiti normalmente. Per distribuzioni asimmetriche o con coda pesante, utilizzare invece la disuguaglianza di Chebyshev.

Varianza rispetto alla deviazione standard

Varianza è la deviazione quadrata (passaggio 5 sopra) — la deviazione standard è la sua radice quadrata. Entrambi misurano la dispersione, ma la deviazione standard è espressa nelle stesse unità dei dati originali, rendendoli più interpretabili.

Se i tuoi dati sono in chilogrammi, la tua deviazione standard è in chilogrammi. La tua varianza è in chilogrammi quadrati, che è più difficile da interpretare in modo significativo.

Applicazioni comuni

Finanza: misurazione della volatilità degli investimenti. Un titolo con rendimenti giornalieri con una SD elevata è più volatile: guadagno potenziale più elevato e perdita potenziale più elevata.

Controllo qualità: La produzione utilizza SD per garantire che i prodotti rimangano entro i limiti di tolleranza. Un processo con SD troppo grande produce troppi articoli difettosi.

Istruzione: Standardizzazione dei punteggi dei test. Un punteggio z indica quante deviazioni standard un punteggio si trova sopra o sotto la media: z = (x − media) / DS.

Scienza: esprimere l'incertezza di misura e confrontare i risultati sperimentali.

Scorciatoia per il calcolo

Per set di dati di grandi dimensioni, utilizzare la formula di calcolo che evita di calcolare le deviazioni individualmente:

s² = [Σx² − (Σx)²/n] / (n − 1)

Ciò è matematicamente equivalente ma richiede solo due passaggi dei dati anziché tre.

Utilizza il nostro Calcolatore della deviazione standard per calcolare SD, varianza e una suddivisione completa per qualsiasi set di dati inserito.