Η τυπική απόκλιση είναι το πιο ευρέως χρησιμοποιούμενο μέτρο διασποράς στα στατιστικά στοιχεία. Σας λέει πόσο απέχει μια τυπική τιμή από τη μέση τιμή — είτε τα δεδομένα σας είναι στενά συγκεντρωμένα είτε ευρέως διασκορπισμένα. Αφού επεξεργαστείτε τον υπολογισμό με το χέρι μία φορά, η ιδέα γίνεται διαισθητική.
Τι σας λέει η τυπική απόκλιση
Εάν μια τάξη μαθητών έχει μέση βαθμολογία εξετάσεων 70 με τυπική απόκλιση 5, οι περισσότερες βαθμολογίες πέφτουν μεταξύ 65 και 75. Εάν η τυπική απόκλιση ήταν 20, οι βαθμολογίες θα κυμαίνονταν πολύ ευρύτερα — από 50 έως 90 και περισσότερο.
Μια μικρή τυπική απόκλιση σημαίνει συνέπεια. Ένα μεγάλο σημαίνει μεταβλητότητα.
Πληθυσμός έναντι τυπικής απόκλισης δείγματος
Υπάρχουν δύο εκδόσεις και η επιλογή της σωστής έχει σημασία:
Τυπική απόκλιση πληθυσμού (σ): Χρησιμοποιείται όταν έχετε δεδομένα για κάθε μέλος της ομάδας που σας ενδιαφέρει. Διαιρείται με n.
Δείγμα τυπικής απόκλισης (ες): Χρησιμοποιείται όταν τα δεδομένα σας είναι δείγμα που προέρχονται από μεγαλύτερο πληθυσμό. Διαιρείται με n − 1 (διόρθωση Bessel, η οποία εξηγεί την αβεβαιότητα που εισάγεται με τη δειγματοληψία).
Στην πράξη, σχεδόν πάντα χρησιμοποιείτε τυπική απόκλιση δείγματος — εκτός εάν αναλύετε μια πλήρη απογραφή ή ένα ελεγχόμενο σύνολο δεδομένων χωρίς μέλη που λείπουν.
Υπολογισμός βήμα προς βήμα
Σύνολο δεδομένων: 4, 7, 13, 2, 1 (ένα δείγμα 5 τιμών)
Βήμα 1: Υπολογίστε τη μέση τιμή
Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4
Βήμα 2: Βρείτε κάθε απόκλιση από τη μέση τιμή
Αφαιρέστε το μέσο όρο από κάθε τιμή:
| Τιμή (x) | Απόκλιση (x − x̄) |
|---|---|
| 4 | 4 − 5,4 = −1,4 |
| 7 | 7 − 5,4 = +1,6 |
| 13 | 13 − 5,4 = +7,6 |
| 2 | 2 − 5,4 = −3,4 |
| 1 | 1 − 5,4 = −4,4 |
Βήμα 3: Τετράγωνο κάθε απόκλιση
Ο τετραγωνισμός εξαλείφει τα αρνητικά σημάδια και τονίζει μεγαλύτερες αποκλίσεις:
| Παρέκκλιση | Τετράγωνη απόκλιση |
|---|---|
| −1.4 | 1.96 |
| +1.6 | 2.56 |
| +7.6 | 57.76 |
| −3.4 | 11.56 |
| −4.4 | 19.36 |
Βήμα 4: Αθροίστε τις τετραγωνικές αποκλίσεις
Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2
Βήμα 5: Διαιρέστε με n − 1 (για τυπική απόκλιση δείγματος)
Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3
Βήμα 6: Πάρτε την τετραγωνική ρίζα
Standard deviation (s) = √23.3 = 4.83
Ερμηνεία: Οι τιμές σε αυτό το σύνολο δεδομένων βρίσκονται συνήθως περίπου 4,83 μονάδες μακριά από το μέσο όρο του 5,4.
Η Φόρμουλα Διαγράφεται
Δείγμα τυπικής απόκλισης:
s = √[ Σ(x − x̄)² / (n − 1) ]
Τυπική απόκλιση πληθυσμού:
σ = √[ Σ(x − μ)² / n ]
Όπου μ (mu) είναι ο μέσος όρος του πληθυσμού.
Ο εμπειρικός κανόνας (κανόνας 68-95-99.7)
Για δεδομένα που ακολουθούν μια κανονική κατανομή, η τυπική απόκλιση έχει μια αξιόπιστη σχέση με την αναλογία δεδομένων σε κάθε εύρος:
| Σειρά | Αναλογία δεδομένων |
|---|---|
| Μέση τιμή ± 1 SD | ~68% |
| Μέση τιμή ± 2 SD | ~95% |
| Μέση τιμή ± 3 SD | ~99,7% |
Εφαρμοσμένο παράδειγμα: Οι βαθμολογίες IQ έχουν μέσο όρο 100 και SD 15.
- Το 68% των ανθρώπων σκοράρει μεταξύ 85 και 115
- 95% βαθμολογία μεταξύ 70 και 130
- 99,7% βαθμολογία μεταξύ 55 και 145
Αυτός ο κανόνας ισχύει μόνο για κανονικά κατανεμημένα δεδομένα. Για λοξές ή βαριές κατανομές, χρησιμοποιήστε την ανισότητα του Chebyshev.
Διακύμανση έναντι Τυπικής Απόκλισης
Η διακύμανση είναι η τετραγωνική απόκλιση (βήμα 5 παραπάνω) — η τυπική απόκλιση είναι η τετραγωνική της ρίζα. Και τα δύο μετρούν την εξάπλωση, αλλά η τυπική απόκλιση εκφράζεται στις ίδιες μονάδες με τα αρχικά δεδομένα, καθιστώντας τα πιο ερμηνεύσιμα.
Εάν τα δεδομένα σας είναι σε κιλά, η τυπική απόκλιση είναι σε κιλά. Η διακύμανσή σας είναι σε κιλά-τετράγωνο, κάτι που είναι πιο δύσκολο να ερμηνευτεί με νόημα.
Κοινές εφαρμογές
Οικονομικά: Μέτρηση της αστάθειας των επενδύσεων. Μια μετοχή με ημερήσιες αποδόσεις με υψηλή SD είναι πιο ασταθής — υψηλότερο δυνητικό κέρδος και υψηλότερη πιθανή απώλεια.
Έλεγχος ποιότητας: Η κατασκευή χρησιμοποιεί SD για να διασφαλίσει ότι τα προϊόντα παραμένουν εντός ανοχής. Μια διαδικασία με πολύ μεγάλο SD παράγει πάρα πολλά ελαττωματικά στοιχεία.
Εκπαίδευση: Τυποποίηση βαθμολογιών τεστ. Μια βαθμολογία z σας λέει πόσες τυπικές αποκλίσεις βρίσκεται μια βαθμολογία πάνω ή κάτω από τη μέση τιμή: z = (x − μέσος όρος) / SD.
Επιστήμη: Έκφραση αβεβαιότητας μέτρησης και σύγκριση πειραματικών αποτελεσμάτων.
Συντόμευση για τον υπολογισμό
Για μεγάλα σύνολα δεδομένων, χρησιμοποιήστε τον υπολογιστικό τύπο που αποφεύγει τον μεμονωμένο υπολογισμό των αποκλίσεων:
s² = [Σx² − (Σx)²/n] / (n − 1)
Αυτό είναι μαθηματικά ισοδύναμο, αλλά απαιτεί μόνο δύο περάσματα μέσω των δεδομένων και όχι τρία.
Χρησιμοποιήστε τον Τυπική Υπολογιστής απόκλισης για να υπολογίσετε το SD, τη διακύμανση και μια πλήρη ανάλυση για κάθε σύνολο δεδομένων που εισάγετε.