Η διακύμανση μετρά την κατανομή ενός συνόλου αριθμών από τον μέσο όρο τους. Είναι μια από τις πιο σημαντικές έννοιες στις στατιστικές — χρησιμοποιείται στα οικονομικά για τη μέτρηση του επενδυτικού κινδύνου, στην επιστήμη για την αξιολόγηση της πειραματικής συνέπειας και στην καθημερινή ανάλυση δεδομένων.

Τι είναι η διακύμανση;

Η διακύμανση είναι ο μέσος όρος των τετράγωνων διαφορών από τον μέσο όρο. Μια χαμηλή απόκλιση σημαίνει ότι τα σημεία δεδομένων συγκεντρώνονται στενά γύρω από τον μέσο όρο. Μια υψηλή διακύμανση σημαίνει ότι είναι ευρέως διαδεδομένα.

Υπάρχουν δύο τύποι:

  • Διακύμανση πληθυσμού (σ²) — χρησιμοποιείται όταν έχετε δεδομένα για ολόκληρο τον πληθυσμό
  • Δειγματική διακύμανση (s²) — χρησιμοποιείται όταν τα δεδομένα σας είναι δείγμα από μεγαλύτερο πληθυσμό

Στην πράξη, σχεδόν πάντα θα χρησιμοποιείτε διακύμανση δείγματος.

Η Φόρμουλα Διακύμανσης

Διακύμανση πληθυσμού

σ² = Σ(xᵢ - μ)² / N

Οπου:

  • xᵢ = κάθε σημείο δεδομένων
  • μ = ο μέσος όρος του πληθυσμού
  • N = αριθμός σημείων δεδομένων

Δείγμα διακύμανσης

s² = Σ(xᵢ - x̄)² / (n - 1)

Οπου:

  • x̄ = ο μέσος όρος του δείγματος
  • n - 1 = βαθμοί ελευθερίας (διόρθωση Bessel)

Ο CODE0 στη διακύμανση του δείγματος διορθώνει το γεγονός ότι ένα δείγμα τείνει να υποτιμά την πραγματική εξάπλωση του πληθυσμού.

Παράδειγμα βήμα προς βήμα

Σύνολο δεδομένων: 4, 8, 6, 5, 3, 2, 8, 9, 2, 5

Βήμα 1: Υπολογίστε τη μέση τιμή

Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
     = 52 / 10
     = 5.2

Βήμα 2: Αφαιρέστε το μέσο όρο από κάθε τιμή και τετραγωνίστε το αποτέλεσμα

Αξία Τιμή − Μέση (Τιμή − Μέση)²
4 4 − 5,2 = −1,2 1.44
8 8 − 5,2 = 2,8 7.84
6 6 − 5,2 = 0,8 0.64
5 5 − 5,2 = −0,2 0.04
3 3 − 5,2 = −2,2 4.84
2 2 − 5,2 = −3,2 10.24
8 8 − 5,2 = 2,8 7.84
9 9 − 5,2 = 3,8 14.44
2 2 − 5,2 = −3,2 10.24
5 5 − 5,2 = −0,2 0.04

Βήμα 3: Αθροίστε τις τετράγωνες διαφορές

Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
             = 57.6

Βήμα 4: Διαιρέστε με n − 1 (διακύμανση δείγματος)

s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4

Η διακύμανση του δείγματος είναι 6,4.

Διακύμανση έναντι Τυπικής Απόκλισης

Η τυπική απόκλιση είναι απλώς η τετραγωνική ρίζα της διακύμανσης:

s = √s² = √6.4 ≈ 2.53

Η τυπική απόκλιση εκφράζεται στις ίδιες μονάδες με τα αρχικά δεδομένα, καθιστώντας ευκολότερη την ερμηνεία τους. Εάν τα δεδομένα σας είναι σε κιλά, η τυπική απόκλιση είναι σε κιλά. Η διακύμανση είναι σε kg². Αυτός είναι ο λόγος για τον οποίο η τυπική απόκλιση αναφέρεται πιο συχνά — αλλά η διακύμανση χρησιμοποιείται σε πολλούς στατιστικούς υπολογισμούς.

Πληθυσμός έναντι δείγματος: Πότε να χρησιμοποιείται το καθένα

Κατάσταση Χρήση
Έχετε δεδομένα για κάθε μέλος της ομάδας Διακύμανση πληθυσμού (÷ N)
Τα δεδομένα σας είναι δείγμα από μια μεγαλύτερη ομάδα Δειγματική διακύμανση (÷ n − 1)
Σε σύγκριση με άλλες στατιστικές δοκιμές Συνήθως διακύμανση δείγματος
Το σύνολο δεδομένων σας είναι η πλήρης εικόνα Διακύμανση πληθυσμού

Σε περίπτωση αμφιβολίας, χρησιμοποιήστε διακύμανση δείγματος. Τα περισσότερα σύνολα δεδομένων του πραγματικού κόσμου είναι δείγματα.

Γιατί τετραγωνίζουμε τις διαφορές

Ίσως αναρωτιέστε: γιατί να μην υπολογίζετε απλώς τις ακατέργαστες διαφορές από το μέσο όρο;

Το πρόβλημα είναι ότι οι θετικές και οι αρνητικές αποκλίσεις ακυρώνονται. Για το παραπάνω σύνολο δεδομένων, ορισμένες τιμές είναι πάνω από το μέσο όρο και ορισμένες είναι κάτω. Αν τα αθροίσετε όλα χωρίς να τετραγωνίσετε, παίρνετε πάντα μηδέν.

Ο τετραγωνισμός αφαιρεί τα αρνητικά πρόσημα, επομένως όλες οι αποκλίσεις συμβάλλουν θετικά στο συνολικό spread.

Πρακτικές Εφαρμογές

Οικονομικά: Η διακύμανση χαρτοφυλακίου μετρά τον επενδυτικό κίνδυνο. Ένα χαρτοφυλάκιο με διακύμανση 0,04 είναι λιγότερο επικίνδυνο από ένα με διακύμανση 0,16 — ακόμα κι αν και τα δύο έχουν την ίδια αναμενόμενη απόδοση.

Έλεγχος ποιότητας: Μια διαδικασία παραγωγής με χαμηλή διακύμανση παράγει πιο συνεπή απόδοση. Υψηλή διακύμανση σημαίνει απρόβλεπτα αποτελέσματα.

Επιστήμη: Σε πειράματα, η υψηλή διακύμανση μεταξύ επαναλαμβανόμενων μετρήσεων υποδηλώνει σφάλμα μέτρησης ή μη ελεγχόμενες μεταβλητές.

Αναλυτικά αθλητικών στοιχείων: Η διακύμανση απόδοσης παίκτη σάς λέει εάν ένας παίκτης είναι συνεπής (χαμηλή διακύμανση) ή γραμμωτός (υψηλή διακύμανση).

Συνήθη λάθη

Χρήση N αντί για n − 1 για δείγματα — Αυτό υποτιμά την πραγματική διακύμανση του πληθυσμού. Να χρησιμοποιείτε πάντα n − 1 για δείγματα δεδομένων.

Ξέχνα το τετράγωνο — Ένα συνηθισμένο σφάλμα είναι ο μέσος όρος των πρωτογενών διαφορών αντί των τετραγωνικών διαφορών.

Μπερδεύοντας τη διακύμανση με το εύρος — Το εύρος είναι απλώς το μέγιστο μείον το ελάχιστο. Η διακύμανση αφορά όλα τα σημεία δεδομένων, όχι μόνο τα ακραία σημεία.

Γρήγορη αναφορά

Τύπος Πότε να χρησιμοποιείται
ΚΩΔΙΚΟΣ 0 Πλήρης πληθυσμός
ΚΩΔΙΚΟΣ 0 Δείγμα από πληθυσμό
ΚΩΔΙΚΟΣ 0 Για να λάβετε τυπική απόκλιση

Διαβάστε στη συνέχεια