Στατιστικά στοιχεία για αρχάριους: Μέσος όρος, SD, Δοκιμές Υποθέσεων και άλλα

Η στατιστική είναι η γλώσσα της αβεβαιότητας — το εργαλείο που μας επιτρέπει να βγάλουμε συμπεράσματα από ελλιπείς πληροφορίες. Είτε διαβάζετε μια δημοσκόπηση ειδήσεων, είτε ερμηνεύετε ένα αποτέλεσμα κλινικής δοκιμής είτε αναλύετε τα δικά σας δεδομένα, η κατανόηση αυτών των βασικών εννοιών θα σας κάνει πολύ πιο κριτικό αναγνώστη.

Περιγραφική Στατιστική: Συνοπτικά Δεδομένα

Για να μπορέσετε να αναλύσετε δεδομένα, πρέπει να τα περιγράψετε. Τα βασικά μέτρα είναι η κεντρική τάση (πού είναι η μέση;) και η διασπορά (πόσο μεταβλητά είναι τα δεδομένα;).

Μέσος όρος, διάμεσος και Λειτουργία

Ο αριθμητικός μέσος όρος είναι το άθροισμα διαιρούμενο με την καταμέτρηση. Είναι ο πιο γνωστός μέσος όρος, αλλά είναι πολύ ευαίσθητος σε ακραίες τιμές.

Η διάμεσος είναι η μεσαία τιμή κατά την ταξινόμηση των δεδομένων. Είναι πιο στιβαρό — μια μόνο ακραία τιμή δεν το μετακινεί πολύ.

Η λειτουργία είναι η πιο συχνή τιμή. Χρήσιμο για κατηγορικά δεδομένα. λιγότερο χρήσιμο για συνεχείς μετρήσεις.

Σύνολο δεδομένων	Μέσο	Διάμεσος	Τρόπος
2, 4, 4, 6, 8	4.8	4	4
2, 4, 4, 6, 100	23.2	4	4

Παρατηρήστε πώς μια ακραία τιμή (100) αλλάζει δραματικά τη μέση τιμή αλλά αφήνει ανέγγιχτη τη διάμεσο. Αυτός είναι ο λόγος για τον οποίο οι στατιστικές για τις τιμές των κατοικιών χρησιμοποιούν τη διάμεσο - μια χούφτα αρχοντικά πολλών εκατομμυρίων λιρών θα έκανε τις μέσες τιμές παραπλανητικές.

Τυπική απόκλιση και διακύμανση

Η διακύμανση μετρά τη μέση τετραγωνική απόκλιση από τον μέσο όρο:

σ² = Σ(xi - x̄)² / n

Η τυπική απόκλιση είναι η τετραγωνική ρίζα της διακύμανσης — είναι στις ίδιες μονάδες με τα αρχικά δεδομένα, γεγονός που τα καθιστά ερμηνεύσιμα:

σ = √[Σ(xi - x̄)² / n]

Ο κανόνας 68-95-99.7 για κανονικά κατανεμημένα δεδομένα:

Το 68% των τιμών εμπίπτουν σε 1 τυπική απόκλιση του μέσου όρου
95% εντός 2 τυπικών αποκλίσεων
99,7% εντός 3 τυπικών αποκλίσεων

Σημείωση: Χρησιμοποιήστε n στον παρονομαστή για την τυπική απόκλιση πληθυσμού. χρησιμοποιήστε το n−1 για μια εκτίμηση δείγματος (αυτή ονομάζεται διόρθωση Bessel και διορθώνει την ελαφρά υποεκτίμηση που συμβαίνει με τα δείγματα).

Η Κανονική Διανομή

Η κανονική (Gaussian) κατανομή είναι η καμπύλη σε σχήμα καμπάνας που εμφανίζεται παντού στη φύση και τις στατιστικές. Περιγράφεται πλήρως από δύο παραμέτρους: μέση (μ) και τυπική απόκλιση (σ).

Το z-score μετατρέπει οποιαδήποτε τιμή σε "πόσες τυπικές αποκλίσεις από τη μέση τιμή":

z = (x - μ) / σ

Ένα z-score 1,96 αντιστοιχεί στο 97,5ο εκατοστημόριο — η τιμή πάνω από την οποία βρίσκεται μόνο το 2,5% της κατανομής. Αυτό εμφανίζεται συνεχώς στα στατιστικά στοιχεία λόγω των διαστημάτων εμπιστοσύνης.

Το Κεντρικό οριακό θεώρημα είναι γιατί η κανονική κατανομή έχει τόση σημασία: ανεξάρτητα από το σχήμα του αρχικού πληθυσμού, η κατανομή των μέσων του δείγματος πλησιάζει την κανονικότητα καθώς αυξάνεται το μέγεθος του δείγματος. Αυτός είναι ο λόγος για τον οποίο τόσες πολλές στατιστικές δοκιμές υποθέτουν κανονικότητα ακόμη και όταν τα ακατέργαστα δεδομένα δεν διανέμονται κανονικά.

Διαστήματα εμπιστοσύνης

Ένα διάστημα εμπιστοσύνης 95% δεν σημαίνει ότι "υπάρχει 95% πιθανότητα η πραγματική τιμή να βρίσκεται σε αυτό το εύρος". Σημαίνει: "αν επαναλαμβάναμε αυτή τη διαδικασία δειγματοληψίας πολλές φορές, το 95% των διαστημάτων που υπολογίσαμε θα περιείχε την πραγματική τιμή."

Για μια αναλογία p από ένα δείγμα μεγέθους n:

CI = p ± z × √(p(1-p)/n)

Για 95% εμπιστοσύνη, z = 1,96. Για το 99%, z = 2.576.

Το περιθώριο σφάλματος είναι μόνο το ± μέρος: z × √(p(1-p)/n). Όταν μια δημοσκόπηση αναφέρει "±3 ποσοστιαίες μονάδες", αυτό είναι το περιθώριο σφάλματος.

Έλεγχος Υποθέσεων

Κάθε δοκιμή υπόθεσης ακολουθεί την ίδια δομή:

H₀ (μηδενική υπόθεση): Η προεπιλογή — συνήθως "καμία επίδραση", "καμία διαφορά", "καμία σχέση"
H1 (εναλλακτική υπόθεση): Αυτό για το οποίο προσπαθείτε να αποδείξετε
Στατιστικό δοκιμής: Ένας αριθμός που υπολογίζεται από τα δεδομένα που μετρά πόσο μακριά από το H₀ είναι τα δεδομένα
p-value: Η πιθανότητα παρατήρησης ενός αποτελέσματος τουλάχιστον σε αυτό το άκρο αν το H₀ ήταν αληθές

Επεξήγηση της τιμής p

Μια τιμή p 0,03 σημαίνει: "Εάν δεν υπήρχε πραγματικά κανένα αποτέλεσμα, θα βλέπαμε δεδομένα τόσο ακραία τυχαία μόνο στο 3% των περιπτώσεων." Αυτό συνήθως θεωρείται αρκετά σημαντικό ώστε να απορριφθεί το H0.

Τι p < 0,05 ΔΕΝ σημαίνει:

Δεν σημαίνει ότι υπάρχει 95% πιθανότητα το αποτέλεσμα να είναι πραγματικό
Δεν σημαίνει ότι το αποτέλεσμα είναι πρακτικά σημαντικό
Δεν σημαίνει ότι το H0 είναι ψευδές

Σφάλματα τύπου I και τύπου II:

	Το H₀ είναι αλήθεια	Το H₀ είναι ψευδές
Απορρίψτε το H₀	Σφάλμα τύπου I (ψευδώς θετικό)	Σωστός
Αποτυχία απόρριψης H₀	Σωστός	Σφάλμα τύπου II (ψευδώς αρνητικό)

α (επίπεδο σημαντικότητας) = Ποσοστό σφάλματος τύπου I, συνήθως 0,05 β = Ποσοστό σφάλματος τύπου II. Ισχύς = 1 − β, συνήθως στοχεύει στο 0,80

Το t-Test

Το τεστ t συγκρίνει τους μέσους όρους μεταξύ των ομάδων. Η στατιστική t δύο δειγμάτων είναι:

t = (x̄₁ - x̄₂) / √(s₁²/n₁ + s₂²/n₂)

Ένα μεγάλο |t| σημαίνει ότι οι ομάδες απέχουν πολύ μεταξύ τους σε σχέση με τη μεταβλητότητα εντός της ομάδας. Συγκρίνετε με μια κρίσιμη τιμή (ή υπολογίστε την τιμή p) με τους κατάλληλους βαθμούς ελευθερίας.

Πότε να το χρησιμοποιήσετε: Σύγκριση δύο μέσων από ανεξάρτητες ομάδες, όταν τα δεδομένα είναι περίπου κανονικά ή n > 30.

Συσχέτιση

Το r του Pearson μετρά την ισχύ της γραμμικής σχέσης μεταξύ δύο μεταβλητών:

r = +1: Τέλεια θετική γραμμική σχέση
r = 0: Καμία γραμμική σχέση
r = −1: Τέλεια αρνητική γραμμική σχέση

r = Σ(xi - x̄)(yi - ȳ) / √[Σ(xi - x̄)² × Σ(yi - ȳ)²]

Το R² (r τετράγωνο) σας λέει την αναλογία διακύμανσης στο Y που εξηγείται από το X. Εάν r = 0,7, τότε το R² = 0,49 — το X εξηγεί το 49% της μεταβλητότητας στο Y.

Το ρ του Spearman (rho) κάνει το ίδιο πράγμα, αλλά χρησιμοποιεί τάξεις και όχι ακατέργαστες τιμές, καθιστώντας το ανθεκτικό σε ακραίες τιμές και κατάλληλο για τακτικά δεδομένα.

Να θυμάστε: Συσχέτιση ≠ αιτιότητα. Οι πωλήσεις παγωτού και τα ποσοστά πνιγμού συσχετίζονται στενά (και τα δύο κορυφώνονται το καλοκαίρι), αλλά το παγωτό δεν προκαλεί πνιγμό.

Μέγεθος εφέ

Η στατιστική σημασία σας λέει εάν ένα αποτέλεσμα είναι πραγματικό. Το μέγεθος εφέ σας λέει πόσο μεγάλο είναι. Το d του Cohen για τη σύγκριση δύο μέσων:

d = (μ₁ - μ₂) / σ_pooled

Cohen's d	Ερμηνεία
0.2	Μικρό
0.5	Μέσον
0.8	Μεγάλο

Μια πολύ σημαντική τιμή p με d = 0,1 σημαίνει ότι έχετε εντοπίσει ένα πραγματικό αλλά ασήμαντο μικρό αποτέλεσμα — πιθανώς επειδή το δείγμα σας ήταν τεράστιο. Να αναφέρετε πάντα μεγέθη εφέ παράλληλα με τις τιμές p.

Τεστ Chi-Square

Το τεστ chi-square (χ²) ρωτά: "Διαφέρουν οι παρατηρούμενες μετρήσεις από αυτό που θα περιμέναμε τυχαία;"

χ² = Σ (Observed - Expected)² / Expected

Χρησιμοποιήστε το όταν τα δεδομένα σας είναι κατηγορηματικά — για παράδειγμα, ελέγχοντας εάν ένα ζάρι είναι δίκαιο ή εάν το αποτέλεσμα της θεραπείας είναι ανεξάρτητο από την ομάδα θεραπείας.

Επιλέγοντας το σωστό τεστ

Κατάσταση	Δοκιμή
Συγκρίνετε έναν μέσο όρο με μια γνωστή τιμή	Ένα δείγμα t-test
Συγκρίνετε δύο ανεξάρτητα μέσα	T-test δύο δειγμάτων
Συγκρίνετε δύο ζευγαρωμένα μέσα	Ζευγάρι t-test
Συγκρίνετε 3+ μέσα	ANOVA
Συγκρίνετε 3+ μέσα (μη κανονικά)	Kruskal-Wallis
Συσχέτιση μεταξύ δύο συνεχών μεταβλητών	Συσχέτιση Pearson/Spearman
Συγκρίνετε κατηγορικές αναλογίες	Τετράγωνο χι
Δύο ομάδες, μη κανονική κατανομή	Mann-Whitney U

Συνήθη λάθη

Κρυφάγος: Εκτέλεση επανειλημμένα και διακοπή όταν p < Το 0,05 διογκώνει δραματικά το σφάλμα τύπου I. Προγραμματίστε το μέγεθος του δείγματός σας πριν συλλέξετε δεδομένα.

Πολλαπλές συγκρίσεις: Η εκτέλεση 20 ανεξάρτητων δοκιμών στο α = 0,05 θα δώσει ένα ψευδώς θετικό κατά μέσο όρο. Χρησιμοποιήστε τη διόρθωση Bonferroni ή ελέγξτε το ποσοστό ψευδούς ανακάλυψης.

Παράβλεψη υποθέσεων: Τα περισσότερα τεστ προϋποθέτουν τυχαία δειγματοληψία, ανεξαρτησία παρατηρήσεων και (για τεστ t) κατά προσέγγιση κανονικότητα. Η παραβίαση αυτών υπονομεύει τα αποτελέσματα.

Χρησιμοποιήστε τον Z-Score Calculator, τον Sample Size Calculator, τον t-Test Calculator και τον [Correlation Calculator](/en/en/math/math/statistics/math.