Statistik untuk Pemula: Mean, SD, Uji Hipotesis, dan Lainnya

Statistik adalah bahasa ketidakpastian — alat yang memungkinkan kita menarik kesimpulan dari informasi yang tidak lengkap. Baik Anda membaca jajak pendapat berita, menafsirkan hasil uji klinis, atau menganalisis data Anda sendiri, memahami konsep inti ini akan membuat Anda menjadi pembaca yang jauh lebih kritis.

Statistik Deskriptif: Meringkas Data

Sebelum Anda dapat menganalisis data, Anda perlu mendeskripsikannya. Ukuran utamanya adalah kecenderungan sentral (di mana titik tengahnya?) dan sebaran (seberapa variabel datanya?).

Rata-rata, Median, dan Modus

Rata-rata aritmatika adalah jumlah dibagi hitungan. Ini adalah rata-rata yang paling umum tetapi sangat sensitif terhadap outlier.

median adalah nilai tengah saat data diurutkan. Ini lebih kuat — satu nilai ekstrem tidak akan banyak menggerakkannya.

mode adalah nilai yang paling sering muncul. Berguna untuk data kategorikal; kurang berguna untuk pengukuran berkelanjutan.

Kumpulan data	Berarti	median	Mode
2, 4, 4, 6, 8	4.8	4	4
2, 4, 4, 6, 100	23.2	4	4

Perhatikan bagaimana satu nilai ekstrim (100) mengubah mean secara dramatis namun mediannya tidak tersentuh. Inilah sebabnya mengapa statistik harga rumah menggunakan median — beberapa rumah mewah bernilai jutaan pound akan membuat harga rata-rata menyesatkan.

Standar Deviasi dan Varians

Varians mengukur deviasi kuadrat rata-rata dari mean:

σ² = Σ(xi - x̄)² / n

Deviasi standar adalah akar kuadrat dari varians — satuannya sama dengan data asli, sehingga dapat diinterpretasikan:

σ = √[Σ(xi - x̄)² / n]

Aturan 68-95-99.7 untuk data berdistribusi normal:

68% nilai berada dalam 1 standar deviasi mean
95% dalam 2 standar deviasi
99,7% dalam 3 standar deviasi

Catatan: Gunakan n sebagai penyebut simpangan baku populasi; gunakan n−1 untuk perkiraan sampel (ini disebut koreksi Bessel dan mengoreksi sedikit perkiraan perkiraan sampel).

Distribusi Normal

Distribusi normal (Gaussian) adalah kurva berbentuk lonceng yang muncul di mana-mana di alam dan statistik. Ini sepenuhnya dijelaskan oleh dua parameter: mean (μ) dan standar deviasi (σ).

z-score mengonversi nilai apa pun menjadi "berapa banyak standar deviasi dari mean":

z = (x - μ) / σ

Skor z sebesar 1,96 setara dengan persentil ke-97,5 — nilai yang di atasnya hanya terdapat 2,5% distribusinya. Hal ini muncul terus-menerus dalam statistik karena interval kepercayaan.

Teorema Batas Pusat adalah alasan mengapa distribusi normal sangat penting: apa pun bentuk populasi aslinya, distribusi rata-rata sampel mendekati normalitas seiring bertambahnya ukuran sampel. Inilah sebabnya mengapa begitu banyak uji statistik mengasumsikan normalitas meskipun data mentahnya tidak terdistribusi normal.

Interval Keyakinan

Interval kepercayaan 95% tidak berarti "ada kemungkinan 95% nilai sebenarnya berada dalam kisaran ini". Artinya: "jika kita mengulangi proses pengambilan sampel ini berkali-kali, 95% interval yang kita hitung akan mengandung nilai sebenarnya."

Untuk proporsi p dari sampel berukuran n:

CI = p ± z × √(p(1-p)/n)

Untuk keyakinan 95%, z = 1,96. Untuk 99%, z = 2,576.

Margin kesalahan hanyalah bagian ±: z × √(p(1-p)/n). Jika jajak pendapat melaporkan "±3 poin persentase", ini adalah margin kesalahan.

Pengujian Hipotesis

Setiap uji hipotesis mengikuti struktur yang sama:

H₀ (hipotesis nol): Defaultnya — biasanya "tidak ada efek", "tidak ada perbedaan", "tidak ada hubungan"
H₁ (hipotesis alternatif): Bukti apa yang ingin Anda tunjukkan
Statistik pengujian: Angka yang dihitung dari data yang mengukur seberapa jauh data tersebut dari H₀
nilai-p: Kemungkinan mengamati hasil setidaknya ekstrem ini jika H₀ benar

Nilai p Dijelaskan

Nilai p sebesar 0,03 berarti: "Jika memang tidak ada pengaruh, kita hanya akan melihat data ekstrem ini secara kebetulan hanya 3% dari keseluruhan waktu." Hal ini biasanya dianggap cukup signifikan untuk menolak H₀.

Apa hal < 0,05 TIDAK berarti: – Bukan berarti ada kemungkinan 95% efeknya nyata

Ini tidak berarti bahwa efeknya secara praktis penting
Ini tidak berarti H₀ salah

Kesalahan Tipe I dan Tipe II:

	H₀ benar	H₀ salah
Tolak H₀	Kesalahan tipe I (positif palsu)	Benar
Gagal menolak H₀	Benar	Kesalahan tipe II (negatif palsu)

α (tingkat signifikansi) = Tingkat kesalahan tipe I, biasanya 0,05 β = Tingkat kesalahan tipe II; Pangkat = 1 − β, biasanya ditargetkan pada 0,80

Uji-t

Uji-t membandingkan rata-rata antar kelompok. Statistik t dua sampel adalah:

t = (x̄₁ - x̄₂) / √(s₁²/n₁ + s₂²/n₂)

|t| yang besar berarti kelompok-kelompok tersebut berjauhan dibandingkan dengan variabilitas dalam kelompok. Bandingkan dengan nilai kritis (atau hitung nilai p) dengan derajat kebebasan yang sesuai.

Kapan menggunakannya: Membandingkan dua mean dari kelompok independen, ketika data mendekati normal atau n > 30.

Korelasi

R Pearson mengukur kekuatan hubungan linier antara dua variabel:

r = +1 : Hubungan linier positif sempurna
r = 0 : Tidak ada hubungan linier
r = −1: Hubungan linier negatif sempurna

r = Σ(xi - x̄)(yi - ȳ) / √[Σ(xi - x̄)² × Σ(yi - ȳ)²]

R² (r kuadrat) menunjukkan proporsi varians dalam Y yang dijelaskan oleh X. Jika r = 0,7, maka R² = 0,49 — X menjelaskan 49% variabilitas dalam Y.

ρ (rho) Spearman melakukan hal yang sama tetapi menggunakan peringkat, bukan nilai mentah, sehingga kuat terhadap outlier dan sesuai untuk data ordinal.

Ingat: Korelasi ≠ sebab akibat. Penjualan es krim dan tingkat tenggelam sangat berkorelasi (keduanya mencapai puncaknya pada musim panas), namun es krim tidak menyebabkan tenggelam.

Ukuran Efek

Signifikansi statistik memberi tahu Anda apakah suatu efek itu nyata; ukuran efek memberi tahu Anda seberapa besar efeknya. D Cohen untuk membandingkan dua cara:

d = (μ₁ - μ₂) / σ_pooled

Cohen d	Interpretasi
0.2	Kecil
0.5	Sedang
0.8	Besar

Nilai p yang sangat signifikan dengan d = 0,1 berarti Anda telah mendeteksi efek yang nyata namun kecil — mungkin karena sampel Anda sangat besar. Selalu laporkan ukuran efek bersama nilai-p.

Uji Chi-Kuadrat

Uji chi-kuadrat (χ²) menanyakan: "Apakah jumlah yang diamati berbeda dari perkiraan kita secara kebetulan?"

χ² = Σ (Observed - Expected)² / Expected

Gunakan ini ketika data Anda bersifat kategoris — misalnya, menguji apakah hasil pengobatan adil, atau apakah hasil pengobatan tidak tergantung pada kelompok perlakuan.

Memilih Tes yang Tepat

Situasi	Tes
Bandingkan satu mean dengan nilai yang diketahui	Uji-t satu sampel
Bandingkan dua cara independen	Uji-t dua sampel
Bandingkan dua cara berpasangan	Uji-t berpasangan
Bandingkan 3+ artinya	ANOVA
Bandingkan 3+ cara (tidak normal)	Kruskal-Wallis
Asosiasi antara dua variabel kontinu	Korelasi Pearson/Spearman
Bandingkan proporsi kategoris	Chi-kuadrat
Dua kelompok, distribusi tidak normal	Mann-Whitney U

Kesalahan Umum

Mengintip: Menjalankan pengujian Anda berulang kali dan berhenti ketika p < 0,05 meningkatkan kesalahan Tipe I secara dramatis. Rencanakan ukuran sampel Anda sebelum mengumpulkan data.

Beberapa perbandingan: Menjalankan 20 pengujian independen pada α = 0,05 akan menghasilkan rata-rata satu positif palsu. Gunakan koreksi Bonferroni atau kendalikan tingkat penemuan palsu.

Mengabaikan asumsi: Sebagian besar pengujian mengasumsikan pengambilan sampel secara acak, independensi observasi, dan (untuk pengujian t) perkiraan normalitas. Melanggar hal ini akan merusak hasil.

Gunakan Kalkulator Z-Score, Kalkulator Ukuran Sampel, Kalkulator Uji-t, dan Kalkulator Korelasi untuk mengerjakan data Anda sendiri.