Varians mengukur seberapa tersebarnya sekumpulan angka dari rata-ratanya. Ini adalah salah satu konsep terpenting dalam statistik — digunakan di bidang keuangan untuk mengukur risiko investasi, dalam sains untuk menilai konsistensi eksperimen, dan dalam analisis data sehari-hari.
Apa itu Varians?
Varians adalah rata-rata selisih kuadrat dari mean. Varians yang rendah berarti titik-titik data mengelompok erat di sekitar rata-rata. Varians yang tinggi berarti tersebar luas.
Ada dua jenis:
- Varians populasi (σ²) — digunakan jika Anda memiliki data untuk seluruh populasi
- Sample variance (s²) — digunakan jika data Anda merupakan sampel dari populasi yang lebih besar
Dalam praktiknya, Anda hampir selalu menggunakan varians sampel.
Rumus Varians
Varians Populasi
σ² = Σ(xᵢ - μ)² / N
Di mana:
- xᵢ = setiap titik data
- μ = mean populasi
- N = jumlah titik data
Contoh Varians
s² = Σ(xᵢ - x̄)² / (n - 1)
Di mana:
- x̄ = mean sampel
- n - 1 = derajat kebebasan (koreksi Bessel)
CODE0 dalam varians sampel mengoreksi fakta bahwa sampel cenderung meremehkan penyebaran populasi yang sebenarnya.
Contoh Langkah demi Langkah
Kumpulan Data: 4, 8, 6, 5, 3, 2, 8, 9, 2, 5
Langkah 1: Hitung mean
Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
= 52 / 10
= 5.2
Langkah 2: Kurangi mean dari setiap nilai dan kuadratkan hasilnya
| Nilai | Nilai - Berarti | (Nilai - Rata-rata)² |
|---|---|---|
| 4 | 4 − 5.2 = −1.2 | 1.44 |
| 8 | 8 − 5,2 = 2,8 | 7.84 |
| 6 | 6 − 5,2 = 0,8 | 0.64 |
| 5 | 5 − 5,2 = −0,2 | 0.04 |
| 3 | 3 − 5.2 = −2.2 | 4.84 |
| 2 | 2 − 5.2 = −3.2 | 10.24 |
| 8 | 8 − 5,2 = 2,8 | 7.84 |
| 9 | 9 − 5,2 = 3,8 | 14.44 |
| 2 | 2 − 5.2 = −3.2 | 10.24 |
| 5 | 5 − 5,2 = −0,2 | 0.04 |
Langkah 3: Jumlahkan selisih kuadratnya
Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
= 57.6
Langkah 4: Bagi dengan n − 1 (variasi sampel)
s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4
Varians sampelnya adalah 6,4.
Varians vs Deviasi Standar
Deviasi standar hanyalah akar kuadrat dari varians:
s = √s² = √6.4 ≈ 2.53
Standar deviasi dinyatakan dalam satuan yang sama dengan data asli, sehingga lebih mudah untuk diinterpretasikan. Jika data Anda dalam kilogram, standar deviasinya dalam kilogram. Variansnya dalam kilogram². Inilah sebabnya deviasi standar lebih sering dilaporkan — namun varians digunakan dalam banyak perhitungan statistik.
Populasi vs Sampel: Kapan Menggunakan Masing-masing
| Situasi | Menggunakan |
|---|---|
| Anda memiliki data untuk setiap anggota grup | Varians populasi (± N) |
| Data Anda adalah sampel dari kelompok yang lebih besar | Varians sampel (± n − 1) |
| Dibandingkan dengan uji statistik lainnya | Biasanya varians sampel |
| Kumpulan data Anda adalah gambaran lengkapnya | Varians populasi |
Jika ragu, gunakan varians sampel. Sebagian besar kumpulan data di dunia nyata adalah sampel.
Mengapa Kita Mengkuadratkan Perbedaannya
Anda mungkin bertanya-tanya: mengapa tidak menghitung rata-rata perbedaan mentah dan rata-rata saja?
Masalahnya adalah penyimpangan positif dan negatif saling menghilangkan. Untuk dataset di atas, ada yang nilainya di atas mean dan ada yang di bawah. Jika Anda menjumlahkan semuanya tanpa mengkuadratkannya, Anda selalu mendapatkan nol.
Pengkuadratan menghilangkan tanda-tanda negatif, sehingga semua deviasi berkontribusi positif terhadap total penyebaran.
Aplikasi Praktis
Keuangan: Varians portofolio mengukur risiko investasi. Portofolio dengan varians 0,04 memiliki risiko yang lebih kecil dibandingkan portofolio dengan varians 0,16 — meskipun keduanya memiliki ekspektasi imbal hasil yang sama.
Kontrol kualitas: Proses manufaktur dengan varian rendah menghasilkan output yang lebih konsisten. Varians yang tinggi berarti hasil yang tidak dapat diprediksi.
Sains: Dalam eksperimen, variansi yang tinggi antara pengukuran berulang menunjukkan kesalahan pengukuran atau variabel yang tidak terkontrol.
Analisis olahraga: Varians performa pemain memberi tahu Anda apakah seorang pemain konsisten (varians rendah) atau beruntun (varians tinggi).
Kesalahan Umum
Menggunakan N dan bukannya n − 1 untuk sampel — Hal ini meremehkan varians populasi sebenarnya. Selalu gunakan n − 1 untuk data sampel.
Lupa mengkuadratkan — Kesalahan umum adalah merata-ratakan perbedaan mentah, bukan perbedaan kuadrat.
Varians yang membingungkan dengan rentang — Rentang hanyalah nilai maksimum dikurangi minimum. Varians mencakup semua titik data, bukan hanya titik ekstrem.
Referensi Cepat
| Rumus | Kapan harus digunakan |
|---|---|
| KODE0 | Populasi penuh |
| KODE0 | Sampel dari populasi |
| KODE0 | Untuk mendapatkan standar deviasi |
Baca Selanjutnya
- Cara Menghitung Deviasi Standar
- [Apa itu Deviasi Standar?](/en/blog/apa itu Deviasi Standar)
- Cara Mencari Median