Hoe de correlatiecoëfficiënt te berekenen

De Pearson-correlatiecoëfficiënt (r) meet de sterkte en richting van het lineaire verband tussen twee variabelen. Het varieert van −1 tot +1, waarbij +1 een perfecte positieve correlatie is, −1 een perfecte negatieve correlatie is en 0 betekent dat er geen lineaire relatie is.

De formule

r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² × Σ(yᵢ − ȳ)²]

Stapsgewijs voorbeeld

Gegevens: x = {1, 2, 3, 4, 5}, y = {2, 4, 5, 4, 5}

Stap 1: Bereken gemiddelden. x̄ = 3, ȳ = 4

Stap 2: Bereken afwijkingen.

xᵢ ja (xᵢ−x̄) (yᵢ−ȳ) Product (xᵢ−x̄)² (yᵢ−ȳ)²
1 2 −2 −2 4 4 4
2 4 −1 0 0 1 0
3 5 0 1 0 0 1
4 4 1 0 0 1 0
5 5 2 1 2 4 1

Stap 3: Tel de kolommen bij elkaar op. Σ producten = 6, Σ(xᵢ−x̄)² = 10, Σ(yᵢ−ȳ)² = 6

Stap 4: Pas de formule toe. r = 6 / √(10 × 6) = 6 / √60 = 6 / 7,746 = 0,775

R-waarden interpreteren

r Waarde Interpretatie
0,9 tot 1,0 Zeer sterk positief
0,7 tot 0,9 Sterk positief
0,5 tot 0,7 Matig positief
0 tot 0,5 Zwak positief
0 Geen lineair verband
Negatieve waarden Zelfde schaal, tegengestelde richting

Belangrijk voorbehoud

Correlatie impliceert geen oorzakelijk verband. Een hoge r-waarde betekent dat twee variabelen samen bewegen, maar vertelt je niet waarom of wat de oorzaak is.

Gebruik onze correlatiecoëfficiëntcalculator om elke dataset te analyseren.