Cum se calculează coeficientul de corelație

Coeficientul de corelație Pearson (r) măsoară puterea și direcția relației liniare dintre două variabile. Acesta variază de la -1 la +1, unde +1 este o corelație pozitivă perfectă, -1 este o corelație negativă perfectă și 0 înseamnă că nu există o relație liniară.

Formula

r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² × Σ(yᵢ − ȳ)²]

Exemplu pas cu pas

Date: x = {1, 2, 3, 4, 5}, y = {2, 4, 5, 4, 5}

Pasul 1: Calculați mediile. x̄ = 3, ȳ = 4

Pasul 2: Calculați abaterile.

xᵢ yᵢ (xᵢ−x̄) (yᵢ−ȳ) Produs (xᵢ−x̄)² (yᵢ−ȳ)²
1 2 −2 −2 4 4 4
2 4 −1 0 0 1 0
3 5 0 1 0 0 1
4 4 1 0 0 1 0
5 5 2 1 2 4 1

Pasul 3: Însumați coloanele. Σ produse = 6, Σ(xᵢ−x̄)² = 10, Σ(yᵢ−ȳ)² = 6

Pasul 4: Aplicați formula. r = 6 / √(10 × 6) = 6 / √60 = 6 / 7,746 = 0,775

Interpretarea valorilor r

r Valoare Interpretare
0,9 până la 1,0 Foarte puternic pozitiv
0,7 până la 0,9 Puternic pozitiv
0,5 până la 0,7 Moderat pozitiv
0 la 0,5 Slab pozitiv
0 Nicio relație liniară
Valori negative Aceeași scară, direcție opusă

Avertisment important

Corelația nu implică cauzalitate. O valoare r mare înseamnă că două variabile se mișcă împreună, dar nu vă spune de ce sau care cauzează care.

Utilizați calculatorul nostru de coeficient de corelație pentru a analiza orice set de date.