Kuinka laskea korrelaatiokerroin

Pearson-korrelaatiokerroin (r) mittaa kahden muuttujan välisen lineaarisen suhteen voimakkuutta ja suuntaa. Se vaihtelee välillä −1:stä +1:een, missä +1 on täydellinen positiivinen korrelaatio, −1 on täydellinen negatiivinen korrelaatio ja 0 tarkoittaa, ettei lineaarista suhdetta ole.

Kaava

r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² × Σ(yᵢ − ȳ)²]

Vaiheittainen esimerkki

Tiedot: x = {1, 2, 3, 4, 5}, y = {2, 4, 5, 4, 5}

Vaihe 1: Laske keskiarvo. x̄ = 3, ȳ = 4

Vaihe 2: Laske poikkeamat.

xᵢ yᵢ (xᵢ−x̄) (yᵢ−ȳ) Tuote (xᵢ−x̄)² (yᵢ−ȳ)²
1 2 −2 −2 4 4 4
2 4 −1 0 0 1 0
3 5 0 1 0 0 1
4 4 1 0 0 1 0
5 5 2 1 2 4 1

Vaihe 3: Summaa sarakkeet. Σ tuotteet = 6, Σ(xᵢ−x̄)² = 10, Σ(yᵢ−ȳ)² = 6

Vaihe 4: Käytä kaavaa. r = 6 / √(10 × 6) = 6 / √60 = 6 / 7,746 = 0,775

R-arvojen tulkitseminen

r Arvo Tulkinta
0,9 - 1,0 Erittäin vahva positiivinen
0,7 - 0,9 Vahva positiivinen
0,5 - 0,7 Kohtalainen positiivinen
0 - 0,5 Heikko positiivinen
0 Ei lineaarista suhdetta
Negatiiviset arvot Sama mittakaava, vastakkainen suunta

Tärkeä huomautus

Korrelaatio ei tarkoita syy-yhteyttä. Korkea r-arvo tarkoittaa, että kaksi muuttujaa liikkuvat yhdessä, mutta ei kerro miksi tai mikä aiheuttaa kummankin.

Käytä korrelaatiokerroinlaskuriamme analysoidaksesi minkä tahansa tietojoukon.