Как да изчислим коефициента на корелация

Коефициентът на корелация на Пиърсън (r) измерва силата и посоката на линейната връзка между две променливи. Тя варира от −1 до +1, където +1 е перфектна положителна корелация, −1 е перфектна отрицателна корелация и 0 означава липса на линейна връзка.

Формулата

r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² × Σ(yᵢ − ȳ)²]

Пример стъпка по стъпка

Данни: x = {1, 2, 3, 4, 5}, y = {2, 4, 5, 4, 5}

Стъпка 1: Изчислете средните стойности. x̄ = 3, ȳ = 4

Стъпка 2: Изчислете отклоненията.

xᵢ yᵢ (xᵢ−x̄) (yᵢ−ȳ) Продукт (xᵢ−x̄)² (yᵢ−ȳ)²
1 2 −2 −2 4 4 4
2 4 −1 0 0 1 0
3 5 0 1 0 0 1
4 4 1 0 0 1 0
5 5 2 1 2 4 1

Стъпка 3: Сумирайте колоните. Σ продукти = 6, Σ(xᵢ−x̄)² = 10, Σ(yᵢ−ȳ)² = 6

Стъпка 4: Приложете формулата. r = 6 / √(10 × 6) = 6 / √60 = 6 / 7,746 = 0,775

Интерпретиране на r стойности

r Стойност Тълкуване
0,9 до 1,0 Много силен позитив
0,7 до 0,9 Силен положителен
0,5 до 0,7 Умерено положителен
0 до 0,5 Слабо положително
0 Няма линейна връзка
Отрицателни стойности Същият мащаб, противоположна посока

Важно предупреждение

Корелацията не предполага причинно-следствена връзка. Високата стойност на r означава, че две променливи се движат заедно, но не ви казва защо или кое кое причинява.

Използвайте нашия калкулатор за коефициент на корелация, за да анализирате всеки набор от данни.