Как да изчислим коефициента на корелация
Коефициентът на корелация на Пиърсън (r) измерва силата и посоката на линейната връзка между две променливи. Тя варира от −1 до +1, където +1 е перфектна положителна корелация, −1 е перфектна отрицателна корелация и 0 означава липса на линейна връзка.
Формулата
r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² × Σ(yᵢ − ȳ)²]
Пример стъпка по стъпка
Данни: x = {1, 2, 3, 4, 5}, y = {2, 4, 5, 4, 5}
Стъпка 1: Изчислете средните стойности. x̄ = 3, ȳ = 4
Стъпка 2: Изчислете отклоненията.
| xᵢ | yᵢ | (xᵢ−x̄) | (yᵢ−ȳ) | Продукт | (xᵢ−x̄)² | (yᵢ−ȳ)² |
|---|---|---|---|---|---|---|
| 1 | 2 | −2 | −2 | 4 | 4 | 4 |
| 2 | 4 | −1 | 0 | 0 | 1 | 0 |
| 3 | 5 | 0 | 1 | 0 | 0 | 1 |
| 4 | 4 | 1 | 0 | 0 | 1 | 0 |
| 5 | 5 | 2 | 1 | 2 | 4 | 1 |
Стъпка 3: Сумирайте колоните. Σ продукти = 6, Σ(xᵢ−x̄)² = 10, Σ(yᵢ−ȳ)² = 6
Стъпка 4: Приложете формулата. r = 6 / √(10 × 6) = 6 / √60 = 6 / 7,746 = 0,775
Интерпретиране на r стойности
| r Стойност | Тълкуване |
|---|---|
| 0,9 до 1,0 | Много силен позитив |
| 0,7 до 0,9 | Силен положителен |
| 0,5 до 0,7 | Умерено положителен |
| 0 до 0,5 | Слабо положително |
| 0 | Няма линейна връзка |
| Отрицателни стойности | Същият мащаб, противоположна посока |
Важно предупреждение
Корелацията не предполага причинно-следствена връзка. Високата стойност на r означава, че две променливи се движат заедно, но не ви казва защо или кое кое причинява.
Използвайте нашия калкулатор за коефициент на корелация, за да анализирате всеки набор от данни.