Як розрахувати коефіцієнт кореляції
Коефіцієнт кореляції Пірсона (r) вимірює силу та напрямок лінійного зв’язку між двома змінними. Він коливається від −1 до +1, де +1 — ідеальна позитивна кореляція, −1 — ідеальна негативна кореляція, а 0 означає відсутність лінійного зв’язку.
Формула
r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² × Σ(yᵢ − ȳ)²]
Покроковий приклад
Дані: x = {1, 2, 3, 4, 5}, y = {2, 4, 5, 4, 5}
Крок 1: Обчисліть середні. x̄ = 3, ȳ = 4
Крок 2: Обчисліть відхилення.
| xᵢ | yᵢ | (xᵢ−x̄) | (yᵢ−ȳ) | Продукт | (xᵢ−x̄)² | (yᵢ−ȳ)² |
|---|---|---|---|---|---|---|
| 1 | 2 | −2 | −2 | 4 | 4 | 4 |
| 2 | 4 | −1 | 0 | 0 | 1 | 0 |
| 3 | 5 | 0 | 1 | 0 | 0 | 1 |
| 4 | 4 | 1 | 0 | 0 | 1 | 0 |
| 5 | 5 | 2 | 1 | 2 | 4 | 1 |
Крок 3: Підсумуйте стовпці. Σ продуктів = 6, Σ(xᵢ−x̄)² = 10, Σ(yᵢ−ȳ)² = 6
Крок 4: Застосуйте формулу. r = 6 / √(10 × 6) = 6 / √60 = 6 / 7,746 = 0,775
Інтерпретація значень r
| Значення r | Інтерпретація |
|---|---|
| 0,9 до 1,0 | Дуже сильний позитив |
| від 0,7 до 0,9 | Сильний позитив |
| від 0,5 до 0,7 | Помірний позитив |
| від 0 до 0,5 | Слабкий позитив |
| 0 | Немає лінійного зв'язку |
| Від’ємні значення | Той же масштаб, протилежний напрямок |
Важливе застереження
Кореляція не передбачає причинного зв’язку. Високе значення r означає, що дві змінні рухаються разом, але не говорить вам, чому або що викликає яку.
Використовуйте наш калькулятор коефіцієнта кореляції для аналізу будь-якого набору даних.