Як розрахувати коефіцієнт кореляції

Коефіцієнт кореляції Пірсона (r) вимірює силу та напрямок лінійного зв’язку між двома змінними. Він коливається від −1 до +1, де +1 — ідеальна позитивна кореляція, −1 — ідеальна негативна кореляція, а 0 означає відсутність лінійного зв’язку.

Формула

r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² × Σ(yᵢ − ȳ)²]

Покроковий приклад

Дані: x = {1, 2, 3, 4, 5}, y = {2, 4, 5, 4, 5}

Крок 1: Обчисліть середні. x̄ = 3, ȳ = 4

Крок 2: Обчисліть відхилення.

xᵢ yᵢ (xᵢ−x̄) (yᵢ−ȳ) Продукт (xᵢ−x̄)² (yᵢ−ȳ)²
1 2 −2 −2 4 4 4
2 4 −1 0 0 1 0
3 5 0 1 0 0 1
4 4 1 0 0 1 0
5 5 2 1 2 4 1

Крок 3: Підсумуйте стовпці. Σ продуктів = 6, Σ(xᵢ−x̄)² = 10, Σ(yᵢ−ȳ)² = 6

Крок 4: Застосуйте формулу. r = 6 / √(10 × 6) = 6 / √60 = 6 / 7,746 = 0,775

Інтерпретація значень r

Значення r Інтерпретація
0,9 до 1,0 Дуже сильний позитив
від 0,7 до 0,9 Сильний позитив
від 0,5 до 0,7 Помірний позитив
від 0 до 0,5 Слабкий позитив
0 Немає лінійного зв'язку
Від’ємні значення Той же масштаб, протилежний напрямок

Важливе застереження

Кореляція не передбачає причинного зв’язку. Високе значення r означає, що дві змінні рухаються разом, але не говорить вам, чому або що викликає яку.

Використовуйте наш калькулятор коефіцієнта кореляції для аналізу будь-якого набору даних.