Как рассчитать коэффициент корреляции

Коэффициент корреляции Пирсона (r) измеряет силу и направление линейной связи между двумя переменными. Он варьируется от –1 до +1, где +1 – идеальная положительная корреляция, –1 – идеальная отрицательная корреляция, а 0 означает отсутствие линейной зависимости.

Формула

r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² × Σ(yᵢ − ȳ)²]

Пошаговый пример

Данные: x = {1, 2, 3, 4, 5}, y = {2, 4, 5, 4, 5}

Шаг 1. Вычислите средние значения. х̄ = 3, Ø = 4

Шаг 2. Рассчитайте отклонения.

хᵢ йᵢ (xᵢ−x̄) (йᵢ-ᳳ) Продукт (xᵢ−x̄)² (yᵢ-ᳳ)²
1 2 −2 −2 4 4 4
2 4 −1 0 0 1 0
3 5 0 1 0 0 1
4 4 1 0 0 1 0
5 5 2 1 2 4 1

Шаг 3. Суммируйте значения по столбцам. Σ продуктов = 6, Σ(xᵢ−x̄)² = 10, Σ(yᵢ−ş)² = 6

Шаг 4. Примените формулу. r = 6/√(10 × 6) = 6/√60 = 6/7,746 = 0,775

Интерпретация значений r

г Значение Интерпретация
от 0,9 до 1,0 Очень сильный позитив
от 0,7 до 0,9 Сильный позитив
от 0,5 до 0,7 Умеренный позитив
от 0 до 0,5 Слабый позитив
0 Нет линейной зависимости
Отрицательные значения Тот же масштаб, противоположное направление

Важное предостережение

Корреляция не подразумевает причинно-следственную связь. Высокое значение r означает, что две переменные движутся вместе, но не говорит вам, почему и что является причиной.

Используйте наш калькулятор коэффициентов корреляции для анализа любого набора данных.