Как рассчитать коэффициент корреляции
Коэффициент корреляции Пирсона (r) измеряет силу и направление линейной связи между двумя переменными. Он варьируется от –1 до +1, где +1 – идеальная положительная корреляция, –1 – идеальная отрицательная корреляция, а 0 означает отсутствие линейной зависимости.
Формула
r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² × Σ(yᵢ − ȳ)²]
Пошаговый пример
Данные: x = {1, 2, 3, 4, 5}, y = {2, 4, 5, 4, 5}
Шаг 1. Вычислите средние значения. х̄ = 3, Ø = 4
Шаг 2. Рассчитайте отклонения.
| хᵢ | йᵢ | (xᵢ−x̄) | (йᵢ-ᳳ) | Продукт | (xᵢ−x̄)² | (yᵢ-ᳳ)² |
|---|---|---|---|---|---|---|
| 1 | 2 | −2 | −2 | 4 | 4 | 4 |
| 2 | 4 | −1 | 0 | 0 | 1 | 0 |
| 3 | 5 | 0 | 1 | 0 | 0 | 1 |
| 4 | 4 | 1 | 0 | 0 | 1 | 0 |
| 5 | 5 | 2 | 1 | 2 | 4 | 1 |
Шаг 3. Суммируйте значения по столбцам. Σ продуктов = 6, Σ(xᵢ−x̄)² = 10, Σ(yᵢ−ş)² = 6
Шаг 4. Примените формулу. r = 6/√(10 × 6) = 6/√60 = 6/7,746 = 0,775
Интерпретация значений r
| г Значение | Интерпретация |
|---|---|
| от 0,9 до 1,0 | Очень сильный позитив |
| от 0,7 до 0,9 | Сильный позитив |
| от 0,5 до 0,7 | Умеренный позитив |
| от 0 до 0,5 | Слабый позитив |
| 0 | Нет линейной зависимости |
| Отрицательные значения | Тот же масштаб, противоположное направление |
Важное предостережение
Корреляция не подразумевает причинно-следственную связь. Высокое значение r означает, что две переменные движутся вместе, но не говорит вам, почему и что является причиной.
Используйте наш калькулятор коэффициентов корреляции для анализа любого набора данных.