如何计算相关系数
皮尔逊相关系数 (r) 衡量两个变量之间线性关系的强度和方向。它的范围是-1到+1,其中+1是完全正相关,-1是完全负相关,0表示没有线性关系。
公式
r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² × Σ(yᵢ − ȳ)²]
分步示例
数据:x = {1, 2, 3, 4, 5},y = {2, 4, 5, 4, 5}
第 1 步: 计算平均值。 x̄ = 3, ų = 4
第 2 步: 计算偏差。
| xᵢ | yᵢ | (xᵢ−x̄) | (yᵢ−ş) | 产品 | (xᵢ−x̄)² | (yᵢ−ş)² |
|---|---|---|---|---|---|---|
| 1 | 2 | −2 | −2 | 4 | 4 | 4 |
| 2 | 4 | −1 | 0 | 0 | 1 | 0 |
| 3 | 5 | 0 | 1 | 0 | 0 | 1 |
| 4 | 4 | 1 | 0 | 0 | 1 | 0 |
| 5 | 5 | 2 | 1 | 2 | 4 | 1 |
第 3 步: 对列求和。 Σ 乘积 = 6,Σ(xᵢ−x̄)² = 10,Σ(yᵢ−ş)² = 6
第 4 步: 应用公式。 r = 6 / √(10 × 6) = 6 / √60 = 6 / 7.746 = 0.775
解释 r 值
| r值 | 解释 |
|---|---|
| 0.9至1.0 | 非常强的积极性 |
| 0.7至0.9 | 强阳性 |
| 0.5至0.7 | 中度阳性 |
| 0至0.5 | 弱阳性 |
| 0 | 没有线性关系 |
| 负值 | 大小相同,方向相反 |
重要警告
相关性并不意味着因果关系。高 r 值意味着两个变量一起移动,但无法告诉您原因或哪个变量导致哪个变量。
使用我们的相关系数计算器来分析任何数据集。