如何计算相关系数

皮尔逊相关系数 (r) 衡量两个变量之间线性关系的强度和方向。它的范围是-1到+1,其中+1是完全正相关,-1是完全负相关,0表示没有线性关系。

公式

r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² × Σ(yᵢ − ȳ)²]

分步示例

数据:x = {1, 2, 3, 4, 5},y = {2, 4, 5, 4, 5}

第 1 步: 计算平均值。 x̄ = 3, ų = 4

第 2 步: 计算偏差。

xᵢ yᵢ (xᵢ−x̄) (yᵢ−ş) 产品 (xᵢ−x̄)² (yᵢ−ş)²
1 2 −2 −2 4 4 4
2 4 −1 0 0 1 0
3 5 0 1 0 0 1
4 4 1 0 0 1 0
5 5 2 1 2 4 1

第 3 步: 对列求和。 Σ 乘积 = 6,Σ(xᵢ−x̄)² = 10,Σ(yᵢ−ş)² = 6

第 4 步: 应用公式。 r = 6 / √(10 × 6) = 6 / √60 = 6 / 7.746 = 0.775

解释 r 值

r值 解释
0.9至1.0 非常强的积极性
0.7至0.9 强阳性
0.5至0.7 中度阳性
0至0.5 弱阳性
0 没有线性关系
负值 大小相同,方向相反

重要警告

相关性并不意味着因果关系。高 r 值意味着两个变量一起移动,但无法告诉您原因或哪个变量导致哪个变量。

使用我们的相关系数计算器来分析任何数据集。