皮尔逊(森)相关系数是一种衡量两个变量之间线性相关程度的统计量。它通常用符号 r 表示,其值介于 -1 和 1 之间。
当 r = 1 时,表示两个变量完全正相关,即它们的变化方向完全相同;
当 r = -1 时,表示两个变量完全负相关,即它们的变化方向完全相反;
当 r = 0 时,表示两个变量不存在线性关系。
在 Python 中,可以使用 numpy 库中的 corrcoef
函数来计算皮尔逊相关系数。该函数接受两个参数,分别为需要计算相关系数的两个变量(可以是列表、数组或其他数据类型),并返回一个矩阵,其中第 [0,1] 和 [1,0] 个元素就是这两个变量的皮尔逊相关系数。
以下是一个简单的例子:
import numpy as np
# 生成两组随机数据
x = np.random.rand(50)
y = np.random.rand(50)
# 计算皮尔逊相关系数
r = np.corrcoef(x, y)[0, 1]
print(r)
这段代码将生成两组包含 50 个随机数的数组 x 和 y,并使用 np.corrcoef
函数计算它们的皮尔逊相关系数。最后将结果打印出来。