Code前端首页关于Code前端联系我们

Python统计数据分析教程:卡方检验

terry 2年前 (2023-09-25) 阅读数 62 #后端开发

卡方检验是一种统计方法,用于确定两个分类变量是否显着相关。两个变量必须来自同一群体,并且必须相似 - 是/否、男性/女性、红色/绿色等。例如,您可以构建一个数据集来观察人们的冰淇淋购买模式,并尝试将人的性别与他们最喜欢的冰淇淋口味关联起来。如果我们发现相关性,并且知道宿主群体中的性别数量,我们就可以设计合适的口味。

使用 numpy 库中的各种函数来执行卡方检验。

from scipy import stats
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(0, 10, 100)
fig,ax = plt.subplots(1,1)

linestyles = [':', '--', '-.', '-']
deg_of_freedom = [1, 4, 7, 6]
for df, ls in zip(deg_of_freedom, linestyles):
  ax.plot(x, stats.chi2.pdf(x, df), linestyle=ls)

plt.xlim(0, 10)
plt.ylim(0, 0.4)

plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Chi-Square Distribution')

plt.legend()
plt.show()
Python

执行上面的代码示例,得到以下结果 -

python统计数据分析教程:卡方检验

版权声明

本文仅代表作者观点,不代表Code前端网立场。
本文系作者Code前端网发表,如需转载,请注明页面地址。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门