python统计数据分析教程：p值

terry 3年前 (2023-09-25) 阅读数 145 #后端开发

p值表示假设的强度。我们根据一些统计模型做出假设，并将模型的有效性与 p 值进行比较。获取 p 值的一种方法是使用 T 测试。

这是原假设的双尾检验，即独立观测样本 'a' 的预期值（平均值）等于给定总体平均值的 popmean。请参阅下面的示例。

from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print (stats.ttest_1samp(rvs,5.0))

Python

运行上面的示例代码并获得以下结果 -

Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))

Python

比较两个样本

下面的示例有两个样本或不同的分布，它们可能来自相同的需求测试这些样本是否存在样本具有相同的统计特性。

ttest_ind - 计算两个独立样本结果的 T 检验。这是原假设的双尾检验，即两个独立样本具有相同（预期）均值。该检验假设总体默认具有相同的方差。

如果观察到来自相同或不同群体的两个独立样本，则可以使用此检验。让我们看下面的一个例子。

from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print (stats.ttest_ind(rvs1,rvs2))

Python

运行上面的示例代码，得到以下结果 -

Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)

Python

可以使用长度相同但含义不同的新数组进行测试。使用不同的值并在loc中测试相同的值。

版权声明

本文仅代表作者观点，不代表Code前端网立场。
本文系作者Code前端网发表，如需转载，请注明页面地址。

上一篇：Python统计数据分析指南：相关性模型下一篇：Python 统计数据分析教程：伯努利分布（绘制概率分布曲线以创建直方图）

python统计数据分析教程：p值

版权声明

作者文章