Code前端首页关于Code前端联系我们

python统计数据分析教程:测量方差

terry 2年前 (2023-09-25) 阅读数 52 #后端开发

在统计学中,方差是衡量数据集中的值与均值相差多少的指标。换句话说,它代表值的标准偏差。它是通过标准差来衡量的。另一种常用的方法是倾斜。

两者都是使用 pandas 库中可用的函数计算的。

测量偏差

标准偏差是方差的平方根。方差是平均值与数据集平均值之间的平方差。在Python中,我们使用pandas库中的std()函数来计算这个值。

import pandas as pd

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack',
   'Lee','Chanchal','Gasper','Naviya','Andres']),
   'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#Create a DataFrame
df = pd.DataFrame(d)

# Calculate the standard deviation
print (df.std())
Python

运行上面的示例代码,您将得到以下结果:

Age       7.265527
Rating    0.661628
dtype: float64
Python

测量偏度

用于确定数据是否对称或偏斜。如果指数在 -11 之间,则分布是对称的。如果指数不大于-1,则向左倾斜,如果至少1,则向右倾斜

import pandas as pd

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack',
   'Lee','Chanchal','Gasper','Naviya','Andres']),
   'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#Create a DataFrame
df = pd.DataFrame(d)
print (df.skew())
Python

以下结果是通过执行上面的示例代码得到的 -

Age       1.443490
Rating   -0.153629
dtype: float64
Shell

因此,相关性分布是对称的,而相关性分布是向右倾斜的。

版权声明

本文仅代表作者观点,不代表Code前端网立场。
本文系作者Code前端网发表,如需转载,请注明页面地址。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门