当前所在位置: 首页 > 女性时尚 > 正文

数据分析中的统计学基础知识[标准差的意义分析]

2023-01-12 本站作者 【 字体:

统计学在我们生活中其实运用面还挺广的,比如社会调查的结果分析都会运用到统计学的知识。

我们今天就来分享一下统计学的一些基础的知识。

大致而言,统计学由“描述统计”和“推论统计”两部分构成。

描述统计就是从取得的数据中抽取其特征的技术。

推论统计是将统计学与概率理论相结合。对“无法整体把握的大的对象”或“还未发生而未来会发生的事情”进行推测。

一、描述统计

1、平均值

平均值就是用数据的合计除以数据的个数

标准差的意义分析(数据分析中的统计学基础知识)

平均数还可以通过以下公式求得

平均数=组值×相对频数的合计

2 、方差

偏差=数据的数值-平均值

方差=[(偏差的平方)的合计]/(数据数)

公式:

标准差的意义分析(数据分析中的统计学基础知识)

3、标准差

标准差=方差的均方根

标准差的意义分析(数据分析中的统计学基础知识)

标准差反映组内个体间的离散程度(波动率)。

标准差的含义在统计学中很重要!

标准差越大,数据的离散程度越大,波动越大。

标准差是数据特殊性特殊性额的评价基准

±1倍标准差以内包含约70%数据

一组数据中某个数据的偏差在±1倍标准差左右,可以说这是“平常的数据”

±2倍标准差以外包含约5%的数据

如果在±2倍标准差以外,则可以说是“特殊的数据”

4、正态分布

概率密度函数

连续型随机变量的概率密度函数是一个描述这个随机变量的输出值在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。

正态分布

若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:

X∼N(μ,σ2),

则其概率密度函数为

标准差的意义分析(数据分析中的统计学基础知识)

正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又常常称之为钟形曲线。我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。

标准差的意义分析(数据分析中的统计学基础知识)

正态分布的特性:

1)正态分布的95%命中区间是(μ-1.96σ,μ+1.96σ)

2)变量X服从平均值为μ,标准差为σ,可以利用公式将其变换为标准正态分布

Z=(X-μ)/ σ

3)变量X服从平均值为μ,标准差为σ的正态分布时,95%的预测命中区间为解不等式

-1.96≤(X-μ)/ σ≤+1.96 所得的范围

5、假设检验

母群体服从正态分布时,可以通过假设总体参数,来检验观测值是否落在95%的命中区间内。通过以下公式可以计算基于假设的总体参数的观测值的范围

-1.96≤(X-μ)/ σ≤+1.96

如果观测值在这个范围内,接受假设,假设成立;如果不在这个范围内,假设被舍弃。

6、区间估计

区间估计针对母群体的总体参数,在假定总体参数的情况下,只集合列现实观测到的数据在观测数据的“95%预测命中区间”的总体参数。根据区间估计缺点的总体参数的范围叫做“95%置信区间”

95%置信区间是这样一种区间:它由各种各样的观测值用相同的方法进行区间估计,其中95%包含正确的总体参数。

二、推论统计

正态分布母群体

正态分布母群体的总体均值为μ,总体标准差为σ时,n个观测数据x的样本均值x的分布仍为正态分布,且样本均值x的期望仍为μ,但标准差为σ/√n(标准误差)

  1. 已知总体方差,估计正态母群体的总体均值

正态母群体中已知总体标准差为σ时,可以从n个样本估计整体均值μ

保留满足:

-1.96≤(x -μ)/(σ/√n)≤1.96,求得μ的95%置信区间

2、已知总体均值,估计正态母群体的总体方差

1)由n个观测值计算V

标准差的意义分析(数据分析中的统计学基础知识)

2)从卡方分布临界表中求得自由度为n的卡方分布的95%预测命中区间

标准差的意义分析(数据分析中的统计学基础知识)

卡方分布临界值表的行索引为自由度,列索引为概率

值的含义可以理解为自由度为行索引时,大于该值的数据的概率为列索引

例如:对于自由度为5的卡方分布V来说,V的值有95%在“0.8312≤V≤12.8325”中。

3)解不等式求出σ²的95%置信区间。

3、未知总体均值,估计正态母群体的总体方差

步骤:

1)计算样本均值x,根据样本均值计算样本方差s²

s²=[(x1-x)²+(x2-x)²+…(xn-x)²]/n

2)计算统计量W

标准差的意义分析(数据分析中的统计学基础知识)

3)确认的自由度为n-1的W的95%预测命中区间(a≤W≤b)

4)求出σ²的95%置信区间

4、未知总体方差,估计正态母群体的总体均值

步骤:

1)计算样本均值x和样本标准差s

2)计算服从自由度n-1的t分布统计量T

标准差的意义分析(数据分析中的统计学基础知识)

3)根据t分布表查出自由度n-1的T的95%预测命中区间(-α≤T≤α)

标准差的意义分析(数据分析中的统计学基础知识)

例如自由度为10,T的95%命中区间的临界值为2.228,有-2.28≤T≤2.28

4)计算x–的95%置信区间

这四点是统计学中比较常用的基础知识,有比较大的收获吗?有想了解的可以留言哦!

阅读全文
相关推荐

如何自制蛋挞

如何自制蛋挞
1、倒入低筋面、黄油和水,揉成面团状,藏一小时后取出,抹上黄油卷起,包上保鲜膜冷藏半小时。2、取出,将面团切成一厘米的面团,放入模具内,用力按压,中间稍薄,外缘要比模具高,将蛋挞液倒入蛋挞皮中,放入烤箱里烤30分钟即可。

肉火烧面怎么和面

肉火烧面怎么和面
1、首先用温水把酵母融开,加入面粉,用手把面粉揉成非常软的面团,可以放一点熬好的猪油在面团里面。2、然后放在温暖的地方,盖上保鲜膜发酵至2倍大,发好的面团用手插入不回缩,就说明面团发酵好了。

奶茶几分糖好喝

奶茶几分糖好喝
1、不同的人对奶茶的口感要求是不一样的,一般来说,奶茶有三分糖、五分糖、七分糖三种不同的口味。2、女生一般都喜欢喝甜一点的,而男生则喜欢喝不那么甜的,七分糖的奶茶最好喝。

过桥米线是哪里的?

过桥米线是哪里的?
过桥米线是来自云南省滇南地区的一种有名特色小吃。过桥米线最早是在清朝就已经出现,距离现在至少有一百多年的历史啦!起源于建水县东城外锁龙桥西侧的鸡市街头处,有建水的特产草芽、地椒作配料,风味独特而远近闻名。深受广大美食爱好者的喜欢,不少人为此专门长途跋涉,只为尝

面霜和乳液的区别

面霜和乳液的区别
面霜和乳液的区别,相较而言乳液的水分含量要比面霜高,乳液质地要轻薄一些,乳液主要作用是保湿,滋润可以隔离外界干燥的气候,面霜既可保湿,又可美白,还能抗衰老,乳液的吸收快一些,而面霜吸收比较慢一些,因为液体的吸收速度都比较快。

怎么摘隐形眼镜

怎么摘隐形眼镜
在摘隐形眼镜之前,先用洗手液将手清洗干净,以免将细菌带入眼睛内,对着镜子,用右手中指轻拉眼睛下眼睑,左手中指轻拉眼睛上眼睑,让黑色眼球暴露在空气中,用右手食指和拇指轻触镜片的两边缘部分,向中间推使镜片拱起,再用两手指轻轻捏出镜片即可。

粉饼和散粉的区别

粉饼和散粉的区别
粉饼是呈压缩固体状态,多呈圆形或者方形,散粉则是细腻的粉末状,粉饼遮瑕力会比较强一些,可以湿用做粉底,或者用来补妆,而散粉则是定妆的效果,粉饼通常用在底妆的第一步,而散粉通常用在底妆最后一步。

冷烫和热烫的区别

冷烫和热烫的区别
冷烫和热烫的区别:冷烫对头发的要求是要在保温状态下才能给卷有个好的效果,而热烫是在干和湿的情况下都行,热烫烫出来的头发比较自然明显而有弹力,冷烫的头发风干后基本看不出来,并且发质会有点干。

高品质香水如何鉴别?用三步就可以解决

高品质香水如何鉴别?用三步就可以解决
1、看色泽以天然香料调制而成的高级香水,都有它本来的颜色,且大都是琥珀色或褐色,看起来很像宝石,比如,从茉莉、玫瑰或水仙等天然鲜花中所萃取的精油都呈黄色、褐白或绿褐色;此外,香水中所添加的魅惑香气物性香料也是褐色,苔类中的橡树苔是绿色,从树根或树根脂类中萃取的

如何去除黑眼圈

如何去除黑眼圈
去除黑眼圈首先可以用热毛巾敷眼,然后再用冷毛巾敷,十分钟就能让黑眼圈淡化的不那么严重,其次将去壳后的鸡蛋用无菌纱布包裹住,敷于眼部轻轻转动,可以急救去除黑眼圈,另外抹完眼霜后,用双手顺时针按摩,可以促进血液循环消除黑眼圈。
本文Tag