样本均值的抽样分布
前面我们在统计杂谈之中心极限定理中说到了样本均值的抽样分布(the sampling distribution of the sample mean) ,当时说样本均值的抽样分布是中心极限定理,其实并不恰当。应该是按照中心极限定理,抽样样本的均值的分布符合正太分布,但是这个正太分布不是我们通常做正态性检测时,所有的数据放在一起弄出来的正态分布图。 我们知道平时拿到的样品都是都是样本而不是总体,通常进行抽样的总体是有自身的标准方差(Standard deviation),很多时候见到的“SD=”基本上说的就是标准方差,总体的标准方差是σ,方差是σ^2,总体的均值是μ,这个均值很多时候也会被叫做期望值(expected value),见到的符号通常是E,我们平时在生产中的规格中心限值可以认为是期望值,在Cpk和Ppk计算的时候,里面有个叫望目的东西,就是期望值(规格中心值)。但是因为总体的数量总是很大,我们也不可能去对每个进行测量,尤其是药品这种,测量基本上等于报废,不能像其他的工业产品那样对某个样品进行反复测量,所以通常是抽取一部分样品进行测量来对整体进行估算,样本的标准差S,方差S^2,均值Xbar。样本量越大估算就约准确。
说了上面那段废话以后,我们接着说样本均值的抽样分布。
当我们抽取了一定的样本的时候,这个样本的均值,就符合这样一个这样的正太分布,标准差σXbar ,均值为μxbar的正太分布。其中σXbar叫做均值的标准差(the standard deviation of sampling mean)和样本标准误差(the standard error of the mean),σXbar值和样本数量有关系,不用的样本容量会造成样本标准差的不同,即使是样本是采集于同一总体,因为σXbar2=σ^2/n,其中σ是总体标准差,n是抽取的样本数量,同样的因为我们通常是通过样本来估算总体所以σXbar2≈S^2/n,其中S是样本标准差,n为样本数量。通常认为样本的均值Xbar为总体的均值μ,平均值吗,不管你的样本怎么组合平均数据均值都不会发生改变,多以抽样样本的均值和样本的均值相同为Xbar。
上面就是样本均值的抽样分布的一些基本的知识点,没有实例,看起来很难懂,之所以单独拿出来写一下, 是因为,这个分布是以后关于置信区间、假设检验,z检验、t检验等的一个基础,对统计学该兴趣的蒲友可以去寻找相应的内容进行学习。
每次写有公式或符号帖子的时候,实际发表的内容中公式或者帖子的符号总是因为格式的原因弄的看不懂,下面是对帖子内容中一些符号的备注,希望对读懂帖子有所帮助