用正态分布法进行数据分析

2022/11/14 0:12:25 人评论 次浏览 分类:技术方案  文章地址:http://yunrun.com.cn/tech/4567.html

正态分布(Normal distribution)是连续随机变量概率分布的一种,广泛应用于数学、物理及工程等领域,在统计学有着非常大的影响力。正态分布有多种名称,如常态分布、高斯分布等。正态分布曲线中间高、两侧低的对称曲线。

笔者利用该方法研究了单相与三相交流充电桩的需要系数、超高层建筑的变压器容量指标等,分析过程如下。


首先应对样本组进行坏点处理,使得数据更科学、更具代表性。一般情况下,可以先假设数据呈正态分布的规律,这里采用SPSS软件作柯尔莫哥洛夫-斯米尔诺夫检验(即K-S检验)验证正态分布。


◆SPSS为Statistical Product and Service Solutions的缩写,即“统计产品与服务解决方案”软件,由IBM公司研发。

◆К-S检验是基于累计分布函数,用以检验两个经验分布是否不同或一个经验分布与另一个理想分布是否不同。

当显著性α值大于0.05时,则上述假设成立。
显著性水平是估计总体参数落在某一区间内,可能犯错误的概率。

若已验证样本数据符合正态分布规律,可根据正态分布公式(见下式)得出样本均值µ和标准差ơ。





公式中,n为样本数量;xi为样本值,i=1,2,……,n;µ为样本均值;ơ为标准差。


已知均值和标准差便可求取参考值范围,此处采用频数分布估计法估计任意取值范围内的频数比例,制定参考值范围。频数分布(frequency distribution)是数据统计整理方式之一。


下式中,X为双侧界值,即范围边界,边界大小以显著性水平α值来确定,即估计总体参数落在某一区间内可能犯错误的概率,其常用值有0.01、0.05、0.10等。鉴于需要系数是工程应用参数,实际情况比较复杂,所以不需将参考值范围定的过小,我们取α值为0.10,即参考范围至少能满足10%的情况。u值的选取与参考值范围的选择有关,常用u值见下表。

X=µ±uơ

公式中,X为双侧边界值;u为标准正态变量。

表 常用u值



显著性水平α取0.10,则双侧界值为P5和P95,可得:
X=µ±1.645ơ

这样,通过分析参考范围的合理性,并综合实际运行情况,即可得出需要系数建议值。

共有访客发表了评论 网友评论

  客户姓名:
邮箱或QQ:
验证码: 看不清楚?