
Weibull 分布 和 Lognormal 分布(二)
在上一篇文章 《Weibull 分布 和 Lognormal 分布(一)》 [1] ,我们谈到除了正态分布外,另外两个偏态的分布,分别是Weibull 分布 和 Lognormal 分布,我们直方图和拟合曲线的相似度,跟据视觉观察,估计数据适合何种分布。
不过,这当然不是最有效和准确的方法,而且在上一篇文章的银行索赔处理时间的例子中,Weibull 分布 和 Lognormal 分布都看似合适,问题是哪一个才是真正合适呢?这里,我们就需要借助软件Minitab中的Probability Plot功能了。
我们试举一个例子。以下图中所见是银行客服电话的处理时间(Throughput Time – THT)的直方图。图中所见,我们可以从视觉判断中知道,这分布一定不是正态分布。但究竟是用Weibull 分布 和 Lognormal 分布哪一个较好呢?
优思学院・六西格玛培训课程
我们可以把数据输入到Minitab中的C1栏位(THT (sec)),然后,使用Probability Plot的功能,见下图。
优思学院・六西格玛培训课程
接着,我们应该选择Single Variable,即是单个变量,如下图,之后点选OK。
优思学院・六西格玛培训课程
把 C1 设定为分析对象,然后,点选 Distribution(分布),因为这个功能预设为正态分布,而今次我们希望先测试的是Lognormal分布和Weibull分布。
优思学院・六西格玛培训课程
选择Lognormal之后,按两次OK。
优思学院・六西格玛培训课程
最后,我们就会得出Lognormal的Probability Plot。
优思学院・六西格玛培训课程・Lognormal
当然,用同样的方法,我们也可以得出Weibull 分布的Probability Plot。
优思学院・六西格玛培训课程・Weibull 分布
结果分析
第二,我们可以比较它们的AD值。 AD值是Anderson Darling Value ,用于量度数据服从特定分布的程度,AD值代表了数据点和理论值的距离,因此这个值越低,拟合度越高。
总的来说,从以上两点观察所见,银行客服电话的处理时间的分布,较服从于Lognormal分布。
以前,大部分的 六西格玛绿带 [2] 和 黑带 [3] ,都是针对制造生产工程的改善项目,大部分时间会处理 正态分布 ,或是 泊松分布 和 二项分布 [4] ,很少接触偏态分布。 优思学院 [5] 也观察到关于Lognormal或者Weibull分布的资料在网上不多,又或者写得太复杂、太深奥,令人难以理解,所以,希望透过这篇文章,介绍一下。
事实上,在中国的服务业的质量水平仍有待提升,且服务性质的企业运用六西格玛的还是不多,我们应该从这方面尽力推动六西格玛在服务业上的发展,提升服务业的质量水平。
参考
- ^ https://zhuanlan.zhihu.com/p/149484916
- ^ 六西格玛绿带 https://ucourse.org/ssgb
- ^ 六西格玛黑带 https://ucourse.org/ssbb
- ^ 二项分布和泊松分布的怎样在制造业中应用? https://zhuanlan.zhihu.com/p/146306115
- ^ 优思学院 https://ucourse.org
想看更多文章,请关注我们的 知乎帐号 。