Weibull 分布 和 Lognormal 分布(二)
在上一篇文章《Weibull 分布 和 Lognormal 分布(一)》[1],我们谈到除了正态分布外,另外两个偏态的分布,分别是Weibull 分布 和 Lognormal 分布,我们直方图和拟合曲线的相似度,跟据视觉观察,估计数据适合何种分布。
不过,这当然不是最有效和准确的方法,而且在上一篇文章的银行索赔处理时间的例子中,Weibull 分布 和 Lognormal 分布都看似合适,问题是哪一个才是真正合适呢?这里,我们就需要借助软件Minitab中的Probability Plot功能了。
我们试举一个例子。以下图中所见是银行客服电话的处理时间(Throughput Time – THT)的直方图。图中所见,我们可以从视觉判断中知道,这分布一定不是正态分布。但究竟是用Weibull 分布 和 Lognormal 分布哪一个较好呢?
优思学院・六西格玛培训课程
我们可以把数据输入到Minitab中的C1栏位(THT (sec)),然后,使用Probability Plot的功能,见下图。
优思学院・六西格玛培训课程
接着,我们应该选择Single Variable,即是单个变量,如下图,之后点选OK。
优思学院・六西格玛培训课程
把 C1 设定为分析对象,然后,点选 Distribution(分布),因为这个功能预设为正态分布,而今次我们希望先测试的是Lognormal分布和Weibull分布。
优思学院・六西格玛培训课程
选择Lognormal之后,按两次OK。
优思学院・六西格玛培训课程
最后,我们就会得出Lognormal的Probability Plot。
优思学院・六西格玛培训课程・Lognormal
当然,用同样的方法,我们也可以得出Weibull 分布的Probability Plot。
优思学院・六西格玛培训课程・Weibull 分布
结果分析
第一,我们会先观察数据是否都在红色线的范围之间,如果是的话,表示数据对该分布拟合度较高。从Weibull分布和Lognormal分布的两个Probaility Plot中所见,明显地Weibull分布拟合度较低。
第二,我们可以比较它们的AD值。AD值是Anderson Darling Value,用于量度数据服从特定分布的程度,AD值代表了数据点和理论值的距离,因此这个值越低,拟合度越高。
总的来说,从以上两点观察所见,银行客服电话的处理时间的分布,较服从于Lognormal分布。
以前,大部分的六西格玛绿带[2]和黑带[3],都是针对制造生产工程的改善项目,大部分时间会处理正态分布,或是泊松分布和二项分布[4],很少接触偏态分布。优思学院[5]也观察到关于Lognormal或者Weibull分布的资料在网上不多,又或者写得太复杂、太深奥,令人难以理解,所以,希望透过这篇文章,介绍一下。
事实上,在中国的服务业的质量水平仍有待提升,且服务性质的企业运用六西格玛的还是不多,我们应该从这方面尽力推动六西格玛在服务业上的发展,提升服务业的质量水平。
参考
- ^https://zhuanlan.zhihu.com/p/149484916
- ^六西格玛绿带 https://ucourse.org/ssgb
- ^六西格玛黑带 https://ucourse.org/ssbb
- ^二项分布和泊松分布的怎样在制造业中应用? https://zhuanlan.zhihu.com/p/146306115
- ^优思学院 https://ucourse.org
想看更多文章,请关注我们的知乎帐号。