Weibull 分布 和 Lognormal 分布(二)

Weibull 分布 和 Lognormal 分布(二)

在上一篇文章《Weibull 分布 和 Lognormal 分布(一)》[1],我们谈到除了正态分布外,另外两个偏态的分布,分别是Weibull 分布 和 Lognormal 分布,我们直方图和拟合曲线的相似度,跟据视觉观察,估计数据适合何种分布。

不过,这当然不是最有效和准确的方法,而且在上一篇文章的银行索赔处理时间的例子中,Weibull 分布 和 Lognormal 分布都看似合适,问题是哪一个才是真正合适呢?这里,我们就需要借助软件Minitab中的Probability Plot功能了。

我们试举一个例子。以下图中所见是银行客服电话的处理时间(Throughput Time – THT)的直方图。图中所见,我们可以从视觉判断中知道,这分布一定不是正态分布。但究竟是用Weibull 分布 和 Lognormal 分布哪一个较好呢?

 

优思学院・六西格玛培训课程

 

 

我们可以把数据输入到Minitab中的C1栏位(THT (sec)),然后,使用Probability Plot的功能,见下图。

优思学院・六西格玛培训课程

 

 

接着,我们应该选择Single Variable,即是单个变量,如下图,之后点选OK。

优思学院・六西格玛培训课程

 

 

把 C1 设定为分析对象,然后,点选 Distribution(分布),因为这个功能预设为正态分布,而今次我们希望先测试的是Lognormal分布和Weibull分布。

优思学院・六西格玛培训课程

 

 

选择Lognormal之后,按两次OK。

优思学院・六西格玛培训课程

 

 

最后,我们就会得出Lognormal的Probability Plot。

优思学院・六西格玛培训课程・Lognormal

 

 

当然,用同样的方法,我们也可以得出Weibull 分布的Probability Plot。

优思学院・六西格玛培训课程・Weibull 分布

 

 

结果分析

第一,我们会先观察数据是否都在红色线的范围之间,如果是的话,表示数据对该分布拟合度较高。从Weibull分布和Lognormal分布的两个Probaility Plot中所见,明显地Weibull分布拟合度较低。

第二,我们可以比较它们的AD值。AD值是Anderson Darling Value,用于量度数据服从特定分布的程度,AD值代表了数据点和理论值的距离,因此这个值越低,拟合度越高。

总的来说,从以上两点观察所见,银行客服电话的处理时间的分布,较服从于Lognormal分布。


以前,大部分的六西格玛绿带[2]黑带[3],都是针对制造生产工程的改善项目,大部分时间会处理正态分布,或是泊松分布二项分布[4],很少接触偏态分布。优思学院[5]也观察到关于Lognormal或者Weibull分布的资料在网上不多,又或者写得太复杂、太深奥,令人难以理解,所以,希望透过这篇文章,介绍一下。

事实上,在中国的服务业的质量水平仍有待提升,且服务性质的企业运用六西格玛的还是不多,我们应该从这方面尽力推动六西格玛在服务业上的发展,提升服务业的质量水平。

 

参考

  1. ^https://zhuanlan.zhihu.com/p/149484916
  2. ^六西格玛绿带 https://ucourse.org/ssgb
  3. ^六西格玛黑带 https://ucourse.org/ssbb
  4. ^二项分布和泊松分布的怎样在制造业中应用? https://zhuanlan.zhihu.com/p/146306115
  5. ^优思学院 https://ucourse.org

 

 

 


想看更多文章,请关注我们的知乎帐号

六西格玛 优思学院

致力于为在职人士建立云端网上课程,促进人才培育,个人发展,和技能提升。

发表评论