六西格玛数据有几种类别?区别又是什么?
六西格玛的数据类型主要可以分成两种,一种是定性数据(Qualitative),一种是定量数据(Quantitative),而两者亦可再细分不同的数据层次,可以参考以下优思学院的课程截图。
这里所说的数据的层次(Scale of Measurement),是指统计学中,对不同种类的数据,依据其尺度水平所划分的分类方法,包括:名目(Nominal)、等级(Ordinal)、等距(Interval),以及等比(Ratio)。
名目(Nominal)
名目(Nominal)能區分不同組別,例如:將「性別」區分成「男」、「女」。「男」、「女」本身具有意義,但編碼後 (如「男」為「1」、「女」為「0」) 的數字大小,並不代表任何意義(如,不能說1大於0)。
等级(Ordinal)
等级(Ordinal)能区分等级或顺序,例如:教育程度里,从小到大依序为:小学、中学、大学、硕士、博士。
等距(Interval)
等距(Interval)具有次序与距离,但无唯一原点。等距尺度能区分程度上的差異,例如:年份为2001年、2002年、2003年…。這些數据因為是等距的,所以能够进行加减,但由于不具绝对原点,所以不能乘除。(如:年份2022年/2并不具意义)
等比(Ratio)
等比(Ratio)具有次序、距离与唯一原点、无负值,而且各数值间具有等差与比率的关系。等比尺度能衡量数值之间实质的差異,例如:价格为100元、200元、300元…等。等比(Ratio)具有绝对原点,所以能够进行乘除(如:价格200元/2=价格100元)。
总结
在六西格玛项目中,针对因子和Y的理想选择必定是等比(Ratio)数据,因为它提供了更有效描述性统计,使我们能够更完整地分析数据。这并不是说其他量表在数据收集中没有用武之地。
事实上,根据项目的范围,所有四个尺度通常都是同时收集的。例如,考虑为客户制造一辆汽车。那辆车可以满足所有客户的尺寸和重量规格,但如果它的颜色不正确,在客户眼中就会被视为失败。你猜怎么着?颜色就是属于名目。
作为六西格玛绿带、黑带,我们要能够有效地使用不同类型的数据和完全地描绘出所收集的数据,否则就不可能在在一个项目中取得成功和突破性的改进。