統計学を学ぶ最大の利点の一つは、『
効果と誤差』についての理解ができることです。逆に言えば改善
アクションを行った時、効果と誤差を区別出来なければ、それが意味があるアクションなのかどうかを正しく判断することが出来ません。
例えば改善を行い検証試験を行い以前より平均値が3%良くなった、しかし、その平均値は以前と同じ条件でも何度か試行を繰り返していれば、時々生じる程度の変化では無いのか、所謂ばらつきの範囲内では無いのか、 という疑問に行き着く事も珍しくないのでは無いでしょう。これを疑問に思うか、疑わず効果があったと信じこんで先に進むかは大きな違いです。
条件変えてテストを行った時、それが従来条件でも生じうる誤差範囲の変化なのか、新しい条件故の効果なのかを科学的に判断する手法を知らなければ、自信を持って判断が出来ないと思います。この疑問に答える基本となる手法が、『統計的検定、区間推定や分散分析』なのです。
例えば500mlのペットボトルにジュースを注入する工程があるとします。同一条件で注入を行うなら注入量のばらつきは誤差と言えます。つまり注入量の平均μに対する各サンプル量の差(偏差)が誤差となります。
一方でこの工程では4台の装置を用いて作業を行っていたとしましょう。各装置1-4号機での注入量の平均をそれぞれa1、a2、a3、a4とすると、全体平均μに対するa1~a4の差は装置誤差と言えます。この装置別の平均と全体平均との差を群間誤差と言います。各装置の平均とサンプルとの差、即ち個別号機内のばらつきを群内誤差と言います。つまり各サンプルの値は、全体平均と『群間誤差と群内誤差』で説明出来ると言えます。
プロセス全体でばらつきを観ていた場合、『群間誤差』が大きくなっているのか、『群内誤差』が大きくなっているのかで対処の方法も異なります。つまり変化を装置毎の層別分析で捉え群間誤差と群内誤差を観れば迅速に適切な対処を行うことが可能となります。
もう一つ例を上げて説明します。 Aさん、Bさん、Cさん、Dさんがボーリングを行い、それぞれ5ゲーム投げました。合計ゲーム数は20ゲームであり、総平均スコアをμとします。この場合各プレイヤー個人のばらつきが『群内誤差』で、各プレイヤーの平均スコアとμの差が『群間誤差』となります。
5ゲームマッチの結果の判定はアベレージスコアで行います。しかし4人...