群内誤差と群間誤差 (その2)

投稿日

 前回のその1に続いて解説します。群内誤差が大きければ群間誤差(要因効果)が観えなくなるので、単純に平均値だけでの評価は危険が伴います。それは郡内誤差が群間誤差がよりも大きい場合は再度同様の試行を行った時、同じようなデータセットが出てくるとは限らないからです。優劣が逆転する事もあり得ます。 解りやすいようにイメージ図を用います。 A,B,C、3つの条件で四回ずつ実験を行う例を示すと群間誤差と群内誤差のイメージは図1の様な感じとなります。
 
                          gosa22
図1.群間誤差と群内誤差
 
 条件AとCは差が大きく直感的に異なる分布と言えそうです。再評価を行っても序列が入れ替わるほど偏ったデータが出現する可能性は低いでしょう。一方AとBを比較すると平均値はBが大きいですが、個別の値を見るとAB双方のばらつき範囲が重なっているので検定を行っても有意差は出ないでしょう。何度も実験を行えば数%~十数%の確率でA>Bとなる場合も生じそうです。開発時は良好で、量産では上手く再現しない場合、この誤差と効果の見極めができていない事も原因の一つとして考えられます。繰り返して再現性を観る事は当然重要ですが、統計的評価も併せて行わないと時間とコストを度外視し安心出来るまで何度も実験を行うことは無理ですし、そもそも何度も試行出来ない評価もあります。
 
 ばらつきを調べる時、群内誤差か群間誤差を切り分ける有効な手法が層別分析です。例えば3台の装置がある場合、号機別でデータの層別を行えば装置間誤差と装置内誤差を知ることが出来ます。原料を2つのサプライヤーから購入していれば原料別で切り分けることにより原料間誤差と原料内誤差を知ることが出来ます。もちろん誤差を生み出す要因は複数あります。 原料、装置、人、処理条件、測定条件、付帯設備、気温・水温・・・ これらのうちどれが最も大きな誤差を生み出しているかをデータ分析で調べることで適切な対策が打てるのです。
 
 誤差評価の活用の場面は製造現場だけではありません。新しい広告宣伝の効果の評価、新企画よる売上改善評価、新メニューの評判など、一見無関係で定性的評価しか出来ない様な事でも数値化により応用が可能です。ばらつきに遭遇した時、層別手法を用いて群間誤差と群内誤差に切り分けるだけでもかなり誤差原因を絞り込むことが容易に...
 前回のその1に続いて解説します。群内誤差が大きければ群間誤差(要因効果)が観えなくなるので、単純に平均値だけでの評価は危険が伴います。それは郡内誤差が群間誤差がよりも大きい場合は再度同様の試行を行った時、同じようなデータセットが出てくるとは限らないからです。優劣が逆転する事もあり得ます。 解りやすいようにイメージ図を用います。 A,B,C、3つの条件で四回ずつ実験を行う例を示すと群間誤差と群内誤差のイメージは図1の様な感じとなります。
 
                          gosa22
図1.群間誤差と群内誤差
 
 条件AとCは差が大きく直感的に異なる分布と言えそうです。再評価を行っても序列が入れ替わるほど偏ったデータが出現する可能性は低いでしょう。一方AとBを比較すると平均値はBが大きいですが、個別の値を見るとAB双方のばらつき範囲が重なっているので検定を行っても有意差は出ないでしょう。何度も実験を行えば数%~十数%の確率でA>Bとなる場合も生じそうです。開発時は良好で、量産では上手く再現しない場合、この誤差と効果の見極めができていない事も原因の一つとして考えられます。繰り返して再現性を観る事は当然重要ですが、統計的評価も併せて行わないと時間とコストを度外視し安心出来るまで何度も実験を行うことは無理ですし、そもそも何度も試行出来ない評価もあります。
 
 ばらつきを調べる時、群内誤差か群間誤差を切り分ける有効な手法が層別分析です。例えば3台の装置がある場合、号機別でデータの層別を行えば装置間誤差と装置内誤差を知ることが出来ます。原料を2つのサプライヤーから購入していれば原料別で切り分けることにより原料間誤差と原料内誤差を知ることが出来ます。もちろん誤差を生み出す要因は複数あります。 原料、装置、人、処理条件、測定条件、付帯設備、気温・水温・・・ これらのうちどれが最も大きな誤差を生み出しているかをデータ分析で調べることで適切な対策が打てるのです。
 
 誤差評価の活用の場面は製造現場だけではありません。新しい広告宣伝の効果の評価、新企画よる売上改善評価、新メニューの評判など、一見無関係で定性的評価しか出来ない様な事でも数値化により応用が可能です。ばらつきに遭遇した時、層別手法を用いて群間誤差と群内誤差に切り分けるだけでもかなり誤差原因を絞り込むことが容易になります。層別分析は要因効果と誤差を切り分けるのにシンプルな方法ですが、両者の違いを数値で比較検定し効果の程を判断する統計手法に分散分析法があります。
 
 ばらつき、即ちムラを制御する為には誤差についての理解が欠かせません。 ムラを制するものは品質管理を制す。即ち『誤差を制するものは品質管理を制す』です。3ムの中でも最も制御が困難なムラですが、ばらつきを群間誤差・群内誤差に分解することで対策を立てやすくなります。結果のばらつきは何故起こるのか、 常に意識し改善活動を意味があるものにして下さい。
 

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「検定・推定」の他のキーワード解説記事

もっと見る
群内誤差と群間誤差  (その1)

 統計学を学ぶ最大の利点の一つは、『効果と誤差』についての理解ができることです。逆に言えば改善アクションを行った時、効果と誤差を区別出来なければ、それが意...

 統計学を学ぶ最大の利点の一つは、『効果と誤差』についての理解ができることです。逆に言えば改善アクションを行った時、効果と誤差を区別出来なければ、それが意...


有意水準、5%の考察

  統計的有意差検定とは一定確率の元で◯×判定を下す手法です。この一定の確率を『有意水準』と呼びます。有意水準とは危険率とも呼ばれ逆に100%から危険率を...

  統計的有意差検定とは一定確率の元で◯×判定を下す手法です。この一定の確率を『有意水準』と呼びます。有意水準とは危険率とも呼ばれ逆に100%から危険率を...


「検定・推定」の活用事例

もっと見る
母平均の検定事例(母分散が既知の場合)

 今回は、母集団が正規分布であり、平均値と分散値が既知である場合の検定事例を取り上げます。  小学校4年生のある年の全国身長調査で平均値は143.5cm...

 今回は、母集団が正規分布であり、平均値と分散値が既知である場合の検定事例を取り上げます。  小学校4年生のある年の全国身長調査で平均値は143.5cm...


仮説検定:洞窟ツアーと p値

        今回は、ケンタッキー州にあるマンモス・ケーブ国立公園に行った事からの事例解説です。この国立公...

        今回は、ケンタッキー州にあるマンモス・ケーブ国立公園に行った事からの事例解説です。この国立公...