管理図といえば、 通常はシュハートの3シグマ法 (シグマはここでは標準偏差の意味) をさしますが、そのことを知っている人から、逆に質問されたりすることがあります。
例えば
管理図の数理は、素直に標準的なテキストに従えば、難しくなく、むしろ、その見方 (運営) のほうが重要、かつ難しいと思われます。
ただ、基本的な数理の疑問があると、のどに刺さった骨のようで気持ちが悪いというひとのために、わかる範囲で説明します。特にここでは、 前述の
1. 単純な3シグマ計算と管理図数値表による係数からの管理限界の違いについての確認
例として、群の大きさ n=4 (同一ロットあるいは製造日等)、群の数k=25、よって全データ数Nが100 のとき、平均値が 78 で標準偏差が 0.13 となった場合を想定します。
平均値±3シグマで、
一方、管理図テキストの係数表、いわゆるA2をみると、A2=0.729。
2. なぜそういうことが起こるのでしょうか?
「単純3 シグマ法で標準偏差を算出するときに、分散を全データ数Nで割るとか、全データ数 N−1で割るとかの違いでしょうか?」ということをいわれる方もいますが、データ数が全部で100個もあれば、どうでもいい問題です。 倍半分もの差異は説明できません。そうではなくて、シグマの計算でも、「全データのシグマ」と「群の平均のシグマ」は違うことに大きな原因 (理由) があります。
3. 平均の平均は平均になっても、 平均の標準偏差は全体の標準偏差にはならない
基本的なことの復習ですが、全データの標準偏差をσとすると、群の大きさnとして、群の平均の標準偏差 の関係は以下のようになります。
データの平均(
この場合、σは 0.13でしたから、
これで、倍半分からは、ずいぶんとリーズナブルな値になりました。しかし、まだ 25%ほど違いがあります。これはなぜでしょうか?
4.R(レンジ: 範囲)からの推定を根拠にしたシグマの計算である
問題にしている管理図は、
その値は、有名な(統計学の基本として) 次の式で表せます。
簡単にいえば、 レンジ (範囲)のなかに何個の σが入っているかということを計算しようということです。
よって、d2の計算が必要になります。d2はこうなります。
そこで、この計算をあらかじめ実行したとして、n=4 なら 2.059 となります。よって、この場合の
5. それでは、なぜ3シグマ管理なんて言うのでしょうか?
いままでの式から、 管理図係数表の
という関係になっています。式1より、
単純にシグマを計算すればいいというものではないのです。この計算では、
管理図は、テキスト通りに粛々と進めていくのがもっとも簡単で正確だという事です。Rについても同様な考え方です。
3シグマから直接計算するのであれば、余計に複雑な数理計算が要求されます。