正規分布について

投稿日

1.正規分布とは

 一般に自然界のデータ分布は左右対称の釣鐘形状になります。例えば平均が50点の試験があれば、そこを中心に点数の分布が左右に広がります。受験者数nが大きくなればなるほど平均値周辺の人数が増え、分布の形は滑らかになり正規分布という形に近づきます。

 正規分布は最も基本となる分布の一つで、自然界の分布は多くがこの分布の形を取ります。正規分布は、ばらつきが大きければすそ野の広い富士山形状となり、小さければシャープな釣鐘型形状となります。

 分布が下図の左の様であればばらつきが小さいことを示し、試験は受験者による差が少なく実力が拮抗していたと言えます。逆に右の様に幅が広ければばらつきが大きい、つまり点数が良かった人も悪かった人もいたことを示します。

正規分布とは

2.正規分布と標準偏差の関係

 別項で、ばらつきを示す統計量として標準偏差σについて述べました。 シャープな正規分布は、σが小さい分布です。ブロードな正規分布はσが大きい分布です。

正規分布の形状

 では正規分布の中央から±1σの範囲に入るのは全体の何%でしょう?先ほどの試験結果の例で考えてみましょう。平均50点で標準偏差が10点だとすると±1σの範囲は40点から60点の範囲に当たります。 同様に±2σは30~70点、±3σは20-80点の範囲に該当します。この時の分布は次の図のようになります。

正規分布と標準偏差

 即ち各得点の範囲に入る受験生は次の割合です。

 •±1σ (40-60点):約68%
 •±2σ (30-70点):約95%
 •±3σ (20-80点):約99.7%

正規分布と存在範囲

 良く使う偏差値は、平均と標準偏差を元に計算します。偏差値は、平均点を取れば点数の大小に関わらず50となるような数値です。

 次にこの正規分布を、規格の中心が100mmの部品の寸法分布で再度考えてみます。理想は、すべての部品が100mmピッタリになる事です。しかしこれまで述べてきたように、残念ながら必ずばらつきが生じます。もし規格幅が100mm±1mmであれば98.5mmや101.5mmの部品は納品できません。平均が100mmで標準偏差が0.3mmだとしたら、100±0.9mmの範囲に99.7%が入ります。逆に言えば1000本作成した中に、規格外れが3個ほど発生する可能性があります。もし1日10万個を作る大量生産部品ならば300個の不適合品が出来る事になります。

 規格幅99.0~101.0mmの中に分布がすっぽりと収まるのが理想です。合格率を高めて不適合を減ら...

1.正規分布とは

 一般に自然界のデータ分布は左右対称の釣鐘形状になります。例えば平均が50点の試験があれば、そこを中心に点数の分布が左右に広がります。受験者数nが大きくなればなるほど平均値周辺の人数が増え、分布の形は滑らかになり正規分布という形に近づきます。

 正規分布は最も基本となる分布の一つで、自然界の分布は多くがこの分布の形を取ります。正規分布は、ばらつきが大きければすそ野の広い富士山形状となり、小さければシャープな釣鐘型形状となります。

 分布が下図の左の様であればばらつきが小さいことを示し、試験は受験者による差が少なく実力が拮抗していたと言えます。逆に右の様に幅が広ければばらつきが大きい、つまり点数が良かった人も悪かった人もいたことを示します。

正規分布とは

2.正規分布と標準偏差の関係

 別項で、ばらつきを示す統計量として標準偏差σについて述べました。 シャープな正規分布は、σが小さい分布です。ブロードな正規分布はσが大きい分布です。

正規分布の形状

 では正規分布の中央から±1σの範囲に入るのは全体の何%でしょう?先ほどの試験結果の例で考えてみましょう。平均50点で標準偏差が10点だとすると±1σの範囲は40点から60点の範囲に当たります。 同様に±2σは30~70点、±3σは20-80点の範囲に該当します。この時の分布は次の図のようになります。

正規分布と標準偏差

 即ち各得点の範囲に入る受験生は次の割合です。

 •±1σ (40-60点):約68%
 •±2σ (30-70点):約95%
 •±3σ (20-80点):約99.7%

正規分布と存在範囲

 良く使う偏差値は、平均と標準偏差を元に計算します。偏差値は、平均点を取れば点数の大小に関わらず50となるような数値です。

 次にこの正規分布を、規格の中心が100mmの部品の寸法分布で再度考えてみます。理想は、すべての部品が100mmピッタリになる事です。しかしこれまで述べてきたように、残念ながら必ずばらつきが生じます。もし規格幅が100mm±1mmであれば98.5mmや101.5mmの部品は納品できません。平均が100mmで標準偏差が0.3mmだとしたら、100±0.9mmの範囲に99.7%が入ります。逆に言えば1000本作成した中に、規格外れが3個ほど発生する可能性があります。もし1日10万個を作る大量生産部品ならば300個の不適合品が出来る事になります。

 規格幅99.0~101.0mmの中に分布がすっぽりと収まるのが理想です。合格率を高めて不適合を減らすには、もっとシャープな分布にすることが必要です。その為にはばらつきを減らす工夫をして、標準偏差σをもっと小さくしなければなりません。上の例で言えば、1σを0.25mmまで下げることで8個分のσが規格範囲に入ります。それによって、規格内の部品は99.994%となり10万個中6個程度にまで不適合品の発生を抑える事ができます。

 統計的解析は基本的に正規分布するという仮定の元に行います。母集団の数が多い時すべてのデータを取るのは難しい為サンプリングを行い、そのサンプルの平均や標準偏差から正規分布を仮定して母集団の姿を推測する事になります。

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「SQC一般」の他のキーワード解説記事

もっと見る
DPMO(Defects Per Million Opportunity) 工程能力の理解 (その3)

  【工程能力の理解 連載目次】  工程能力とは  工程能力指数-Cp/Cpk  ...

  【工程能力の理解 連載目次】  工程能力とは  工程能力指数-Cp/Cpk  ...


~ 仏典の漢訳と全国測量 現場数学(その15)

  1.現場の規模 ~ 中国の一大国家事業  「三蔵法師が孫悟空たちを供に従え、天竺に仏典を求めた旅をした…」と、その通り...

  1.現場の規模 ~ 中国の一大国家事業  「三蔵法師が孫悟空たちを供に従え、天竺に仏典を求めた旅をした…」と、その通り...


転ばぬ先の杖~RFCの備え

 RFCとはResponse Flow Chart(若しくはchecksheet)の略語です。あまりポピュラーな用語ではありませんが、外資系の製造業では良...

 RFCとはResponse Flow Chart(若しくはchecksheet)の略語です。あまりポピュラーな用語ではありませんが、外資系の製造業では良...


「SQC一般」の活用事例

もっと見る
DPMOとは何か

 DPMOとはDefects Per Million Opportunityのイニシャルを取ったものです。DPMOを百万個当りの欠陥数(製品百万個当りの不...

 DPMOとはDefects Per Million Opportunityのイニシャルを取ったものです。DPMOを百万個当りの欠陥数(製品百万個当りの不...


飛行機事故とセンサー・フィードバックの分布

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...


統計手法による 2018年LPGA公式記録データの解析事例(その1)

【統計手法による 2018年LPGA公式記録データの解析 連載目次】 統計手法による 2018年LPGA公式記録データの解析事例(その1) 統...

【統計手法による 2018年LPGA公式記録データの解析 連載目次】 統計手法による 2018年LPGA公式記録データの解析事例(その1) 統...