正規分布について

投稿日

1.正規分布とは

 一般に自然界のデータ分布は左右対称の釣鐘形状になります。例えば平均が50点の試験があれば、そこを中心に点数の分布が左右に広がります。受験者数nが大きくなればなるほど平均値周辺の人数が増え、分布の形は滑らかになり正規分布という形に近づきます。

 正規分布は最も基本となる分布の一つで、自然界の分布は多くがこの分布の形を取ります。正規分布は、ばらつきが大きければすそ野の広い富士山形状となり、小さければシャープな釣鐘型形状となります。

 分布が下図の左の様であればばらつきが小さいことを示し、試験は受験者による差が少なく実力が拮抗していたと言えます。逆に右の様に幅が広ければばらつきが大きい、つまり点数が良かった人も悪かった人もいたことを示します。

正規分布とは

2.正規分布と標準偏差の関係

 別項で、ばらつきを示す統計量として標準偏差σについて述べました。 シャープな正規分布は、σが小さい分布です。ブロードな正規分布はσが大きい分布です。

正規分布の形状

 では正規分布の中央から±1σの範囲に入るのは全体の何%でしょう?先ほどの試験結果の例で考えてみましょう。平均50点で標準偏差が10点だとすると±1σの範囲は40点から60点の範囲に当たります。 同様に±2σは30~70点、±3σは20-80点の範囲に該当します。この時の分布は次の図のようになります。

正規分布と標準偏差

 即ち各得点の範囲に入る受験生は次の割合です。

 •±1σ (40-60点):約68%
 •±2σ (30-70点):約95%
 •±3σ (20-80点):約99.7%

正規分布と存在範囲

 良く使う偏差値は、平均と標準偏差を元に計算します。偏差値は、平均点を取れば点数の大小に関わらず50となるような数値です。

 次にこの正規分布を、規格の中心が100mmの部品の寸法分布で再度考えてみます。理想は、すべての部品が100mmピッタリになる事です。しかしこれまで述べてきたように、残念ながら必ずばらつきが生じます。もし規格幅が100mm±1mmであれば98.5mmや101.5mmの部品は納品できません。平均が100mmで標準偏差が0.3mmだとしたら、100±0.9mmの範囲に99.7%が入ります。逆に言えば1000本作成した中に、規格外れが3個ほど発生する可能性があります。もし1日10万個を作る大量生産部品ならば300個の不適合品が出来る事になります。

 規格幅99.0~101.0mmの中に分布がすっぽりと収まるのが理想です。合格率を高めて不適合を減ら...

1.正規分布とは

 一般に自然界のデータ分布は左右対称の釣鐘形状になります。例えば平均が50点の試験があれば、そこを中心に点数の分布が左右に広がります。受験者数nが大きくなればなるほど平均値周辺の人数が増え、分布の形は滑らかになり正規分布という形に近づきます。

 正規分布は最も基本となる分布の一つで、自然界の分布は多くがこの分布の形を取ります。正規分布は、ばらつきが大きければすそ野の広い富士山形状となり、小さければシャープな釣鐘型形状となります。

 分布が下図の左の様であればばらつきが小さいことを示し、試験は受験者による差が少なく実力が拮抗していたと言えます。逆に右の様に幅が広ければばらつきが大きい、つまり点数が良かった人も悪かった人もいたことを示します。

正規分布とは

2.正規分布と標準偏差の関係

 別項で、ばらつきを示す統計量として標準偏差σについて述べました。 シャープな正規分布は、σが小さい分布です。ブロードな正規分布はσが大きい分布です。

正規分布の形状

 では正規分布の中央から±1σの範囲に入るのは全体の何%でしょう?先ほどの試験結果の例で考えてみましょう。平均50点で標準偏差が10点だとすると±1σの範囲は40点から60点の範囲に当たります。 同様に±2σは30~70点、±3σは20-80点の範囲に該当します。この時の分布は次の図のようになります。

正規分布と標準偏差

 即ち各得点の範囲に入る受験生は次の割合です。

 •±1σ (40-60点):約68%
 •±2σ (30-70点):約95%
 •±3σ (20-80点):約99.7%

正規分布と存在範囲

 良く使う偏差値は、平均と標準偏差を元に計算します。偏差値は、平均点を取れば点数の大小に関わらず50となるような数値です。

 次にこの正規分布を、規格の中心が100mmの部品の寸法分布で再度考えてみます。理想は、すべての部品が100mmピッタリになる事です。しかしこれまで述べてきたように、残念ながら必ずばらつきが生じます。もし規格幅が100mm±1mmであれば98.5mmや101.5mmの部品は納品できません。平均が100mmで標準偏差が0.3mmだとしたら、100±0.9mmの範囲に99.7%が入ります。逆に言えば1000本作成した中に、規格外れが3個ほど発生する可能性があります。もし1日10万個を作る大量生産部品ならば300個の不適合品が出来る事になります。

 規格幅99.0~101.0mmの中に分布がすっぽりと収まるのが理想です。合格率を高めて不適合を減らすには、もっとシャープな分布にすることが必要です。その為にはばらつきを減らす工夫をして、標準偏差σをもっと小さくしなければなりません。上の例で言えば、1σを0.25mmまで下げることで8個分のσが規格範囲に入ります。それによって、規格内の部品は99.994%となり10万個中6個程度にまで不適合品の発生を抑える事ができます。

 統計的解析は基本的に正規分布するという仮定の元に行います。母集団の数が多い時すべてのデータを取るのは難しい為サンプリングを行い、そのサンプルの平均や標準偏差から正規分布を仮定して母集団の姿を推測する事になります。

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「SQC一般」の他のキーワード解説記事

もっと見る
SQC(統計的品質管理)のリスキリング 【厳選記事】

  SQCの学び直しに厳選記事が無料でお読みいただけます!   ◆SQCとは SQC(Statistical Qualit...

  SQCの学び直しに厳選記事が無料でお読みいただけます!   ◆SQCとは SQC(Statistical Qualit...


基本統計量について(平均値・中央値・分散・標準偏差など)

 数値データを分析するにあたり、情報の特徴を知るために基本的な統計量がありますので、今回はその中のいくつかについて説明します。 1.平均値(mean、a...

 数値データを分析するにあたり、情報の特徴を知るために基本的な統計量がありますので、今回はその中のいくつかについて説明します。 1.平均値(mean、a...


~マルチスケール模型での計算 現場数学(その6)

  1.  計算の限界  如何(いか)にスーパーコンピューターを活用しても、計算出来る範囲はやはり限られています。例えば、タン...

  1.  計算の限界  如何(いか)にスーパーコンピューターを活用しても、計算出来る範囲はやはり限られています。例えば、タン...


「SQC一般」の活用事例

もっと見る
飛行機事故とセンサー・フィードバックの分布

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...


ビックデータ時代と米国大統領戦

 ビックデータ時代を考える事例として、今回の第45代米国大統領選挙を見てみます。第45代の米国大統領に、ドナルド・トランプ氏が決まりましたが、トランプ氏当...

 ビックデータ時代を考える事例として、今回の第45代米国大統領選挙を見てみます。第45代の米国大統領に、ドナルド・トランプ氏が決まりましたが、トランプ氏当...


統計教育が必須な検査担当者

 測定や検査結果の値で合格判定を行い、製品性能の品質保証をする事は製造業に取っては当たり前と言える日常的作業です。一方で検査や測定の正確さや信頼性を担保す...

 測定や検査結果の値で合格判定を行い、製品性能の品質保証をする事は製造業に取っては当たり前と言える日常的作業です。一方で検査や測定の正確さや信頼性を担保す...