その他の統計手法 その1、箱ひげ図 / Box and Whisker plot

投稿日

 ヒストグラムは分布形状を知る上で非常に有効なツールですが、形状を形作るにはそれなりのデータ数が必要となります。サンプル数が5~20程度と少ないと歪な分布となる為、形状把握には適さない事があります。 一方で箱ひげ図は分布の詳細情報はヒストグラムに及びませんが、分布の中心や幅の情報を持った箱型のマーカーで表わされるため他の分布との比較に適しています。例えば複数の異なる水準で実験を行い、各水準のサンプル数が5個づつで比較を行う場合は箱ひげ図の方がビジュアル的に差異が把握しやすく効果的です。箱ひげ図は英語ではボックスプロット(Box Plot)と呼ばれる様に四角い箱形状で分布の大きさ(中心と分布の幅)を表します。分布が小さくシャープな形状であればボックスの高さが低く、分布がブロードであれば長いボックス形状となります。
 

1.箱ひげ図の作成方法

(1)データよりメジアンとボックスの上側ヒンジと下側ヒンジ点を計算します
   上側は相対累積度数が75%に相当する点で、下側は25%に相当する点です
(2)上側ヒンジをボックスの上辺、下側ヒンジをボックスの下辺とした箱を作り
   計算したメジアンを横線として引きます
(3)箱の高さをL(75%点と25%点の間の差)とし、髭の長さを決めます
(4)上ヒゲはボックスの上ヒンジから上に1.5Lの範囲で最も大きいデータまで繋い
   だもの、下ヒゲは逆に下ヒンジから下に1.5Lの範囲で最も小さいデータまでを
   繋いだもの
(5)最後にヒゲの先端よりも外側にある点を外れ値として打点×で表示する
     この様にして作成した箱ひげ図は図1のような形となります。
                       hakohuge1        
図1.箱ひげ図
 
 75%点がボックスの上ヒンジ位置となり、25%点がボックスの下ヒンジ値となります。上ヒゲはボックスの上端(75%値)から上方に箱の高さLの1.5倍の範囲に在り且つ最大点まで線を引き作成します。同様にボックスの下端(25%値)から下方へ1.5Lの範囲に在り且つ最小点まで線を引き作成します。上ヒゲ、下ヒゲより外側の点を外れ値として打点します。
 
 分布が正規分布形状なら中央値を挟んで上下に対象な形状となります。分布がシャープであればボックスは小さく、ヒゲの長さも短くなります。逆にデータのばらつきが大きければ箱は大きくなり、外れ値も見られます。
 
 n数が少ない実験データは下図の様に複数の箱ヒゲ図を用いて比較すればヒストグラムより差異がわかりやすく第三者に提示する場合も解りやすいグラフとなります。
 
          hakohuge2
図2.箱ひげ図イメージ
 
 図2のケースでは条件Aは箱が小さくヒゲの長さも短いので4つの条件の中で最も分布が狭くばらつきも小さい事がわかります...
 ヒストグラムは分布形状を知る上で非常に有効なツールですが、形状を形作るにはそれなりのデータ数が必要となります。サンプル数が5~20程度と少ないと歪な分布となる為、形状把握には適さない事があります。 一方で箱ひげ図は分布の詳細情報はヒストグラムに及びませんが、分布の中心や幅の情報を持った箱型のマーカーで表わされるため他の分布との比較に適しています。例えば複数の異なる水準で実験を行い、各水準のサンプル数が5個づつで比較を行う場合は箱ひげ図の方がビジュアル的に差異が把握しやすく効果的です。箱ひげ図は英語ではボックスプロット(Box Plot)と呼ばれる様に四角い箱形状で分布の大きさ(中心と分布の幅)を表します。分布が小さくシャープな形状であればボックスの高さが低く、分布がブロードであれば長いボックス形状となります。
 

1.箱ひげ図の作成方法

(1)データよりメジアンとボックスの上側ヒンジと下側ヒンジ点を計算します
   上側は相対累積度数が75%に相当する点で、下側は25%に相当する点です
(2)上側ヒンジをボックスの上辺、下側ヒンジをボックスの下辺とした箱を作り
   計算したメジアンを横線として引きます
(3)箱の高さをL(75%点と25%点の間の差)とし、髭の長さを決めます
(4)上ヒゲはボックスの上ヒンジから上に1.5Lの範囲で最も大きいデータまで繋い
   だもの、下ヒゲは逆に下ヒンジから下に1.5Lの範囲で最も小さいデータまでを
   繋いだもの
(5)最後にヒゲの先端よりも外側にある点を外れ値として打点×で表示する
     この様にして作成した箱ひげ図は図1のような形となります。
                       hakohuge1        
図1.箱ひげ図
 
 75%点がボックスの上ヒンジ位置となり、25%点がボックスの下ヒンジ値となります。上ヒゲはボックスの上端(75%値)から上方に箱の高さLの1.5倍の範囲に在り且つ最大点まで線を引き作成します。同様にボックスの下端(25%値)から下方へ1.5Lの範囲に在り且つ最小点まで線を引き作成します。上ヒゲ、下ヒゲより外側の点を外れ値として打点します。
 
 分布が正規分布形状なら中央値を挟んで上下に対象な形状となります。分布がシャープであればボックスは小さく、ヒゲの長さも短くなります。逆にデータのばらつきが大きければ箱は大きくなり、外れ値も見られます。
 
 n数が少ない実験データは下図の様に複数の箱ヒゲ図を用いて比較すればヒストグラムより差異がわかりやすく第三者に提示する場合も解りやすいグラフとなります。
 
          hakohuge2
図2.箱ひげ図イメージ
 
 図2のケースでは条件Aは箱が小さくヒゲの長さも短いので4つの条件の中で最も分布が狭くばらつきも小さい事がわかります。条件CはAと同様のシャープな分布ですが左右に裾野を引っ張った分布であることが予想できます。一方で条件Bは最も箱が大きくブロードな分布であることが直感的に解ります。この様に箱ひげ図は複数条件の分布を簡易的に比較するのに適したツールです。
 

2.箱ひげ図使用時の注意点

 箱ひげ図は少数データの層間比較に便利ですが、データが少ない故に数点の異常値で箱の形状が影響を受けやすくなります。異常値1点を除くだけで長い箱が小さく変化する場合もありますのでデータの正当性は充分なチェックが必要です。逆に正当なばらつきで生じた値を外れ値として削除し評価結果を都合よく操作しないよう意識しなければなりません。
  

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「品質マネジメント総合」の他のキーワード解説記事

もっと見る
品質マネジメントの費用とは

1.品質マネジメントと品質管理  今回どうしてタイトル名が「品質管理」ではなく、「品質マネジメント」なのかというと、「品質管理」が広義では品質に関連する...

1.品質マネジメントと品質管理  今回どうしてタイトル名が「品質管理」ではなく、「品質マネジメント」なのかというと、「品質管理」が広義では品質に関連する...


トレーサビリティとは

【目次】 1. トレーサビリティと製造情報管理、4M変化点管理 2. なぜトレーサビリティーなのか 3. やさしいトレーサビリティー管理構築手順 ...

【目次】 1. トレーサビリティと製造情報管理、4M変化点管理 2. なぜトレーサビリティーなのか 3. やさしいトレーサビリティー管理構築手順 ...


新しい時代のQCサークル活動の提案

 最近、企業ぐるみのデーターねつ造・改ざんの問題が大きく報道されています。実は、QCサークル活動でも一部の企業で、体裁を重視した発表用のQCストーリー作り...

 最近、企業ぐるみのデーターねつ造・改ざんの問題が大きく報道されています。実は、QCサークル活動でも一部の企業で、体裁を重視した発表用のQCストーリー作り...


「品質マネジメント総合」の活用事例

もっと見る
設計はしても、その良否確認する能力がない中国企業 中国企業の壁(その19)

        ある中国企業では、自社で開発設計した製品を自社工場で生産し販売しています。欧米、オーストラリアに加え日本向けにも販売しています。 ...

        ある中国企業では、自社で開発設計した製品を自社工場で生産し販売しています。欧米、オーストラリアに加え日本向けにも販売しています。 ...


自部門の問題点抽出が無理な中国企業 中国企業の壁(その49)

        日本品質を目指している中国企業A社では、全社の品質レベルを高めることが狙いで、社長の号令の元、各部門の品質に関わる役割の再認識と問題...

        日本品質を目指している中国企業A社では、全社の品質レベルを高めることが狙いで、社長の号令の元、各部門の品質に関わる役割の再認識と問題...


中国企業・自社の検査員を仕入先に派遣 中国企業の壁(その35)

        ある中国企業では、トップが品管部にどのような役割を持たせるかで思案していました。    現状この会社の品管部は、検査部門と言える...

        ある中国企業では、トップが品管部にどのような役割を持たせるかで思案していました。    現状この会社の品管部は、検査部門と言える...