層別比較に便利なグラフ

投稿日

 層別比較に便利なツールとしては、『箱ひげ図があります。箱ひげ図は少数データの扱いも容易で作成も簡便なので便利ですが、分布の中心が中央値で、分布の幅がパーセンタイルで表されます。
 
  一方、平均値や標準偏差(SD)を用いて分布のばらつきを比較した方がヒストグラムと整合性も取れるし統計的なイメージも取りやすい場合も多いと思います。この様な場合は平均値の上下に標準偏差SDを上髭下髭と伸ばしたグラフを描画してみると、イメージ通りの各層比較グラフが描けます。
 
 実験結果の比較データを平均値プロットで比較しているデータを時々見ますが、ばらつきである標準偏差が考慮されていないか、数値データだけ添付されています。平均値とばらつきを別々に見せられると分布として層別比較するのが難しく、第三者による良し悪し判断もつきにくいです。そこで上述の様な平均値の上下にSDを描画してやれば両方を一つのグラフで参照出来るので条件による違いが一目瞭然です。
 
 箱ひげ図の形を利用して次のようにデータを置き換え、平均値を中心に上下にSD幅のBoxを成す変形箱ひげ図を描いてみます。
 
•中央値を平均値へ置き換え
 
•上髭点を平均値+3SD点へ、下髭点を平均値-3SD点へ置き換え
 
•75%点を平均値+1SD点へ、25%点を平均値-1SD点へ置き換え
 
 箱ひげ図との対比を明確にする為に下図の様に両図を隣接して描いてみます。緑箱は箱ひげ図、赤箱は平均値+SD図です。分布が狭いデータAと広いデータBの2種類について描画しています。(図1)
 
       sd22
図1・箱ひげ図とSD図の対比
 
 隣接グラフを見比べると解りますが、箱ひげ図に対しSD図は箱部分が大きくなります。ばらつきが大きな分布は箱及び髭が長くなり箱ひげ図よりも顕著に現れます。
 
 SD図は平均値に対し...
 層別比較に便利なツールとしては、『箱ひげ図があります。箱ひげ図は少数データの扱いも容易で作成も簡便なので便利ですが、分布の中心が中央値で、分布の幅がパーセンタイルで表されます。
 
  一方、平均値や標準偏差(SD)を用いて分布のばらつきを比較した方がヒストグラムと整合性も取れるし統計的なイメージも取りやすい場合も多いと思います。この様な場合は平均値の上下に標準偏差SDを上髭下髭と伸ばしたグラフを描画してみると、イメージ通りの各層比較グラフが描けます。
 
 実験結果の比較データを平均値プロットで比較しているデータを時々見ますが、ばらつきである標準偏差が考慮されていないか、数値データだけ添付されています。平均値とばらつきを別々に見せられると分布として層別比較するのが難しく、第三者による良し悪し判断もつきにくいです。そこで上述の様な平均値の上下にSDを描画してやれば両方を一つのグラフで参照出来るので条件による違いが一目瞭然です。
 
 箱ひげ図の形を利用して次のようにデータを置き換え、平均値を中心に上下にSD幅のBoxを成す変形箱ひげ図を描いてみます。
 
•中央値を平均値へ置き換え
 
•上髭点を平均値+3SD点へ、下髭点を平均値-3SD点へ置き換え
 
•75%点を平均値+1SD点へ、25%点を平均値-1SD点へ置き換え
 
 箱ひげ図との対比を明確にする為に下図の様に両図を隣接して描いてみます。緑箱は箱ひげ図、赤箱は平均値+SD図です。分布が狭いデータAと広いデータBの2種類について描画しています。(図1)
 
       sd22
図1・箱ひげ図とSD図の対比
 
 隣接グラフを見比べると解りますが、箱ひげ図に対しSD図は箱部分が大きくなります。ばらつきが大きな分布は箱及び髭が長くなり箱ひげ図よりも顕著に現れます。
 
 SD図は平均値に対し上下に対象ですが、箱ひげ図は中央値に対し上下どちらかに偏りが見られます。つまり分布が正規分布形状の場合はSD図の方が分かりやすいですが、正規分布形状でなく偏りがある場合は箱ひげ図の方がイメージしやすいと言えます。どちらが優れていると言うより用途に応じて使い分けることが重要です。また2群比較ならグラフ上にp値を記載しておけば両者に統計的有意差があるかどうかも一目でわかるので大変有用なグラフとなります。
 

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「SQC一般」の他のキーワード解説記事

もっと見る
統計手法の中の『層別』とは

   今回は、統計手法の中の層別という分析手法について、解説します。    層別の基本的意味について整理してみますと、一般の方で...

   今回は、統計手法の中の層別という分析手法について、解説します。    層別の基本的意味について整理してみますと、一般の方で...


「微分」 現場数学(その1)

♦ 数学の教科書に書いてある通りにプログラムしてもだめ!では計算できない!  サイン・コサイン何になる…とか嘯(うそぶ)い...

♦ 数学の教科書に書いてある通りにプログラムしてもだめ!では計算できない!  サイン・コサイン何になる…とか嘯(うそぶ)い...


~スパコンは速くなった? 続・現場数学(その19)

  1.  新幹線とスパコン“速さ”の違い  東北新幹線は最高時速260kmで走っていました。それが、...

  1.  新幹線とスパコン“速さ”の違い  東北新幹線は最高時速260kmで走っていました。それが、...


「SQC一般」の活用事例

もっと見る
ビックデータ時代と米国大統領戦

 ビックデータ時代を考える事例として、今回の第45代米国大統領選挙を見てみます。第45代の米国大統領に、ドナルド・トランプ氏が決まりましたが、トランプ氏当...

 ビックデータ時代を考える事例として、今回の第45代米国大統領選挙を見てみます。第45代の米国大統領に、ドナルド・トランプ氏が決まりましたが、トランプ氏当...


第1種の誤りと第2種の誤り

 「あわて者の誤り」と「ぼんやり者の誤り」をご存知ですか、あわて者の誤りは正式には『第一種の誤り』(Type Ⅰ error)と呼称し、ぼんやり者の誤りは...

 「あわて者の誤り」と「ぼんやり者の誤り」をご存知ですか、あわて者の誤りは正式には『第一種の誤り』(Type Ⅰ error)と呼称し、ぼんやり者の誤りは...


飛行機事故とセンサー・フィードバックの分布

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...