層別比較に便利なグラフ
2016-01-05
層別比較に便利なツールとしては、『箱ひげ図』があります。箱ひげ図は少数データの扱いも容易で作成も簡便なので便利ですが、分布の中心が中央値で、分布の幅がパーセンタイルで表されます。
一方、平均値や標準偏差(SD)を用いて分布のばらつきを比較した方がヒストグラムと整合性も取れるし統計的なイメージも取りやすい場合も多いと思います。この様な場合は平均値の上下に標準偏差SDを上髭下髭と伸ばしたグラフを描画してみると、イメージ通りの各層比較グラフが描けます。
実験結果の比較データを平均値プロットで比較しているデータを時々見ますが、ばらつきである標準偏差が考慮されていないか、数値データだけ添付されています。平均値とばらつきを別々に見せられると分布として層別比較するのが難しく、第三者による良し悪し判断もつきにくいです。そこで上述の様な平均値の上下にSDを描画してやれば両方を一つのグラフで参照出来るので条件による違いが一目瞭然です。
箱ひげ図の形を利用して次のようにデータを置き換え、平均値を中心に上下にSD幅のBoxを成す変形箱ひげ図を描いてみます。
•中央値を平均値へ置き換え
•上髭点を平均値+3SD点へ、下髭点を平均値-3SD点へ置き換え
•75%点を平均値+1SD点へ、25%点を平均値-1SD点へ置き換え
箱ひげ図との対比を明確にする為に下図の様に両図を隣接して描いてみます。緑箱は箱ひげ図、赤箱は平均値+SD図です。分布が狭いデータAと広いデータBの2種類について描画しています。(図1)
図1・箱ひげ図とSD図の対比
隣接グラフを見比べると解りますが、箱ひげ図に対しSD図は箱部分が大きくなります。ばらつきが大きな分布は箱及び髭が長くなり箱ひげ図よりも顕著に現れます。
SD図は平均値に対し...
上下に対象ですが、箱ひげ図は中央値に対し上下どちらかに偏りが見られます。つまり分布が正規分布形状の場合はSD図の方が分かりやすいですが、正規分布形状でなく偏りがある場合は箱ひげ図の方がイメージしやすいと言えます。どちらが優れていると言うより用途に応じて使い分けることが重要です。また2群比較ならグラフ上にp値を記載しておけば両者に統計的有意差があるかどうかも一目でわかるので大変有用なグラフとなります。