概要 新QC七つ道具: マトリックス・データ解析法の使い方(その6)

更新日

投稿日

 
【目次】
序論   ←掲載済
第5章  マトリックス・データ(MD)解析法の使い方←今回
第6章  マトリックス図法の使い方
第7章  系統図法の使い方
第8章  アロー・ダイヤグラム法の使い方
 

第5章  マトリックス・データ(MD)解析法の使い方

 

5.3 MD解析法について

 
 

5.3.4 MD解析法のステップの意味と概要

 
 MD解析法の具体的な説明になりますと、どうしても手段であるはずの数理統計学的なことが前面に出てしまうものです。手法の性質上致し方のないことなのですが、難解な数理の理解に注力する余り、手法の持つ本質的なことを見失いがちであったのが筆者の実感です。
 
 その体験から、数式を避け、手法のステップと各ステップの持つ意味を、前節で説明した思考過程に照らして説明し、併せて、心しておくべき活用上の留意点について述べます。次節における事例を用いた詳細説明のガイドとします。
 
 いろいろなステップのとり方があると思いますが、本書では、説明のしやすさから次の14ステップとしました。各統計量がステップごとに順次求められる形にしていますが、これはそれぞれの意味を説明しやすくするためで、実際は解析ソフトにより同時に求められ、たいていのソフトは必要な統計量については2次元座標軸上の散布図表示も同時にアウトプットされるのが普通です。
 
 まず、全貌を把握してもらうために、14のステップと各々のポイントを、若干の説明を付して一覧表にまとめたのが表5-2です。
 
表5-2 MD解析法による混沌解明のステップとポイント
 

Step 1 : データの採取

 
 解析対象である“混沌C”の性質上、既存の「特性(変数)×サンプル」のマトリックス・データからスタートせざるを得ないケースが多いが、次の点がポイントです。
 
【ポイント1】特性は極力幅広く採用する
 
 見通しが立っていないための混沌なので、先入観による特性の除外は避け、むしろ気になる特性があれば採用しておきます。これは、親和図法の“一匹狼”への対処に似ており、後で思いがけない効用を発揮することがあります。
 
【ポイント2】サンプル数は20以上がめど
 
 サンプル数は母集団の推定精度と経済性の兼ね合いで決まりますが、めどとしては、推定精度をサンプル数の大きさに頼る“大標本法”と、少ないサンプルでt変数を用いて推定する“小標本法”との誤差がほとんど無視できるサンプル数といわれる20以上でしょう(ただし、変数の数を下回ったのでは解析の意味がない)。
 
 ただ、「多変量解析法」(奥野忠一他著、日科技連出版、P.220)にサンプル数50のモデル実験結果が出ていますが、大筋で傾向は変わらないものの、各統計量は真の値とかなり違っています。既存データを使う場合、サンプル数は自由にならないことが多いだけに、解析結果の判断時、サンプル数が50くらいあってもこの程度であるということを念頭に判断する必要があります。
 

Step 2 : データの入力

 
 すべての起点ゆえ、入力ミスに最大限の注意を払うことはもちろんですが、入手したデータの背景などデータそのものに対するチェックもしかるべき人の手で行う必要があります。
 
【ポイント1】入力は平均値の照合でチェックする
 
 入力ミスのチェックは、変数ごとの平均値を原本のデータを使って別途求めた値と照合するのが効率良く確実です。
 
【ポイント2】既存データの場合は、採取背景...
 
【目次】
序論   ←掲載済
第5章  マトリックス・データ(MD)解析法の使い方←今回
第6章  マトリックス図法の使い方
第7章  系統図法の使い方
第8章  アロー・ダイヤグラム法の使い方
 

第5章  マトリックス・データ(MD)解析法の使い方

 

5.3 MD解析法について

 
 

5.3.4 MD解析法のステップの意味と概要

 
 MD解析法の具体的な説明になりますと、どうしても手段であるはずの数理統計学的なことが前面に出てしまうものです。手法の性質上致し方のないことなのですが、難解な数理の理解に注力する余り、手法の持つ本質的なことを見失いがちであったのが筆者の実感です。
 
 その体験から、数式を避け、手法のステップと各ステップの持つ意味を、前節で説明した思考過程に照らして説明し、併せて、心しておくべき活用上の留意点について述べます。次節における事例を用いた詳細説明のガイドとします。
 
 いろいろなステップのとり方があると思いますが、本書では、説明のしやすさから次の14ステップとしました。各統計量がステップごとに順次求められる形にしていますが、これはそれぞれの意味を説明しやすくするためで、実際は解析ソフトにより同時に求められ、たいていのソフトは必要な統計量については2次元座標軸上の散布図表示も同時にアウトプットされるのが普通です。
 
 まず、全貌を把握してもらうために、14のステップと各々のポイントを、若干の説明を付して一覧表にまとめたのが表5-2です。
 
表5-2 MD解析法による混沌解明のステップとポイント
 

Step 1 : データの採取

 
 解析対象である“混沌C”の性質上、既存の「特性(変数)×サンプル」のマトリックス・データからスタートせざるを得ないケースが多いが、次の点がポイントです。
 
【ポイント1】特性は極力幅広く採用する
 
 見通しが立っていないための混沌なので、先入観による特性の除外は避け、むしろ気になる特性があれば採用しておきます。これは、親和図法の“一匹狼”への対処に似ており、後で思いがけない効用を発揮することがあります。
 
【ポイント2】サンプル数は20以上がめど
 
 サンプル数は母集団の推定精度と経済性の兼ね合いで決まりますが、めどとしては、推定精度をサンプル数の大きさに頼る“大標本法”と、少ないサンプルでt変数を用いて推定する“小標本法”との誤差がほとんど無視できるサンプル数といわれる20以上でしょう(ただし、変数の数を下回ったのでは解析の意味がない)。
 
 ただ、「多変量解析法」(奥野忠一他著、日科技連出版、P.220)にサンプル数50のモデル実験結果が出ていますが、大筋で傾向は変わらないものの、各統計量は真の値とかなり違っています。既存データを使う場合、サンプル数は自由にならないことが多いだけに、解析結果の判断時、サンプル数が50くらいあってもこの程度であるということを念頭に判断する必要があります。
 

Step 2 : データの入力

 
 すべての起点ゆえ、入力ミスに最大限の注意を払うことはもちろんですが、入手したデータの背景などデータそのものに対するチェックもしかるべき人の手で行う必要があります。
 
【ポイント1】入力は平均値の照合でチェックする
 
 入力ミスのチェックは、変数ごとの平均値を原本のデータを使って別途求めた値と照合するのが効率良く確実です。
 
【ポイント2】既存データの場合は、採取背景を確認する
 
 新たに解析用データを採取する場合は解析目的に合わせることができますが、“混沌C”の場合、既存データに頼らざるを得ないケースが多いのです。その場合、データ採取の背景を把握しておき、解析結果の判断に反映するなどの配慮を心がける必要があります。
 
 次回は、Step 3から解説します。
 

   続きを読むには・・・


この記事の著者

浅田 潔

100年企業を目指す中小企業のため独自に開発した高効率な理念経営体系を柱に経営者と伴走します。

100年企業を目指す中小企業のため独自に開発した高効率な理念経営体系を柱に経営者と伴走します。


「マトリックス・データ解析法」の他のキーワード解説記事

もっと見る
相関行列と分散・共分散行列の使い分け  

  分散・共分散行列でマハラノビス距離による解析指導をしていた企業で相関行列でも同じなので、エクセルならこの方が簡単という話をしました。ところで...

  分散・共分散行列でマハラノビス距離による解析指導をしていた企業で相関行列でも同じなので、エクセルならこの方が簡単という話をしました。ところで...


MD解析法による適材適所配属(2) 【快年童子の豆鉄砲】(その94)

  前回の【快年童子の豆鉄砲】(その93)MD解析法による適材適所配属(1)に続けて解説します。   ◆【特集】 連載記事紹...

  前回の【快年童子の豆鉄砲】(その93)MD解析法による適材適所配属(1)に続けて解説します。   ◆【特集】 連載記事紹...


基本 新QC七つ道具: マトリックス・データ解析法の使い方(その5)

       【目次】 序論   ←掲載済 第1章  混沌解明とN7(新QC...

       【目次】 序論   ←掲載済 第1章  混沌解明とN7(新QC...