今回は、いよいよMTA法で使われる余因子の基本「なぜ余因子行列を使うのか?」から説明します。相関行列を使ったマハラノビス距離から、MTA法の話に戻っていきます。なお、これ以降では標準偏差がゼロの場合のMTAは扱いません。余因子や多重共線性の低減の関係について説明する時には、不要だからです。それこそ、必要な方は品質工学の教本をお読みください。
1.MTAの余因子と多重共線性と相関係数と逆行列
余因子を説明しましたが、ウィキペディアによると、
「余因子行列とは(ij)成分が(ij)余因子である行列の転置行列であり、adj(A)などで表す。この転置をしない場合も余因子行列と呼ぶこともある」とあり、品質工学の本は、どうやら転置をしない場合があるようです。数学の一般的な教本は、通常の余因子行列に従い、転置をするので、ここでも転置をしたものを指すことにします。結果に違いはありません。
式11を再掲載すると、
のため「このままでは、困ったことが起きる場合がある」というのが、そもそもの事の発端です。それは、多重共線性。大抵の品質工学教本では、訳が分からない人も多いのではないでしょうか? 逆行列の話と混ぜこぜになっているようです。多変量解析、特に重回帰分析あたりをやっていれば常識ですが、多重共線性というのは、読んで字のごとく、線を共にする平面が、幾通りにも存在するということです。下図参照。
村島 繁延「製造業でやさしく役に立つ 数理的問題解決法10選」第2回資料より(産業革新研究所オンデマンドセミナー)
図1.多重共線性(multi co linearity:マルチコ)の空間的説明
このような共線性があるというのは、2個の項目間の相関係数が1(もしくは1に近い)からです。これが起こると、3次元の場合の平面は、上図の赤線の周りで回転してできるプロペラの羽みたいなものが、全て解となってしまいます。それでもいいのですが、困ったことに、当然誤差があるから、あるいは測定異常も含めて、一点でもその線からポツンとズレたら、そこを含めての平面が解となってしまいます。当然、次に観測したら、別の誤差で平面は決まるから、実に不安定となります。この原因は、相関係数の高さですから、これを除外すればいいだけなのですが(実際、重回帰分析ではその方法が最も推奨される)、なぜか品質工学ではこだわるようであります。
式11のように、相関行列を使ったほうが説明しやすいから、これを元式にしましょう。
ちなみに、[R]=-0.4です。エクセルのMDETERMによります。しかし、そもそも、これはただの定数で、逆行列を求めるわけではありませんから、無視しましょう。青字の部分が余因子行列です。これを使うと、3次元なら、3個の相関係数が存在しますが、余因子で2次になり、相関係数の高いもの(今の場合1とした)が消え去る可能性が高い。残ったとしても、上のように、余因子行列では計算の過程で消えていく場合が多い。n次についてもいえますが、遠慮がちに品質工学の本が「制約が完全になくなったというわけではない」といっているのは、相関係数が1に近いものが2個以上入っていると「消えるとは限らない」からです。1個ならば、確実に消えます。(この証明は面倒で、実際に計算して確認されたい)。
以上が、余因子と余因子行列とMTAで余因子行列を使う理由(多重共線性の低減)の説明です。
しかし、基本的には、重回帰分析の時と同様、相関係数の高いものは、管理コスト、導入コスト、測定工数などを考え、どちらかの項目を外すということの方が賢いやり方です。
あと一点、信じれ...