「主成分分析」とは、キーワードからわかりやすく解説

 

1. 「主成分分析」とは

主成分分析とは、多変量からなるデータのいくつかの変量に共通して含まれる要素を抽出するための統計的分析法です。 これによって抽出された要素を主成分と呼び、主成分どおしは互いに無相関です。 この分析によって、元々多数の変量で表されていたデータを、少数の主成分軸に投影した主成分スコアで表現する事が可能となり、特徴を理解しやすくなります。

 

2.  「主成分分析」の基本原理

 「主成分分析」は、多変量データの主要なパターンを把握するための技術であり、特に次元削減に用いられます。次元削減であって、特徴量選択ではありません。主成分分析では、元の特徴量から新しい特徴量セット(主成分)を作成します。これらの主成分は、データの最大の分散を捉えるように設計されており、互いに直交(独立)しています。新しい特徴量セット(主成分)が、元の特徴量よりも、その変数の数が少ないというものです。

 

3. 「主成分分析」とクラスタ分析

「主成分分析」とクラスタ分析は、データを集約(もしくは、グルーピング)する分析技術の1つです。主成分分析は変数(データセットの列)を集約(もしくは、グルーピング)することで次元縮約(例:1,000変数を10変数にまとめる)するのに対し、クラスタ分析はケース(データセットの行)を集約(もしくは、グルーピング)することで似たようなケースをクラスタ化(同じようなのが集まっている状態)します。この場合のケースとは、個体(例:個人や店舗、企業など)です。ちなみに、主成分分析で作られた新たな変数を「主成分」と呼びます。

 


「主成分分析」のキーワード解説記事

もっと見る
主成分分析の考え方と活用法

 前回のクラスター分析に続き、今回は主成分分析について解説します。 1. 主成分分析 ~ 多くの特性(情報)を1個に集約  総合と分類に役立つ手法とし...

 前回のクラスター分析に続き、今回は主成分分析について解説します。 1. 主成分分析 ~ 多くの特性(情報)を1個に集約  総合と分類に役立つ手法とし...