統計手法による 2018年LPGA公式記録データの解析事例(その2)

更新日

投稿日

【統計手法による 2018年LPGA公式記録データの解析 連載目次】

 
 前回のその1に続いて、解説します。
 

5. 主成分分析

 
 主成分分析の因子負荷量の総括表を表4に示します。主成分1は寄与率の大きい順に「平均ストローク」「パーセーブ率」「平均バーディ」「平均パット数」「パーオン率」「リカバリー率」の6変数になり累積寄与率は53%になります。これは「プロゴルファの実力」とネーミングしました。主成分2は「Dディスタンス」「Fキープ率」でネーミングは「アンバランス」で約20%の寄与率、主成分3はネーミング「Sセーブ率」で9.6%、主成分4は「イーグルねらい」で7.5%、以上4つの主成分で全体の89.5%になります。
 
 表4.主成分分析結果 SQC
  
  SQC
  図3.因子負荷量のプロット
 
 因子負荷量を散布図にプロットしたのが図3になります。横軸に「プロゴルファの実力(主成分1)」縦軸に「アンバランス(主成分2)」をプロットしました。右端の実力が大きい領域は「5つの変数」が集中していることが分かります。
 
 すなわち、主成分2の軸「Dディスタンス」「Fキープ率」のバランスがとれたゼロ近傍に概ね集中しています。一方、主成分2のプラスとマイナス側に大きく振れると実力が低下します。主成分2は次式で表されます。
 
主成分2≒0.8541・X6(Dディスタンス)-0.8249・X7(Fキープ率)
 
 DディスタンスとFキープ率のバランスを維持することが実力アップの必要条件になります。
 
 SQC
 図4.主成分得点のプロット
 
 95人の選手を主成分1、2にプロットしたのが図4です。
 
 鈴木愛、伸ジエ、アンソンジュ、比嘉真美子等の実力者が主成分1右端と主成分2の中心付近に位置しています。テレサ・ルー、ペヒギョン、穴井詩、葭葉 ルミ、渡邊彩香はFキープ率を改善すれば実力アップのポテンシャルを有すると考えます。一方、ユンチェヨン、酒井美紀、金田久美子はDディスタンスの改善が課題になります。主成分1の左端の選手はバランスは良いですが、基本の「5つの変数」を強化する必要があります。
 
 視点を変えると実力者は主成分2の上下に大きくぶれてない位置にあることから、あえていえばコースによって技能を使い分ける戦略性を重視しているように思えます。
 

6. クラスター分析

 
 プレーヤーの類似性を評価するために、クラスター分析した結果を図5のデンドログラフに示します。上位10位までのプレーヤのグルーピングになります。鈴木愛、アンソンジュ、申ジエのグループは「Dディスタンス」と「Fキープ率」のバランスを旨く使い分ける戦略性を優先し、テレサ―・ルー、比嘉真美子の様に積極的にイーグルを狙うグループと一線を隔しています。
 
 SQC
 図5.上位10選手のデンドログラフ
 

7. レーダチャートによる分析

 
 上位3選手、下位3選手の10の変数をレーダチャートで示したのが、図6です。上位選手下位選手で明らかに各変数値に開きがあることが分かります。特に「平均バーディ」「パーセーブ率」「パーオン率」「平均パット数」「リカバリー率」で大きな差が認められます。
 
 図7は上位・下位20選手の変数のバラツキ(分散)をレーダーチャートにした結果です。上位の選手間で「イーグル」「Sセーブ率」「Fキープ率」のばらつきが大きくなっています。原因は上位選手ほど個性的なプレーを目指している結果ではないかと推測していますが、各選手の詳細なデータ分析が必要になります。
 
 SQC
 図6.上位、下位3選手、実力レーダーチャート図 
 SQC    
 図7.上位、下位20選手 分散のレーダーチャート
 

8. 統計処理で何ができるか

 
 2018年LPGA公式記録データから相関分析、主成分分析、クラスター分析、レーダーチャートの手法を使い、マクロな解析を試みました。各選手の特徴・...

【統計手法による 2018年LPGA公式記録データの解析 連載目次】

 
 前回のその1に続いて、解説します。
 

5. 主成分分析

 
 主成分分析の因子負荷量の総括表を表4に示します。主成分1は寄与率の大きい順に「平均ストローク」「パーセーブ率」「平均バーディ」「平均パット数」「パーオン率」「リカバリー率」の6変数になり累積寄与率は53%になります。これは「プロゴルファの実力」とネーミングしました。主成分2は「Dディスタンス」「Fキープ率」でネーミングは「アンバランス」で約20%の寄与率、主成分3はネーミング「Sセーブ率」で9.6%、主成分4は「イーグルねらい」で7.5%、以上4つの主成分で全体の89.5%になります。
 
 表4.主成分分析結果 SQC
  
  SQC
  図3.因子負荷量のプロット
 
 因子負荷量を散布図にプロットしたのが図3になります。横軸に「プロゴルファの実力(主成分1)」縦軸に「アンバランス(主成分2)」をプロットしました。右端の実力が大きい領域は「5つの変数」が集中していることが分かります。
 
 すなわち、主成分2の軸「Dディスタンス」「Fキープ率」のバランスがとれたゼロ近傍に概ね集中しています。一方、主成分2のプラスとマイナス側に大きく振れると実力が低下します。主成分2は次式で表されます。
 
主成分2≒0.8541・X6(Dディスタンス)-0.8249・X7(Fキープ率)
 
 DディスタンスとFキープ率のバランスを維持することが実力アップの必要条件になります。
 
 SQC
 図4.主成分得点のプロット
 
 95人の選手を主成分1、2にプロットしたのが図4です。
 
 鈴木愛、伸ジエ、アンソンジュ、比嘉真美子等の実力者が主成分1右端と主成分2の中心付近に位置しています。テレサ・ルー、ペヒギョン、穴井詩、葭葉 ルミ、渡邊彩香はFキープ率を改善すれば実力アップのポテンシャルを有すると考えます。一方、ユンチェヨン、酒井美紀、金田久美子はDディスタンスの改善が課題になります。主成分1の左端の選手はバランスは良いですが、基本の「5つの変数」を強化する必要があります。
 
 視点を変えると実力者は主成分2の上下に大きくぶれてない位置にあることから、あえていえばコースによって技能を使い分ける戦略性を重視しているように思えます。
 

6. クラスター分析

 
 プレーヤーの類似性を評価するために、クラスター分析した結果を図5のデンドログラフに示します。上位10位までのプレーヤのグルーピングになります。鈴木愛、アンソンジュ、申ジエのグループは「Dディスタンス」と「Fキープ率」のバランスを旨く使い分ける戦略性を優先し、テレサ―・ルー、比嘉真美子の様に積極的にイーグルを狙うグループと一線を隔しています。
 
 SQC
 図5.上位10選手のデンドログラフ
 

7. レーダチャートによる分析

 
 上位3選手、下位3選手の10の変数をレーダチャートで示したのが、図6です。上位選手下位選手で明らかに各変数値に開きがあることが分かります。特に「平均バーディ」「パーセーブ率」「パーオン率」「平均パット数」「リカバリー率」で大きな差が認められます。
 
 図7は上位・下位20選手の変数のバラツキ(分散)をレーダーチャートにした結果です。上位の選手間で「イーグル」「Sセーブ率」「Fキープ率」のばらつきが大きくなっています。原因は上位選手ほど個性的なプレーを目指している結果ではないかと推測していますが、各選手の詳細なデータ分析が必要になります。
 
 SQC
 図6.上位、下位3選手、実力レーダーチャート図 
 SQC    
 図7.上位、下位20選手 分散のレーダーチャート
 

8. 統計処理で何ができるか

 
 2018年LPGA公式記録データから相関分析、主成分分析、クラスター分析、レーダーチャートの手法を使い、マクロな解析を試みました。各選手の特徴・課題については、平均データのみでなく時系列も含めて、さらに詳細なデータが必要になります。今回は初心者が統計処理で何ができるかについて知見を得るための内容にしました。
 
 多変量解析の応用は多岐に渡ります。例えばマーケティング情報「営業戦略」を立案する場合にも主成分分析、クラスター分析は重要な情報源になります。行に「製品系列」列に「シェア」「原価率」「営業人員」「顧客数」「営業タクト」「アンケート結果」「品質」「納期遵守率」「リードタイム」等をマトリックス表にして多変量解析すれば自社の「弱み」「強み」が分析でき、営業戦略を立案するための有力な武器になると考えます。
 

   続きを読むには・・・


この記事の著者

森本 幹夫

「製品品質95%を決める設計で成果を上げる実践的ツールを指導します」 講師と研修者が、2WAYによる議論主体の教育です。 演習は「データ」、「情報化」、「価値の創造」の流れで進めます。

「製品品質95%を決める設計で成果を上げる実践的ツールを指導します」 講師と研修者が、2WAYによる議論主体の教育です。 演習は「データ」、「情報化」、「...


「品質マネジメント総合」の他のキーワード解説記事

もっと見る
設計品質の考え方

 設計品質の考え方には、「攻め」と「守り」があります。攻めの設計品質改善とは、守りの設計品質改善とは、一体何でしょうか。    「守り」の設...

 設計品質の考え方には、「攻め」と「守り」があります。攻めの設計品質改善とは、守りの設計品質改善とは、一体何でしょうか。    「守り」の設...


品質のコスト

1.「品質コスト」の概念  設計者の皆さんにとって「品質のコスト」とはどんな概念でしょう?前回テーマのタグチメソッドを提唱した田口玄一は「品質」を次...

1.「品質コスト」の概念  設計者の皆さんにとって「品質のコスト」とはどんな概念でしょう?前回テーマのタグチメソッドを提唱した田口玄一は「品質」を次...


QCサークル活動、効果が出る進め方とは

    QCサークル活動は、なぜ効果の出ないマンネリ化した活動になってしまうのでしょうか。多くの工場では、多品種少量、受注生産で忙しい状...

    QCサークル活動は、なぜ効果の出ないマンネリ化した活動になってしまうのでしょうか。多くの工場では、多品種少量、受注生産で忙しい状...


「品質マネジメント総合」の活用事例

もっと見る
全社的品質管理活動の第一歩とは

 企業はサービスを提供しお客様から対価を得る事で経営が成り立ちます。サービスに満足し継続して利用していただくにはお客様目線で考えることが大切です。私には幼...

 企業はサービスを提供しお客様から対価を得る事で経営が成り立ちます。サービスに満足し継続して利用していただくにはお客様目線で考えることが大切です。私には幼...


中国工場と品質:中国人の「わかりました」を鵜呑みにしない

1. 中国進出の品質リスクとは   今回は、ある日系企業の中国工場進出についての事例です。この企業は、これから進出する場所を決定するとのことで、場所...

1. 中国進出の品質リスクとは   今回は、ある日系企業の中国工場進出についての事例です。この企業は、これから進出する場所を決定するとのことで、場所...


品質管理の和洋折衷とは

1.平均値の盲信  複数データの代表値として平均値を用いる事が多々あると思います。平均貯蓄額、平均余命、平均点、平均給与、平均単価など、事例をあげる...

1.平均値の盲信  複数データの代表値として平均値を用いる事が多々あると思います。平均貯蓄額、平均余命、平均点、平均給与、平均単価など、事例をあげる...