統計的機械学習で使用する混同行列と評価指標データ分析講座（その296）

更新日 2024-01-05

投稿日 2023-11-28

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

統計的機械学習の世界に、2 値分類問題というものがあります。例えば、受注 or 失注、継続 or 離反、異常 or 正常、死亡 or 生存などを扱う予測モデルを構築したりします。そこで登場するのが、混同行列（Confusion Matrix）です。一時期新聞などで、新型コロナワクチンの良し悪しを評価するものとして、たまに登場していましたが、最近はあまり見なくなりました。

混同行列（Confusion Matrix）とは、統計的機械学習の2 値分類問題の分類結果をまとめた行列（Matrix）のことです。混同行列（Confusion Matrix）から、予測モデルの良し悪しを検討するための、幾つかの評価指標を作ることができます。どのような分類問題を扱うのかで、見るべき評価指標を変え選択する必要があります。

その前に、どのような指標があるのか分からないことには、見るべき指標を選択することもできません。今回は「統計的機械学習でよく使用される混同行列（Confusion Matrix）と評価指標」というお話しをします。

【目次】
1. 混同行列（Confusion Matrix）
2. 評価指標
3. 正解率（Accuracy）
4. 精度・適合率（Precision）・陽性反応適中度（positive predictive value）
5. 再現率（Recall）・感度（Sensitivity）
6. 陰性的中率（Negative predictive value）
7. 特異度（Specificity）
8. F1スコア（F1 Score）
9. F-βスコア（F-beta Score）
10. マシューズ相関係数（Matthews Correlation Coefficient）・ファイ係数（Phi coefficient）
11. バランス正解率（Balanced Accuracy）

【この連載の前回：データ活用の成否を握るのは周辺人データ分析講座（その295）へのリンク】

◆連載記事紹介：ものづくりドットコムの人気連載記事をまとめたページはこちら！

◆データ分析講座の注目記事紹介

1. 混同行列（Confusion Matrix）

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

混同行列（Confusion Matrix）とは、2 値分類問題の分類結果をまとめた2×2の行列（Matrix）です。行列は4つのセルで構成されます。

TP：真陽性（True positive）
TN：真陰性（True negative）
FP：偽陽性（False positive）
FN：偽陰性（False negative）

日本語が難しいです。例えば、受注を予測するモデルであれば……

Positive：受注
Negative：失注

……となります。

TP：真陽性（True positive）は、予測モデルによって正しくPositiveに分類された数です。実際の受注を、受注と予測できた数です。
TN：真陰性（True negative）は、予測モデルによって正しくNegativeに分類された数です。実際の失注を、失注と予測できた数です。
FP：偽陽性（False positive）とFN：偽陰性（False negative）は、予測が外した数です。
FP：偽陽性（False positive）は、受注と予測したのに実際は失注だった数です。FN：偽陰性（False negative）は、失注と予測したのに実際は受注だった数です。

2. 評価指標

混同行列（Confusion Matrix）から、例えば以下の評価指標を計算することができます。

正解率（Accuracy）
精度・適合率（Precision）・陽性反応適中度（positive predictive value）
再現率（Recall）・感度（Sensitivity）
陰性的中率（Negative predictive value）
特異度（Specificity）
F1スコア（F1 Score）
F-βスコア（F-beta Score）
マシューズ相関係数（Matthews Correlation Coefficient）・ファイ係数（Phi coefficient）
バランス正解率（Balanced Accuracy）

3. 正解率（Accuracy）

最も単純で最も分かりやすい指標です。全データの内、正しく予測できたものの割合です。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

問題は、データがPositiveやNegativeのどちらか一方に偏っている場合、機能しなくなることがあります。

4. 精度・適合率（Precision）・陽性反応適中度（positive predictive value）

Positiveと予測したとき、実際にPositiveだった割合です。こちらも比較的分かりやすいかと思います。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

問題は、取りこぼすPositiveが、多く発生する可能性があることです。この指標はNegativeの予測精度を考慮していないため、Negativeと予測されたPositiveは蚊帳の外だからです。取りこぼしが多い場合、感度（Sensitivity）が低いと言います。

5. 再現率（Recall）・感度（Sensitivity）

こちらは、取りこぼし無くPositive なデータを正しくPositiveと予測できているかどうかを示す指標です。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

この指標が高い予測モデルを、感度（Sensitivity）が高いと言います。理想は、感度が高く精度も高い予測モデルです。しかし、この2つの指標は、トレードオフの関係を示します。精度を過剰に高くすると感度が悪化し、感度を過剰に高くすると精度が犠牲になります。

6. 陰性的中率（Negative predictive value）

Negativeと予測したとき、実際にNegativeだった割合です。こちらも比較的分かりやすいかと思います。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

7. 特異度（Specificity）

取りこぼし無くNegative なデータを正しくNegativeと予測できているかどうかを示す指標です。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

8. F1スコア（F1 Score）

先程、理想は感度が高く精度も高い予測モデル、と言いました。この2つの指標を考慮した指標がF1スコアです。F1スコアは、精度（Precision）と感度（Sensitivity）の調和平均です。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

F1スコアの最大値は1.0で、最小値は0です。精度（Precision）と感度（Sensitivity）のどちらも完璧な場合、最大値の1になります。精度（Precision）と感度（Sensitivity）のどちらかが0である場合、最小値の0になります。迷ったら、F1スコアを用いるのがいいでしょう。

9. F-βスコア（F-beta Score）

F1スコアを一般化したものです。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

パラメータβ（ベータ）の数値を変えることで、精度（Precision）と感度（Sensitivity）のどちらを重視するのかを調整します。

β=1：F1スコア
β>1：感度（Sensitivity）重視
β<1：精度（Precision）重視
β=0：精度（Precision）のみ考慮

先程のF1スコアは、ベータが1だからF1スコアと言います。F2スコアといった場合、ベータが2の場合です。

10. マシューズ相関係数（Matthews Correlation Coefficient）・ファイ係数（Phi coefficient）

データがPositiveやNegativeのどちらか一方に偏っている場合、正解率（Accuracy）が機能しなくなることがあります。F1スコアなども、あまりにも極端に偏っている場合、たまにおかしくなります。そのようなデータに対し用いる評価指標として、マシューズ相関係数というものがあります。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

複雑そうに見えますが、Positiveを1、Negativeを0という数字を割り当てて、通常の相関係数（ピアソンの相関係数）を計算すると、マシューズ相関係数になります。マシューズ相関係数は-1から1の範囲の値を取り、予測が完璧に当たると1になり、真逆に完璧に当たると-1になります。

11. バランス正解率（Balanced Accuracy）

データがPositiveやNegativeのどちらか一方に偏っている場合、正解率（Accuracy）ではなくバランス正解率（Balanced Accuracy）を使ったほうがいいでしょう。数式もシンプルです。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

感度（Sensitivity）はPositiveの正答率、特異度（Specificity）はNegativeの正答率です。それを足して2で割り計算します。そのことが、データがPositiveやNegativeのどちらか一方に偏っている場合にも使えるようにしています。

次回に続きます。

【ものづくりセミナーサーチ】セミナー紹介：国内最大級のセミナー掲載数〈ものづくりセミナーサーチ〉はこちら！

...

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

【この連載の前回：データ活用の成否を握るのは周辺人データ分析講座（その295）へのリンク】

◆連載記事紹介：ものづくりドットコムの人気連載記事をまとめたページはこちら！

◆データ分析講座の注目記事紹介

1. 混同行列（Confusion Matrix）

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

混同行列（Confusion Matrix）とは、2 値分類問題の分類結果をまとめた2×2の行列（Matrix）です。行列は4つのセルで構成されます。

TP：真陽性（True positive）
TN：真陰性（True negative）
FP：偽陽性（False positive）
FN：偽陰性（False negative）

日本語が難しいです。例えば、受注を予測するモデルであれば……

Positive：受注
Negative：失注

……となります。

TP：真陽性（True positive）は、予測モデルによって正しくPositiveに分類された数です。実際の受注を、受注と予測できた数です。
TN：真陰性（True negative）は、予測モデルによって正しくNegativeに分類された数です。実際の失注を、失注と予測できた数です。
FP：偽陽性（False positive）とFN：偽陰性（False negative）は、予測が外した数です。
FP：偽陽性（False positive）は、受注と予測したのに実際は失注だった数です。FN：偽陰性（False negative）は、失注と予測したのに実際は受注だった数です。

2. 評価指標

混同行列（Confusion Matrix）から、例えば以下の評価指標を計算することができます。

正解率（Accuracy）
精度・適合率（Precision）・陽性反応適中度（positive predictive value）
再現率（Recall）・感度（Sensitivity）
陰性的中率（Negative predictive value）
特異度（Specificity）
F1スコア（F1 Score）
F-βスコア（F-beta Score）
マシューズ相関係数（Matthews Correlation Coefficient）・ファイ係数（Phi coefficient）
バランス正解率（Balanced Accuracy）

3. 正解率（Accuracy）

最も単純で最も分かりやすい指標です。全データの内、正しく予測できたものの割合です。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

問題は、データがPositiveやNegativeのどちらか一方に偏っている場合、機能しなくなることがあります。

4. 精度・適合率（Precision）・陽性反応適中度（positive predictive value）

Positiveと予測したとき、実際にPositiveだった割合です。こちらも比較的分かりやすいかと思います。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

5. 再現率（Recall）・感度（Sensitivity）

こちらは、取りこぼし無くPositive なデータを正しくPositiveと予測できているかどうかを示す指標です。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

6. 陰性的中率（Negative predictive value）

Negativeと予測したとき、実際にNegativeだった割合です。こちらも比較的分かりやすいかと思います。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

7. 特異度（Specificity）

取りこぼし無くNegative なデータを正しくNegativeと予測できているかどうかを示す指標です。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

8. F1スコア（F1 Score）

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

9. F-βスコア（F-beta Score）

F1スコアを一般化したものです。

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

パラメータβ（ベータ）の数値を変えることで、精度（Precision）と感度（Sensitivity）のどちらを重視するのかを調整します。

β=1：F1スコア
β>1：感度（Sensitivity）重視
β<1：精度（Precision）重視
β=0：精度（Precision）のみ考慮

先程のF1スコアは、ベータが1だからF1スコアと言います。F2スコアといった場合、ベータが2の場合です。

10. マシューズ相関係数（Matthews Correlation Coefficient）・ファイ係数（Phi coefficient）

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

11. バランス正解率（Balanced Accuracy）

データ分析講座（その296）統計的機械学習で使用する混同行列と評価指標

次回に続きます。

【ものづくりセミナーサーチ】セミナー紹介：国内最大級のセミナー掲載数〈ものづくりセミナーサーチ〉はこちら！

　続きを読むには・・・

新規会員登録

この記事の著者

高橋威知郎

株式会社セールスアナリティクス

データネクロマンサー/データ分析・活用コンサルタント（埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど）

この記事の著者

高橋威知郎

この連載の他の記事

その1

データ活用術とはデータ分析講座（その1）

その2

過去のデータの扱い方とはデータ分析講座（その2）

その3

成果を出したいなら、汚いデータからデータ分析講座（その3）

その4

ブルーオーシャンな時期とはデータ分析講座（その4）

その5

営業を確率で考えるデータ分析講座（その5）

その6

収益につながるデータ分析データ分析講座（その6）

その7

名刺のデータ化データ分析講座（その7）

その8

営業データ分析の良し悪しとはデータ分析講座（その8）

その9

取引履歴データデータ分析講座（その9）

その10

過去を整理し未来を創造するデータ分析講座（その10）

その11

販促活動データ分析講座（その11）

その12

セールスアナリティクスデータ分析講座（その12）

その13

回帰分析を使うことで収益拡大データ分析講座（その13）

その14

営業データ分析で冒険的なチャレンジをやり続けるデータ分析講座（その14）

その15

指標設計（KPI設計）データ分析講座（その15）

その16

営業データ分析の目的データ分析講座（その16）

その17

OODAループとはデータ分析講座（その17）

その18

4つの分析手法データ分析講座（その18）

その19

「分かっていないこと」（データの裏付けのない「事実」）データ分析講座（その19）

その20

誰も活用しないデータ分析結果データ分析講座（その20）

その21

管理会計の5つの指標を出発点に指標設計データ分析講座（その21）

その22

データ分析と指標データ分析講座（その22）

その23

指標から知りたい2つのことデータ分析講座（その23）

その24

データ分析の夢データ分析講座（その24）

その25

データ活用の勘所データ分析講座（その25）

その26

PDCAサイクルと「スピード」データ分析講座（その26）

その27

PDCAサイクルとOODAループデータ分析講座（その27）

その28

変化に適応し柔軟に動くための運用サイクルとはデータ分析講座（その28）

その29

KPIに求められるSMARTとはデータ分析講座（その29）

その30

「KPI」と「KGI」データ分析講座（その30）

その31

目的変数、説明変数とはデータ分析講座（その31）

その32

現場を無視した指標設計データ分析講座（その32）

その33

時系列データデータ分析講座（その33）

その34

要因分析とはデータ分析講座（その34）

その35

ビジネス・インテリジェンスツールとはデータ分析講座（その35）

その36

デジタル・マーケティングの力を活用するデータ分析講座（その36）

その37

営業に「行くべき顧客」とはデータ分析講座（その37）

その38

分析より、いかに活用するかデータ分析講座（その38）

その39

CRM（顧客関係管理システム）とはデータ分析講座（その39）

その40

営業生産性向上とはデータ分析講座（その40）

その41

PDCAサイクルとOODAループの根本的な違いデータ分析講座（その41）

その42

売上伝票の明細データデータ分析講座（その42）

その43

プロダクトU&E (Usage & Establishment) データ分析講座（その43）

その44

売上データの回帰分析データ分析講座（その44）

その45

Excelで出来ることデータ分析講座（その45）

その46

時系列データの3つの見方とはデータ分析講座（その46）

その47

データ活用の見通しを明るくするにはデータ分析講座（その47）

その48

データ活用効率化とデータ活用の仕組み化データ分析講座（その48）

その49

データの活かしどころを具体化することの重要性データ分析講座（その49）

その50

マーケティングや営業系のデータ分析：売上分析の目的データ分析講座（その50）

その51

より高度な分析にこだわる罠とはデータ分析講座（その51）

その52

分析手法を確実にビジネスに活かすのに大事なこととはデータ分析講座（その52）

その53

ビジネスの現場で時系列データに遭遇したときに、押さえておくべき3つの視点とはデータ分析講座（その53）

その54

IT化が貧弱でも、すぐれた洞察力さえあればどうにかなるデータ分析講座（その54）

その55

分析に求められる洞察力の基礎とはデータ分析講座（その55）

その56

AIには効率性を追求させて、人は人間らしさを発揮データ分析講座（その56）

その57

データ分析の専門部署を新設するときの留意点とはデータ分析講座（その57）

その58

データ活用の効用を得るにはデータ分析講座（その58）

その59

ビジネス活用の2パターンとはデータ分析講座（その59）

その60

データ分析経験者の中途採用データ分析講座（その60）

その61

グロスデータと、データ分析結果の関係とはデータ分析講座（その61）

その62

データ分析活用、ビジネス展開を上手く実現するための、OODAループデータ分析講座（その62）

その63

データドリブン思考はやめるデータ分析講座（その63）

その64

分析対象データのクセを知るとはデータ分析講座（その64）

その65

プロセス改革を実現することで、データ分析は大きな価値を生み出すデータ分析講座（その65）

その66

データでビジネス成果を出すときの最大の壁データ分析講座（その66）

その67

新しい分析手法やアルゴリズムに挑戦することは悪なのかデータ分析講座（その67）

その68

売上分析を実施しても、「なぜ」までは分からないデータ分析講座（その68）

その69

メタ知識とデータカタログデータ分析講座（その69）

その70

データ活用には製販分離は大きな壁データ分析講座（その70）

その71

データ分析組織は、やっていることを金額換算データ分析講座（その71）

その72

データ分析文化を組織内で広めたいなら、Excelでデータ分析講座（その72）

その73

ビジネスデータ分析は因果関係を知りたいデータ分析講座（その73）

その74

ビジネスに貢献し周囲に認められ感謝されるデータ分析データ分析講座（その74）

その75

IT化の不効率を加速させたビッグデータブームデータ分析講座（その75）

その76

効果の見えないデータ分析に明日はないデータ分析講座（その76）

その77

分析結果が妥当かを、判断する前提知識とはデータ分析講座（その77）

その78

分析結果で今までの業務のどの部分がどのように変わるのかデータ分析講座（その78）

その79

小さな成功体験を積むと上手くいくデータ分析講座（その79）

その80

　データ分析結果にリアリティをデータ分析講座（その80）

その80

業務プロセスを捉えることで、人の動きが見え、データ分析に具体性と躍動感が生まれるデータ分析講座（その80）

その81

データ分析は脇役、課題解決の道具データ分析講座（その81）

その82

データ分析活用の視点とはデータ分析講座（その82）

その83

データ分析のビジネス成果は金額でデータ分析講座（その83）

その84

分析者がビジネスへの意識を高めるにはデータ分析講座（その84）

その85

デジタルトランスフォーメーションとはデータ分析講座（その85）

その86

見える化のその先へデータ分析講座（その86）

その87

小売の売上分析データ分析講座（その87）

その88

新規顧客のターゲット選定データ分析講座（その88）

その89

データ分析・活用の2層構造の理解データ分析講座（その89）

その90

見落とされていた事実の発見とはデータ分析講座（その90）

その91

データ分析結果のレポートとはデータ分析講座（その91）

その92

データ分析・活用の属人化とはデータ分析講座（その92）

その93

ナレッジシェアの実現データ分析講座（その93）

その94

有象無象なデータとはデータ分析講座（その94）

その95

理解されやすく成果の出やすいデータ分析データ分析講座（その95）

その96

SNSデータの活用とはデータ分析講座（その96）

その97

データ活用に投資する前に分析で成果をデータ分析講座（その97）

その98

情報分析官必読の三大古典とはデータ分析講座（その98）

その99

問題はデータ分析結果を活用しないことデータ分析講座（その99）

その100

ガベージイン・ゴスペルアウトとはデータ分析講座（その100）

その101

課題解決アプローチデータ分析講座（その101）

その102

クロスセクションデータとはデータ分析講座（その102）

その103

判別分析データ分析講座（その103）

その104

運用型データ分析単体では実現不可能データ分析講座（その104）

その105

アクション系のデータとはデータ分析講座（その105）

その106

機械学習とはデータ分析講座（その106）

その107

結果系データしかないときの分析とはデータ分析講座（その107）

その108

コーホートを活用した受注予測モデルとはデータ分析講座（その108）

その109

データサイエンティストとはデータ分析講座（その109）

その110

活用ストーリーのないデータ分析は危険データ分析講座（その110）

その111

データ分析・活用、進化の順番とはデータ分析講座（その111）

その112

データ分析・活用のアプローチとはデータ分析講座（その112）

その113

　データ分析・活用の戦略的資産データ分析講座（その113）

その114

知恵が鍵を握る時代データ分析講座（その114）

その115

データを活用する領域とはデータ分析講座（その115）

その116

予測モデルの活用とはデータ分析講座（その116）

その117

データサイエンスで人が起こしたミラクルをサポートするデータ分析講座（その117）

その118

データサイエンティストを支える人財とはデータ分析講座（その118）

その119

データサイエンティスト必須のスキルとはデータ分析講座（その119）

その120

データサイエンスで成果を出さないときの共通点データ分析講座（その120）

その121

データ文化を醸成するにはデータ分析講座（その121）

その122

データサイエンス波及の5つのポイントデータ分析講座（その122）

その123

データ環境によって成長が大きく異なるAI データ分析講座（その123）

その124

PPDACサイクルとはデータ分析講座（その124）

その125

データ分析の役回りとはデータ分析講座（その125）

その126

立場によって意味合いが異なる見える化データ分析講座（その126）

その127

データサイエンス実践の成否とはデータ分析講座（その127）

その128

ジョハリの窓とはデータ分析講座（その128）

その129

データとドメインを結びつけ価値創造する者データ分析講座（その129）

その130

リスク少なく物事を上手く運ぶにはデータ分析講座（その130）

その131

企業規模とデータサイエンスデータ分析講座（その131）

その132

SOR理論データ分析講座（その132）

その133

データ活用で肝となるモデルとはデータ分析講座（その133）

その134

筋のいいテーマを選んでいないとはデータ分析講座（その134）

その135

データ活用を利益に変えるデータ分析講座（その135）

その136

インフォメーションとインテリジェンスデータ分析講座（その136）

その137

テーマ候補の探し方データ分析講座（その137）

その138

データ分析のテーマデータ分析講座（その138）

その139

データから未来とアクションを検討するデータ分析講座（その139）

その140

データ分析は必ず「アクション」まで導き出すデータ分析講座（その140）

その141

解釈は事実と現場の頭の中にある現場感データ分析講座（その141）

その142

次のアクションにつなげるにはデータ分析講座（その142）

その143

アクションを考えるとはデータ分析講座（その143）

その144

金額に近い定量的な指標とはデータ分析講座（その144）

その145

分析・活用の成果は現場で生まれるデータ分析講座（その145）

その146

マイナスの売上変動とプラスのコスト変動データ分析講座（その146）

その147

問題解決フレームワークPPDACとはデータ分析講座（その147）

その148

誰でも使えるQC7つ道具（ヒストグラムと管理図）データ分析講座（その148）

その149

誰でも使えるQC7つ道具（散布図）データ分析講座（その149）

その150

誰でも使えるQC7つ道具（パレート図と特性要因図）データ分析講座（その150）

その151

新QC７つ道具（親和図法）データ分析講座（その151）

その152

新QC７つ道具（系統図法）データ分析講座（その152）

その153

新QC７つ道具のマトリクス解析法とはデータ分析講座（その153）

その154

手法の知識・使い方と成果の関係データ分析講座（その154）

その155

数理統計学的な厳密性との狭間でデータ分析講座（その155）

その156

グラフを眺めただけの判断は要注意データ分析講座（その156）

その157

回帰分析とはデータ分析講座（その157）

その158

SOR理論とデータ分析の「XYZフレームワーク」データ分析講座（その158）

その159

DS人財に求められる力データ分析講座（その159）

その160

データ分析の容易性を評価する3つの視点データ分析講座（その160）

その161

取り組むテーマを経験・勘・度胸で決定データ分析講座（その161）

その162

今までにない気付きが発見されると分析結果が疑われるデータ分析講座（その162）

その163

疑われたデータ分析のメリットデータ分析講座（その163）

その164

分析データの粒度はより細かくデータ分析講座（その164）

その165

データ活用の失敗をデータで判断することのできない人々データ分析講座（その165）

その166

データサイエンス人財の育成データ分析講座（その166）

その167

データを使い継続的に改善するデータ分析講座（その167）

その168

ゲーム理論的データ分析・活用術データ分析講座（その168）

その169

災害時の対処とデータ分析・活用データ分析講座（その169）

その170

即時的データ分析・活用データ分析講座（その170）

その171

データに基づくポリティクスと意思決定データ分析講座（その171）

その172

レコメンドのためのデータ分析：データ分析講座（その172）

その173

データ分析から垣間見られる人となり：データ分析講座（その173）

その174

データ活用力とはデータ分析講座（その174）

その175

急激な変化をデータで見極めるデータ分析講座（その175）

その176

データ分析・活用のテーマデータ分析講座（その176）

その177

データ分析・活用のテーマ選びとはデータ分析講座（その177）

その178

データサイエンス実践、3つの壁データ分析講座（その178）

その179

分析・活用の「テーマ」は何ですかデータ分析講座（その179）

その180

データ活用する現場のお困りごととはデータ分析講座（その180）

その181

ダイナミックプライシングとはデータ分析講座（その181）

その182

AI技術と現場の融合とはデータ分析講座（その182）

その183

ミルの比較分析データ分析講座（その183）

その184

自動機械学習データ分析講座（その184）

その185

販売力を高めるデータ分析の技術データ分析講座（その185）

その186

データドリブンとは「データ用いた継続的改善」であるデータ分析講座（その186）

その187

ケーススタディ①「リード（見込み顧客）の選別」データ分析講座（その187）

その188

データ分析・活用で成果を出すには知識のじならしが重要そうだデータ分析講座（その188）

その189

最近多いケーススタディ②「広告・販促の最適投資配分」データ分析講座（その189）

その190

最近多いケーススタディ③「お勧め商材のレコメンド」データ分析講座（その190）

その191

最近多いケーススタディ④「出世魚分析（隠れた宝石探し）」データ分析講座（その191）

その192

最近多いケーススタディ⑤「チャーン分析（離反顧客分析）」データ分析講座（その192）

その193

最近多いケーススタディ⑥「モニタリング指標の異常検知」データ分析講座（その193）

その194

最近多いケーススタディ⑦「需要予測と発注最適化」データ分析講座（その194）

その195

ビジネスでのデータドリブンとアナリティクスとアナリシスデータ分析講座（その195）

その196

販売力を高めるデータ分析とはデータ分析講座（その196）

その197

継続性を持たせる「データドリブン化」の仕組みデータ分析講座（その197）

その198

データ分析上必須な2つのロジカルシンキングデータ分析講座（その198）

その199

テーマ設定とギャップ分析データ分析講座（その199）

その200

データ活用の可能性を高めるたった1つのことデータ分析講座（その200）

その201

孫氏の教え（各個撃破せよ！）データ分析講座（その201）

その202

データ分析の初学者と自動機械学習データ分析講座（その202）

その203

最近注目を浴びてきた説明可能AIとはデータ分析講座（その203）

その204

機械学習ABテストデータ分析講座（その204）

その206

ビジネス要因分析の統計的因果探索データ分析講座（その205）

その207

前年踏襲という意味不明なロジックとはデータ分析講座（その206）

その208

異常検知は最も始めやすいデータ活用の1つデータ分析講座（その207）

その209

時系列データを使った3つのデータ活用データ分析講座（その208）

その210

事例から分かるデータインサイト×現場感データ分析講座（その209）

その211

点予測と区間予測データ分析講座（その210）

その212

需要予測とはデータ分析講座（その211）

その213

DXとはデータ分析講座（その212）

その214

データによる効果検証とネクストアクションデータ分析講座（その213）

その215

効果検証のための回帰不連続デザイン分析データ分析講座（その214）

その216

指標の名称の付け方で印象操作データ分析講座（その215）

その217

パレート指数による売上分析データ分析講座（その216）

その218

なぜ、開票率数%で当確なのか？データ分析講座（その217）

その219

見える化の魔力データ分析講座（その218）

その220

現場感とデータ分析データ分析講座（その219）

その221

完璧にデータを集めなければならないのかデータ分析講座（その220）

その222

誰かが困っているところで、循環経済を起こせ！データ分析講座（その221）

その223

「相関」は曲がったことが大っ嫌いデータ分析講座（その222）

その224

数値予測は9つのシナリオで実施するデータ分析講座（その223）

その225

5つのデータ分析データ分析講座（その224）

その226

課題発見型データ分析と課題解決型データ分析データ分析講座（その225）

その227

成功確度とデータサイエンスデータ分析講座（その226）

その228

データがあるから何かやってデータ分析講座（その227）

その229

上手くいかないと思ったらデータで裏付けデータ分析講座（その228）

その230

やったことのないデータ活用を率先してやるデータ分析講座（その229）

その231

DXという見栄の代償データ分析講座（その230）

その232

DXを阻む「鉛筆を舐めておけ文化」データ分析講座（その231）

その233

DXはIT投資ではなく人財投資へデータ分析講座（その232）

その234

利益病とデータ活用データ分析講座（その233）

その235

現場に寄り添い過ぎる危険データ分析講座（その234）

その236

ホメオスタシスな現場を動かすのは大変データ分析講座（その235）

その237

予測と事実と感想データ分析講座（その236）

その238

顧客特性を使いこなしデータ活用データ分析講座（その237）

その239

データサイエンティストに必要な鈍感力データ分析講座（その238）

その240

テーマ設定のすれ違いデータ分析講座（その239）

その241

データ活用と利益データ分析講座（その240）

その242

見える化だけで成果を出すのは指標設計しだいデータ分析講座（その241）

その243

見える化検討からアクション評価へデータ分析講座（その242）

その244

現場のデータ活用を阻害する高精度なモデルデータ分析講座（その243）

その245

ビジネスで活きる指標とは？データ分析講座（その244）

その246

評価指標の異常判断とはデータ分析講座（その245）

その247

データから根本原因を考えるフレームワークデータ分析講座（その246）

その248

データによる課題発見と課題解決データ分析講座（その247）

その249

データによる仮説検証の3段階アプローチデータ分析講座（その248）

その250

2つの市場反応分析データ分析講座（その249）

その251

顧客のチャーン予測（離反予測）データ分析講座（その250）

その252

需要予測モデル構築時の検討すべきポイントデータ分析講座（その251）

その253

見込み顧客の受注予測とはデータ分析講座（その252）

その254

時系列データの5種類の特徴量（説明変数）データ分析講座（その253）

その255

データの前処理とは何かデータ分析講座（その254）

その256

生存時間分析とはデータ分析講座（その255）

その257

3つの市場シェアとはデータ分析講座（その256）

その258

カテゴリー構築指数とブランド構築指数データ分析講座（その257）

その259

顧客生涯価値とはデータ分析講座（その258）

その260

新規拡大、既存奪い取りの判断指標とはデータ分析講座（その259）

その261

予測モデルの構築活用は現場がキーになるデータ分析講座（その260）

その262

視座の高低と将来予測データ分析講座（その261）

その263

時系列予測モデルの複数先予測データ分析講座（その262）

その264

営業部隊の成果指標とはデータ分析講座（その263）

その265

顧客満足度・探索意向率・NPSとはデータ分析講座（その264）

その266

データは副産物ではなく血液であるデータ分析講座（その265）

その267

点過程データと時系列データデータ分析講座（その266）

その268

データ分析と収穫逓減の法則と果汁理論データ分析講座（その267）

その269

データ活用はPoVでデータビジネスはPoBでデータ分析講座（その268）

その270

A/Bテストの７ステップデータ分析講座（その269）

その271

階層時系列データと予測モデル構築データ分析講座（その270）

その272

もっとも手軽なAIである異常検知データ分析講座（その271）

その273

複数の季節変動成分のある時系列データデータ分析講座（その272）

その274

ステークホルダーアップデートとはデータ分析講座（その273）

その275

分析結果レポートのポイントデータ分析講座（その274）

その276

データ活用上の「お困りごと」の混在とはデータ分析講座（その275）

その277

データ起点で考える不幸データ分析講座（その276）

その278

横展開という悪魔データ分析講座（その277）

その279

データサイエンスの基礎体力づくりとはデータ分析講座（その278）

その280

一人歩きする数字データ分析講座（その279）

その281

データで騙す預言者になるデータ分析講座（その280）

その282

データをいくら集めても100発0中が当たり前データ分析講座（その281）

その283

ビジネスインテリジェンスツールデータ分析講座（その282）

その284

データ活用が上手くいっていないと感じたらデータ分析講座（その283）

その285

データで出来ることとテーマ選定の難しさデータ分析講座（その284）

その286

アクションを導くために考えるべきことデータ分析講座（その285）

その287

データ活用の成果は金額換算でデータ分析講座（その286）

その288

実務で使える5つの数理モデルデータ分析講座（その287）

その289

データ分析に立ちはだかる実践・活用の壁データ分析講座（その288）

その290

比較というキーワードでチャレンジしようデータ分析講座（その289）

その291

上手くいくかどうかはテーマ設定次第データ分析講座（その290）

その292

データ分析はPDCAの「Check」から始まるデータ分析講座（その291）

その293

分析成果を上手く説明できていますかデータ分析講座（その292）

その294

データ活用の成果にはタイムラグがあるデータ分析講座（その293）

その295

ローギアとハイギアとデータ活用プロジェクトデータ分析講座（その294）

その296

データ活用の成否を握るのは周辺人データ分析講座（その295）

現在記事

統計的機械学習で使用する混同行列と評価指標データ分析講座（その296）

その298

データから垣間見る人間模様を想像する事象理解データ分析講座（その297）

その299

データ活用プラットフォームとデータサイエンスデータ分析講座（その298）

その300

シンプルで始めやすいABテスト入門データ分析講座（その299）

統計的機械学習で使用する混同行列と評価指標データ分析講座（その296）

統計的機械学習で使用する混同行列と評価指標データ分析講座（その296）

1. 混同行列（Confusion Matrix）

2. 評価指標

3. 正解率（Accuracy）

4. 精度・適合率（Precision）・陽性反応適中度（positive predictive value）

5. 再現率（Recall）・感度（Sensitivity）

6. 陰性的中率（Negative predictive value）

7. 特異度（Specificity）

8. F1スコア（F1 Score）

9. F-βスコア（F-beta Score）

10. マシューズ相関係数（Matthews Correlation Coefficient）・ファイ係数（Phi coefficient）

11. バランス正解率（Balanced Accuracy）

1. 混同行列（Confusion Matrix）

2. 評価指標

3. 正解率（Accuracy）

4. 精度・適合率（Precision）・陽性反応適中度（positive predictive value）

5. 再現率（Recall）・感度（Sensitivity）

6. 陰性的中率（Negative predictive value）

7. 特異度（Specificity）

8. F1スコア（F1 Score）

9. F-βスコア（F-beta Score）

10. マシューズ相関係数（Matthews Correlation Coefficient）・ファイ係数（Phi coefficient）

11. バランス正解率（Balanced Accuracy）

この記事の著者

この記事の著者

この連載の他の記事

ＩＴ業務処理統制評価の基礎実務～制度改訂を見越した、実務対応可能な評価手続を解説～

「食」に押し寄せるデジタル化の波

経営における「個人データ」の利活用の実務

この記事の著者

関連セミナー

ＩＴ業務処理統制評価の基礎実務～制度改訂を見越した、実務対応可能な評価手続を解説～

「食」に押し寄せるデジタル化の波

経営における「個人データ」の利活用の実務

関連教材

関連Q&A

統計的機械学習で使用する混同行列と評価指標 データ分析講座（その296）

統計的機械学習で使用する混同行列と評価指標 データ分析講座（その296）

1. 混同行列（Confusion Matrix）

2. 評価指標

3. 正解率（Accuracy）

4. 精度・適合率（Precision）・陽性反応適中度（positive predictive value）

5. 再現率（Recall）・感度（Sensitivity）

6. 陰性的中率（Negative predictive value）

7. 特異度 （Specificity）

8. F1スコア（F1 Score）

9. F-βスコア（F-beta Score）

10. マシューズ相関係数（Matthews Correlation Coefficient）・ファイ係数（Phi coefficient）

11. バランス正解率（Balanced Accuracy）

1. 混同行列（Confusion Matrix）

2. 評価指標

3. 正解率（Accuracy）

4. 精度・適合率（Precision）・陽性反応適中度（positive predictive value）

5. 再現率（Recall）・感度（Sensitivity）

6. 陰性的中率（Negative predictive value）

7. 特異度 （Specificity）

8. F1スコア（F1 Score）

9. F-βスコア（F-beta Score）

10. マシューズ相関係数（Matthews Correlation Coefficient）・ファイ係数（Phi coefficient）

11. バランス正解率（Balanced Accuracy）

この記事の著者

この記事の著者

この連載の他の記事

「情報マネジメント一般」の他のキーワード解説記事

「情報マネジメント一般」の活用事例

関連する「情報マネジメント」セミナー

ＩＴ業務処理統制評価の基礎実務 ～制度改訂を見越した、実務対応可能な評価手続を解説～

「食」に押し寄せるデジタル化の波

経営における「個人データ」の利活用の実務

この記事の著者

関連セミナー

関連教材

関連Q&A

統計的機械学習で使用する混同行列と評価指標データ分析講座（その296）

統計的機械学習で使用する混同行列と評価指標データ分析講座（その296）

7. 特異度（Specificity）

7. 特異度（Specificity）

ＩＴ業務処理統制評価の基礎実務～制度改訂を見越した、実務対応可能な評価手続を解説～