シンプルで始めやすいABテスト入門 データ分析講座(その299)

更新日

投稿日

データ分析講座(その299)シンプルで始めやすいデータ活用、ABテスト入門

 

最もシンプルで始めやすいデータ活用の1つに、ABテストというものがあります。ABテストでは、統計的仮説検定に纏わる数理統計学の概念を最低限理解して置く必要があります。初学者にとって、ABテストの最初のハードルは統計的概念の理解です。今回は「生まれて初めてのABテスト超入門」というお話しをします。

【目次】

    【この連載の前回:データ活用プラットフォームとデータサイエンス データ分析講座(その298) へのリンク】

    ◆データ分析講座の注目記事紹介

     

    1. ABテストのシナリオ例

    あなたがECサイトを運営しているとしましょう。購入ボタンの色を、灰色から橙色に変えようと思っています。

    データ分析講座(その299)シンプルで始めやすいデータ活用、ABテスト入門

    次の3つの仮説が思い浮かびます。

    • 橙色のボタンは、灰色のボタンと同じ平均購入数をもたらす
    • 橙色のボタンは、灰色のボタンより多くの平均購入数をもたらす
    • 橙色のボタンは、灰色のボタンより少ない平均購入数をもたらす

    この仮説を次の2つに集約します

    • 橙色のボタンは、灰色のボタンと同じ平均購入数をもたらす
    • 橙色のボタンは、灰色のボタンの異なる平均購入数をもたらす

    この仮説を検証するために、対象者をA群とB群に分けABテストを実施します。

    • A群:灰色のボタンを表示する群(統制群/対照群、control group)
    • B群:橙色のボタンを表示する群(実験群/処置群、experimental group/treatment group)

    A群とB群はランダムに割り付けます。ある程度のデータが蓄積されたタイミングで、A群とB群の平均購入数を比較し、白黒はきりさせます。

     

    2. 統計的仮説検定

    データ分析講座(その299)シンプルで始めやすいデータ活用、ABテスト入門

    先程、次の2つの仮説を立てました。それぞれ、帰無仮説と対立仮説といいます。

    • 帰無仮説H0:橙色のボタンは、灰色のボタンと同じ平均購入数をもたらす
    • 対立仮説H1:橙色のボタンは、灰色のボタンの異なる平均購入数をもたらす

    統計的仮説検定とは、帰無仮説H0を破棄するに十分な証拠があるかどうかを判断します。帰無仮説H0を破棄することになって、初めて対立仮説H1を採択します。そうでない場合(帰無仮説H0を破棄できない場合)、実は何も言えません。要は、帰無仮説H0を破棄し対立仮説H1を採択するかどうかしか、統計的仮説検定はできません。

     

    帰無仮説H0を破棄できない場合、証拠不十分で判定できません。このあたりが、ややこしいところです。

     

    3. 大数の法則と中心極限定理

    今、中学校1年生男子の平均身長を知りたいとします。この平均身長を知るには、中学校1年生男子全員の身長を測定する必要があります。非常に大変なことです。そこで登場するのが、中心極限定理です。

     

    中心極限定理によって、全員の身長を測定する手間から開放されます。例えば、中学校1年生男子をランダムに1,000 人のサンプルを集め、この1,000 人の身長の平均をとることで代替できるからです。全員の身長を測定するよりも、1,000 人の身長を測定する方が、はるかに安価で実現可能です。大数の法則とは、サンプル数を増やすとサンプルの平均身長 は、中学校1年生男子全員の身長の平均に近くなるということです。

     

    では、中心極限定理とは何なのか?

     

    元のデータが正規分布していなくても、その平均は正規分布に近づく傾向がある、というのが中心極限定理です。重要なことは、正規分布である程度語れる、ということです。この2つの統計的概念をベースに、統計的仮説検定は成り立っています。

     

    4. 統計的仮説検定に基づいたABテスト

    では、このことで何が嬉しいのでしょうか?中学校1年生男子全員の身長を測ることなく、1,000 人の身長を測定することで十分なら嬉しいでしょう。要は、そういうことです。

     

    ABテストを実施するとき、全てのデータを取得すること無く、白黒つけることが可能になるのです。そう考えると、ABテストの結果を白黒つけるには、ABテストをほぼ半永久的に実施する必要があります。それでは遅すぎます。ある程度のデータ量で白黒つけたいものです。そのようなことを実現するのが、統計的仮説検定に基づいたABテストです。

     

    白黒はっきりさせるまで、帰無仮説H0を破棄するまでデータを取り続けます。ただ、時間は有限なため、ある定期までデータを取り続けると計画するのが普通です。

     

    5. ABテスト : 間違うこともある

    ABテストは少ないデータ量で白黒はっきりさせようという取り組みのため、間違うことがあります。以下の2つの間違いです。

    • タイプ1過誤:帰無仮説H0が正しいのに、帰無仮説H0を棄却する間違い
    • タイプ2過誤:対立仮説H1が正しいのに、帰無仮説H0を棄却しない間違い

    意味分からないという方もいるかも知れませんが、このような間違いが起こる可能性があります。

    データ分析講座(その299)シンプルで始めやすいデータ活用、ABテスト入門

    少ないデータで白黒はっきりさせるには、この2つの間違いをある程度許容する必要があります。この2つの間違いを確率で表現します。

    • α:タイプ1過誤の起こる確率、有意水準やp値とも言われる
    • β:タイプ2過誤の起こる確率、1-βを検出力と言います

     

    6. 少ないデータで白黒を、はっきりさせる

    慣習的に、αである有意水準(p値)を0.05もしくは0.01に設定します。

     

    ECサイトで購入を迷っている訪問者に対し、購入ボタンの色をランダムに表示させます。灰色の購入ボタンを表示された方をA群...

    データ分析講座(その299)シンプルで始めやすいデータ活用、ABテスト入門

     

    最もシンプルで始めやすいデータ活用の1つに、ABテストというものがあります。ABテストでは、統計的仮説検定に纏わる数理統計学の概念を最低限理解して置く必要があります。初学者にとって、ABテストの最初のハードルは統計的概念の理解です。今回は「生まれて初めてのABテスト超入門」というお話しをします。

    【目次】

      【この連載の前回:データ活用プラットフォームとデータサイエンス データ分析講座(その298) へのリンク】

      ◆データ分析講座の注目記事紹介

       

      1. ABテストのシナリオ例

      あなたがECサイトを運営しているとしましょう。購入ボタンの色を、灰色から橙色に変えようと思っています。

      データ分析講座(その299)シンプルで始めやすいデータ活用、ABテスト入門

      次の3つの仮説が思い浮かびます。

      • 橙色のボタンは、灰色のボタンと同じ平均購入数をもたらす
      • 橙色のボタンは、灰色のボタンより多くの平均購入数をもたらす
      • 橙色のボタンは、灰色のボタンより少ない平均購入数をもたらす

      この仮説を次の2つに集約します

      • 橙色のボタンは、灰色のボタンと同じ平均購入数をもたらす
      • 橙色のボタンは、灰色のボタンの異なる平均購入数をもたらす

      この仮説を検証するために、対象者をA群とB群に分けABテストを実施します。

      • A群:灰色のボタンを表示する群(統制群/対照群、control group)
      • B群:橙色のボタンを表示する群(実験群/処置群、experimental group/treatment group)

      A群とB群はランダムに割り付けます。ある程度のデータが蓄積されたタイミングで、A群とB群の平均購入数を比較し、白黒はきりさせます。

       

      2. 統計的仮説検定

      データ分析講座(その299)シンプルで始めやすいデータ活用、ABテスト入門

      先程、次の2つの仮説を立てました。それぞれ、帰無仮説と対立仮説といいます。

      • 帰無仮説H0:橙色のボタンは、灰色のボタンと同じ平均購入数をもたらす
      • 対立仮説H1:橙色のボタンは、灰色のボタンの異なる平均購入数をもたらす

      統計的仮説検定とは、帰無仮説H0を破棄するに十分な証拠があるかどうかを判断します。帰無仮説H0を破棄することになって、初めて対立仮説H1を採択します。そうでない場合(帰無仮説H0を破棄できない場合)、実は何も言えません。要は、帰無仮説H0を破棄し対立仮説H1を採択するかどうかしか、統計的仮説検定はできません。

       

      帰無仮説H0を破棄できない場合、証拠不十分で判定できません。このあたりが、ややこしいところです。

       

      3. 大数の法則と中心極限定理

      今、中学校1年生男子の平均身長を知りたいとします。この平均身長を知るには、中学校1年生男子全員の身長を測定する必要があります。非常に大変なことです。そこで登場するのが、中心極限定理です。

       

      中心極限定理によって、全員の身長を測定する手間から開放されます。例えば、中学校1年生男子をランダムに1,000 人のサンプルを集め、この1,000 人の身長の平均をとることで代替できるからです。全員の身長を測定するよりも、1,000 人の身長を測定する方が、はるかに安価で実現可能です。大数の法則とは、サンプル数を増やすとサンプルの平均身長 は、中学校1年生男子全員の身長の平均に近くなるということです。

       

      では、中心極限定理とは何なのか?

       

      元のデータが正規分布していなくても、その平均は正規分布に近づく傾向がある、というのが中心極限定理です。重要なことは、正規分布である程度語れる、ということです。この2つの統計的概念をベースに、統計的仮説検定は成り立っています。

       

      4. 統計的仮説検定に基づいたABテスト

      では、このことで何が嬉しいのでしょうか?中学校1年生男子全員の身長を測ることなく、1,000 人の身長を測定することで十分なら嬉しいでしょう。要は、そういうことです。

       

      ABテストを実施するとき、全てのデータを取得すること無く、白黒つけることが可能になるのです。そう考えると、ABテストの結果を白黒つけるには、ABテストをほぼ半永久的に実施する必要があります。それでは遅すぎます。ある程度のデータ量で白黒つけたいものです。そのようなことを実現するのが、統計的仮説検定に基づいたABテストです。

       

      白黒はっきりさせるまで、帰無仮説H0を破棄するまでデータを取り続けます。ただ、時間は有限なため、ある定期までデータを取り続けると計画するのが普通です。

       

      5. ABテスト : 間違うこともある

      ABテストは少ないデータ量で白黒はっきりさせようという取り組みのため、間違うことがあります。以下の2つの間違いです。

      • タイプ1過誤:帰無仮説H0が正しいのに、帰無仮説H0を棄却する間違い
      • タイプ2過誤:対立仮説H1が正しいのに、帰無仮説H0を棄却しない間違い

      意味分からないという方もいるかも知れませんが、このような間違いが起こる可能性があります。

      データ分析講座(その299)シンプルで始めやすいデータ活用、ABテスト入門

      少ないデータで白黒はっきりさせるには、この2つの間違いをある程度許容する必要があります。この2つの間違いを確率で表現します。

      • α:タイプ1過誤の起こる確率、有意水準やp値とも言われる
      • β:タイプ2過誤の起こる確率、1-βを検出力と言います

       

      6. 少ないデータで白黒を、はっきりさせる

      慣習的に、αである有意水準(p値)を0.05もしくは0.01に設定します。

       

      ECサイトで購入を迷っている訪問者に対し、購入ボタンの色をランダムに表示させます。灰色の購入ボタンを表示された方をA群、橙色の購入ボタンを表示された方がB群です。しばらくデータを取得続けると、購入する人が現れ始めます。さらにデータを取得続けると、購入者数に差がつくかもしれません。その差が意味のある差なのかどうかを、統計的仮説検定で検討します。

      • 帰無仮説H0:橙色のボタンは、灰色のボタンと同じ平均購入数をもたらす
      • 対立仮説H1:橙色のボタンは、灰色のボタンの異なる平均購入数をもたらす

      このとき、出力されたp値の値を見ます。通常の統計学系のツールは、このp値を出力します。その値が、例えば0.05未満の場合に「有意な差がある」と見なし、帰無仮説H0を棄却し対立仮説H1を採択します。そして、平均購入数が高い方の購入ボタンの色が良い、と結論付けます。ただし、この結論は5%(0.05)の間違うリスクがあります。要は、有意水準(今回の例では5%)分の間違うリスクを許容する代わりに、少ないデータで白黒を、はっきりさせるということです。

       

      次回に続きます。

       

      【ものづくり セミナーサーチ】 セミナー紹介:国内最大級のセミナー掲載数 〈ものづくりセミナーサーチ〉 はこちら!

       

         続きを読むには・・・


      この記事の著者

      高橋 威知郎

      データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

      データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


      「情報マネジメント一般」の他のキーワード解説記事

      もっと見る
      CRM(顧客関係管理システム)とは データ分析講座(その39)

      ◆ CRMのデータ分析をダメにする〇〇管理という合言葉、すぐできる解決策とは?  CRM(顧客関係管理システム)などでやたらと出てくる言葉に、「〇〇...

      ◆ CRMのデータ分析をダメにする〇〇管理という合言葉、すぐできる解決策とは?  CRM(顧客関係管理システム)などでやたらと出てくる言葉に、「〇〇...


      PDCAサイクルとOODAループの根本的な違い データ分析講座(その41)

      【目次】 ◆ OODAは先進的で、PDCAサイクルは遅れている?と聞かれましたが  データ分析系の講座で、OODAループの話をした...

      【目次】 ◆ OODAは先進的で、PDCAサイクルは遅れている?と聞かれましたが  データ分析系の講座で、OODAループの話をした...


      ビジネスの現場で時系列データに遭遇したときに、押さえておくべき3つの視点とは データ分析講座(その53)

      ◆ ビジネス系のデータは、時系列が多い。そこで、先ず3つの視点で分析。  今どきの高校生は、統計学やデータ分析を普通に授業で学んでいます。私が高校時...

      ◆ ビジネス系のデータは、時系列が多い。そこで、先ず3つの視点で分析。  今どきの高校生は、統計学やデータ分析を普通に授業で学んでいます。私が高校時...


      「情報マネジメント一般」の活用事例

      もっと見る
      ソフトウェア特許とは(その1)

       色々と定義はありますが、ソフトウェア特許とは、よく言うビジネスモデル特許であり、情報システムの特許です。言葉に差はあると思いますが、我々実務家は、ソフト...

       色々と定義はありますが、ソフトウェア特許とは、よく言うビジネスモデル特許であり、情報システムの特許です。言葉に差はあると思いますが、我々実務家は、ソフト...


      人的資源マネジメント:製品開発の滞留を引き起こすファイルとは(その2)

       今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。    前回まで続けていたテ...

       今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。    前回まで続けていたテ...


      生産スピード向上と品質管理

       電子メールやインターネットの普及により、ビジネスのグローバル化が大きく進みましたが、IT技術の進歩は、品質管理の方法も進歩させました。20数年前は製造条...

       電子メールやインターネットの普及により、ビジネスのグローバル化が大きく進みましたが、IT技術の進歩は、品質管理の方法も進歩させました。20数年前は製造条...