昨今、ベイズ統計という言葉をよく耳にするようになりました。標本統計は古典統計と言われており、なんかもう時代遅れ?私たちはこれまで工程品質管理や品質保証において、記述統計、推計統計学を用いて活動をしてきました。この活動が間違っていたのか?と最近、疑問を持つほどベイズ統計がもてはやされている気がしています。
ついては、製造業における品質管理/保証/改善活動においてこれまでの記述統計、推定統計が引き続き活躍できる場面(またはこれらの手法でないと出来ない場面、ベイズ統計より得意とする場面)と、ベイズ統計が有効な場面(標本統計より得意とする場面)とは何なのでしょうか?
いろいろとインターネットには出ていますが、いまひとつ理解出来ません。なんのためにベイズを学ばないとならないのか?また、なんのためにこれからも標本統計を使い続けないとならないのか?製造業における各種統計学の違いとその結果何をもたらしてくれるのか?
どうかお知恵をお借りしたいです。
標本統計(古典統計)とベイズ統計の違いは,「母数(パラメータ)を考える時,前者はこれを定数と考え,後者は確立変数と考える」と説明することがあります.この考えをもとに,質問を下記Q.1からQ.5に再定義して回答させて頂きます.回答には製造業における統計的品質管理(Statistical Quality Control: SQC)を実践してきた自身の私見が含まれることをお断りしておきます.
Q.1 製造業のSQC活動において,古典統計が有利な場面は?
日本では,小学校から学ぶ確率・統計は基本的に古典統計です.「袋の中からサンプルを取り出し,その性質を調べた後,サンプルは袋に戻したうえで次のサンプルを取り出す」ことを繰返します.このような古典統計を学んだ学生が企業に入社し,企業の中で古典統計に基づく品質管理を教育すれば,比較的早く戦力となる利点があり,教育費が節約できます.
また,古典統計では母数は定数であり,それは製造業におけるあるべき姿,または製品の規格値と結びつきます.1つに定まったあるべき姿を前提にすることは,母数を確率変数としてとらえるベイズ統計とは異なるものです.
さらにベイズ統計では主観確率を用いる場面において分析者の裁量が働くため,同じデータを使用しても解析者のレベルによって解析結果が異なること,再現性が低いことが挙げられます.このため製薬業における薬効の検証には不適切だと考えます.また一般的な学術論文などで客観性を重視される場合は古典統計が有利だと考えます.
Q.2 製造業のSQC活動において,ベイズ統計が有利な場面は?
ベイズ統計が有利な場面はビッグデータの解析です.製造装置に多数のセンサーを取り付け,常時モニターで得られたビッグデータをベイズ統計で解析し,故障予知や生産性の向上に役立てることが行われています.解析には様々な手法を組合せ,常時モニターで得られたビッグデータを解析することで故障率の小さい装置からも有益な情報を得られるようです.
さらに製造業を,企画→設計→製造→販売→企画→設計・・・の4事業の循環構造で考察したとき,ベイズ統計が有利な場面は販売→企画のマーケティングであると言われています.これは販売前のデータに基づく販売予想の事前確率に,販売後のデータを適用して事後確率を推定し,新たなマーケティング企画を作成する「ベイズ更新」を実践したものです.
Q.3 何のためにこれからも標本統計を使い続けなければならないのか?
「スープの味を確認するとき,鍋のスープを全て飲む必要はない」という例え話があります.スープを全て飲んでしまうと客に提供するものがなくなります.すなわち全数検査に経営的な問題があればサンプリングをする必要が生じます.
また社会調査において全数検査(調査)を行うとプライバシーの問題が発生します.さらにベイズ統計では主観確率に恣意的な判断が入ります.もし権力を所有している公的機関が全数検査やベイズ統計による解析を行うと事態は深刻です.
標本統計は長い歴史の中で一定の評価を得ており,特に製造業のSQCではその客観性が信頼性の理論的基盤となっています.マーケティングは得意ではありませんが,ものづくりの現場では今後も重要なツールであると考えています.
Q.4 何のためにベイズ統計を学ばないとならないのか?
コンピュータが発達しビッグデータが処理できる状況において,わざわざ標本抽出をする必要がなければ,標本統計を使う意味を考えなければなりません.Q.3 とも関連しますが,全数調査を行えば標本集団=母集団であり仮説検定は不要です.すなわち標本統計を使用すべき前提条件がなくなり,ベイズ統計を積極的に活用すべきだと考えます.もちろん全数調査データから標本抽出をする場合もあるかもしれませんが,その場合は,なぜ標本抽出を行ったのかを説明する必要があるでしょう.その説明として「標本統計しか知らなかった」「標本統計のほうがベイズ統計より信頼性が高いから」と答えることもできますが,前者では顧客の信用を失い,後者では多少の説明が必要かもしれません.
Q.5 製造業における統計学の適用とその結果得られる恩恵と損失は何か?
統計学は,記述統計学,推測統計,統計的決定理論の3領域から構成されていると言われています.そして製造業に限らず,すべての社会活動には供給者と消費者,製造者(メーカー)と使用者(ユーザー)の立場があります.それぞれの立場における恩恵は下記と考えます.
記述統計を適用し,その結果,対象の概要を把握できる.
推測統計を適用し,その結果,対象の性能や信頼性を評価できる.
統計的決定理論を適用し,その結果,決定すべき対象の開発や購買について判断できる.
一方,損失については多面的であるため一言では表現できませんが,統計学が数学の一部であり,その正確な適用と適切な運用にリスクとコストが発生します.すなわち不正確な適用と不適切な運用を行えば様々な損失が発生します.その損失を回避するためには人(データサイエンティスト),モノ(コンピュータ,ソフトウエア),カネ(人件費,研修費)が必要となるでしょう.
ここからは余談ですが,SQCが多くの企業で重要視されているか疑問です.統計知識を上から目線で展開し,製造現場やマネジメント層の信頼を失う場面も多いと聞きます.私も社内でSQCを推進してきましたが,その仕事ぶりを快く思わなかった人もいたようです.
そのような状況でビッグデータとベイズ統計が登場し,企画や販売で成果を挙げ,営業や経営層を喜ばせている状況も想像されます.このとき営業や経営層は外部のコンサルや解析業者を使ってデータ解析を行ったようです.社内の製造や生産技術のSQC関係者には声がかからなかったようです.
また,スマート工場の展示会で,経営者や女性事務員が多く見学していたことに驚きました.あるブースの説明員曰く.昨年までは「オートメーション」の展示会であった.内容はそれほど変わっていないが,今年は「スマート工場」で来客数が増えた.見学していたある企業の社長は,「『社長,うちの会社は何もしないで大丈夫ですか?』と言われてこうして見学している」,と話していたそうです.
ここからは私見になりますが,ベイズ統計もビッグデータやデータサイエンスを起点として営業や経営などで成果を挙げ,製造部門からみると「黒船来航」のように感じられるかもしれません.しかし,「地に足のついた」堅実な取組みが持ち味のSQCは日本のものづくり文化に合致していると考えております.ただし「品質管理」という言葉にこだわることなく,ものづくりの現場に科学とビジネスを取り込む「データサイエンス」を私自身も実践しようと考えております.技術の進歩に取り残されないよう,かつ日本の強みを生かせるよう,もう少し研究してゆこうと考えております.
|