数年前から拡張分析(Augmented Analytics)の時代が来ると叫ばれていました。拡張分析(Augmented Analytics)とは、AIによるデータ分析(Analytics)のことで、通常のアナリティクス業務をAIで自動化することです。どこまでアナリティクスを自動化するかというと、前処理からインサイト、つまり何をすべきかというレコメンドを出すところまでです。ここで言うAIとはML(機械学習)技術のことです。数年前には夢物語と言われた拡張分析(Augmented Analytics)の世界が現実に近づきつつあります。今回は「近づくAIによるデータ分析『拡張分析』(Augmented Analytics)の時代」というお話しをします。
【記事要約】
拡張分析(Augmented Analytics)とは、AIによるデータ分析(Analytics)のことです。通常のアナリティクス業務をAIで自動化することで、どこまでアナリティクスを自動化するかというと、前処理からインサイトつまり何をすべきかというレコメンドを出すところまでです。データサイエンティストや機械学習エンジニアなどの専門職だけでなく、何よりも専門職でないビジネスパーソンにも多大なるメリットをもたらせます。労働者が減り続ける少子高齢化社会であればあるほど重要になってきます。分かりやすく登場したのは、Auto ML(自動機械学習)です。すでに多くのツールが無料で提供されています。
1. 拡張分析(Augmented Analytics)とは
拡張分析(Augmented Analytics)は、AIつまりML技術を使用し、データ分析(アナリティクス)プロセスを自動化および強化するものです。近年、データサイエンス業界で急速に成長している技術です。データ量が増加および複雑化するにつれ、従来のデータ分析(アナリティクス)のやり方だけでは限界があります。例えば、データの準備(ETLや特徴量エンジニアリング、前処理など)、データ分析(EDAや効果検証、モデル構築など)、インサイト(どうだったのか、どうなりそうか、何をすべきかなど)の生成を拡張分析(Augmented Analytics)が自動化もしくは強化(人の分析力を強化)することにより、大量のデータを活用しより良い方向にもっていくのに役立ちます。
2. 拡張分析、少子高齢化社会であればあるほど重要
拡張分析(Augmented Analytics)は、データサイエンティストや機械学習エンジニアなどの専門職だけでなく、何よりも専門職でないビジネスパーソンにも多大なるメリットをもたらせます。より多くのビジネスパーソンが、データドリブンな意思決定やアクションを行えるようになります。その結果、全体的なパフォーマンスを向上させ、より少ないインプット(労働や時間、コストなど)でより多いアウトプットを得ることが期待されます。労働者が減り続ける少子高齢化社会であればあるほど重要になってきます。
3. 拡張分析、想定されるメリット
拡張分析(Augmented Analytics)の想定されるメリットです。
- 人的エラー低減
- より迅速なインサイト
- より良い意思決定
- コラボレーション強化
- データ活用の民主化
人的エラー低減とは、拡張分析(Augmented Analytics)によりデータ分析(アナリティクス)業務の中で起こる人的エラーを低減することです。より迅速なインサイトとは、拡張分析(Augmented Analytics)によりデータ分析結果(評価結果、予測結果、レコメンドなど)がアウトプットされるスピードが高速化することです。より良い意思決定とは、拡張分析(Augmented Analytics)によりインサイトが迅速に手に入ることで、意思決定の精度が高まるとともにスピーディになることです。
コラボレーション強化とは、拡張分析(Augmented Analytics)基盤により、意思決定者や専門家でないビジネスパーソンと、データサイエンティストや機械学習エンジニアとの間のコラボレーションがスムーズになることです。データ活用の民主化とは、拡張分析(Augmented Analytics)により結果的に、より多くのビジネスパーソンがデータドリブンな意思決定をアクションを実現することです。理想は、データサイエンティストや機械学習エンジニアなどの専門家抜きでデータ活用できる状態です。
4. 機械学習モデルを自動で構築する機械学習
アナリティクス業務の中で、予測モデルや異常検知モデルなどの機械学習系のモデルを構築することがあります。この機械学習モデルの構築を、自動構築するAuto ML(自動機械学習)という機械学習技術があります。Auto ML(自動機械学習)そのもののようなものは、すでに20年前以上からありました。複数の予測モデルを構築し、最も予測精度の高いモデルを選定する、もしくはそれらの平均や投票を実施することで、予測値を決定する、というものです。その技術の発展は目覚ましく、そこそこの予測精度のモデルは、自動で構築できるようになっています。
5. 拡張分析のパーツが個々に完成しつつある
Auto ML(自動機械学習)以外にも、予測モデルのデータセットを前処理業務を助けるAuto Feature Engineering(自動特徴量エンジニアリング)、探索的データ分析をサポートするAuto EDA(自動探索的データ分析)やAuto Visualization(自動可視化)など、Auto〇〇という形で登場しています。それらをつなげれば、拡張分析(Augmented Analytics)が完成します。
要は、拡張分析(Augmented Analytics)のパーツが個々に完成しつつあるようです。と...
6. NLP(自然言語処理)技術との融合
人の「意思入れ」(判断)が必要な個所は、Chat Botによる双方向コミュニケーションにより「人の意思」をアナリティクスに反映することができそうです。例えば、Microsoftが発表した、ExcelなどとGPT-4を合体させた「Microsoft 365 Copilot」は、そのようなExcelによるアナリティクスを実現させそうな感じもします。
要は、NLP(自然言語処理)という機械学習技術の目覚ましい発展が、そのようなことを実現しそうだ、ということです。ビジネスユーザーやデータサイエンティスト、機械学習エンジニアなどの質問を理解した拡張分析(Augmented Analytics)AIが、様々なAuto〇〇を組み合わせ、リアルタイムにインサイトを生成し提供する、そのような世界です。
これらのインサイトは、使いやすいダッシュボードに表示され、データをすばやく簡単に探索し、アナリティクスの自動化もしくは強化を可能にすることでしょう。