◆ 古くて新しい自動機械学習
似たような数理モデルあり、その中から数理モデルを選択してモデル構築する場合のことです。このようなことを自動化したのが、自動機械学習(Automated Machine Learning)というものです。今回は「古くて新しい自動機械学習(Automated Machine Learning)」というお話しです。
【目次】
1.数理モデルの構築プロセス
2.有料ツール
3.無料ツール
4.ハイブリッドな使い方が一番いいかも
1.数理モデルの構築プロセス
数理モデルを構築するプロセスは、例えば次のような感じではないでしょうか。
データ準備
↓
前処理(データクレンジング含む)
↓
特徴量生成・加工・選定
↓
モデル選定・パラメータ最適化・モデル評価
↓
デプロイ(展開)
昔からある「自動機械学習(Automated Machine Learning)」は「モデル選定・パラメータ最適化・モデル評価」の部分です。最近ですと「特徴量生成・加工・選定」のフィーチャーエンジニアリングの部分も対象にしているものもあるようです。しかしフィーチャーエンジニアリングの自動化は、まだ難しいのではないかと思います。
2.有料ツール
最近は、クラウド上で使える有料の自動機械学習(Automated Machine Learning)も出始めています。
有料版のもので、よく名前を聞くのが以下です。
- AutoML Tables(Google)
- AutoAI(IBM)
- Automated ML(Microsoft)
- DataRobot(DataRobot)
- AutoFlow(MatrixFlow)
- Driverless AI(H20.ai)
有料版だけあって、ユーザインターフェースが綺麗です。
3.無料ツール
データ分析や数理モデル構築といえば、最近ではRやPython、Juliaなどの無料で使えるものが多数あります。
自動機械学習(Automated Machine Learning)も例外ではなく、幾つかあります。RやPyhton上で動かすものです。
- R automl
- R RemixAutoML
- AUTO-WEKA
- Python auto-sklearn
- Python TPOT
4.ハイブリッドな使い方が一番いいかも
恐らく、ある程度の数理モデル構築経験のある人であれば、自動機械学習(Automated Machine Learning)で構築した数理モデルの精度を超えることはできるでしょう。有料の自動機械学習(Automated Machine Learning)ツールの場合、安くはないです。無料あれば、コスト面を気にする必要はないことでしょう。しかし、RやPython上で実施するため、それなりのスキルは必要になります。
そうなると、無料版を使うとき初心者にはそれなりのハードルがあります。無料版の現状一番いい使い方は、ハイブリッドな使い方が一番いいかもしれません。手作りのモデル構築をサポートする形で、自動機械学習の機能を活用する、という感じです。
特に、「特徴量生成・加工・選定」のフィーチャーエンジニアリングの部分は、人手が必要な気がしま...