【機械学習とは 連載目次】
前回のその2に続き解説します
1. 異常検知
機械学習がやっていることの本質は分類ですが、もう一つの役割として将来予測があります。最近のAIの話題で機械設備の故障予知があり、セキュリティの攻撃検知にも応用が考えられています。両者に共通しているのは、異常状態の検知で、定常状態からの逸脱をいかに検出するかということになります。
そのためには、定常状態に関する情報を多く知っておかないと異常か正常かの判別がつかないことになります。また、はずれ値をどう定義するかは結構難しいこともあります。はずれ値なのか、ノイズによる外乱なのかの見極めが必要です。はずれ値を検知する手法には以下のようなものが知られています。
2. 製造現場のニーズ
上記手法以外にも、One Class SVMのように様々なものがありますが、最新の手法が必ずしも有効で優れているというわけでもありません。k-近傍法は歴史も古いオーソドックスなものですが、 今日も色々な場面で非常によく使われています。
ところで、このようなはずれ値の検知ということが、現状の設備では何もなされていないのかというと、プラントの運転監視では当然行われています。計装関係の方にはおなじみですが、反応槽とかタンクの液位、圧力、温度などはセンサーで常時監視しています。そこでよく行われているのは、上下限値を逸脱していないか、中長期での変動傾向があるかといったトレンド把握です。
このように、現場保守員の長年の経験も含め、状態把握ができていないわけではありませんが、見るべきポイントが数百、数千あり多いということ、ベテランの経験・技に依存してきたため、そうした知見が継承されていない、警報情報は多く記録されているが体系立てた整理もなされていないため、ムダも多いなど現場サイドのニーズがあります。
また、機器の予防保守ということでは定期点検でチェックしていたり、一定時間経過した時点で交換するということも行われていますが、必要な時だけ保守しないとコストがかさむという事情もあります。 機械学習がこれらの要望の全てに答えることができるわけではありませんが、一定の効果を得られる可能性はあります。
3. 教師あり学習と教師なし学習
機械学習には大きく「教師あり学習」と「教師なし学習」に大別されます。機械学習が取り扱うべきデータには、これは犬の画像、これは猫の画像であるとか、この波形は正常時のもの、こっちは異常時の波形である、というように何に分類されるかがあらかじめ分かっている場合とそうではない場合があります(この時、犬/猫、正常/異常のような知りたい情報を目的変数といい、その判定に用いた画像、波形などを説明変数といいます)。
前者を教師あり学習といい、そうしたデータをラベル付きデータといいます。一方、...