以下の類似セミナーへのお申込みをご検討ください。
逆強化学習の適用例や最近の事例についてもお話しします!
セミナープログラム
1 逆強化学習の位置づけ・機械学習の基礎
1.1 逆強化学習と機械学習・最適制御の関係
*強化学習は制御と関連が強い
*逆強化学習と強化学習(最適制御)と何が違う?
1.2 機械学習の基礎のおさらい
*生成的 / 識別的
*経験リスク最小化
*様々な損失
*2クラス分類 / 他クラス分類 / 系列ラベル分類
…構造的なデータに対しても「識別」は定義できる ⇒ 逆強化学習ではどうやって解く?
2 逆強化学習の定式化・解法
2.1 強化学習の基礎:マルコフ決定過程、ベルマン方程式
*動的システム
*マルコフ性
*マルコフ決定過程 / 報酬関数
*価値関数 / ベルマン方程式
2.2 逆強化学習の定式化とアルゴリズム
*報酬期待値の最大化
*損失関数の設定
*最大エントロピー逆強化学習
*周辺分布の獲得前向き・後ろ向き計算
2.3 逆強化学習を適用しようとすると起きる問題は??
3 逆強化学習の適用例・最近の事例
3.1 海外での適用事例、下坂研究室での事例
*(簡易版)車線変更
*経路選択
*Zone 30マルコフの加減速モデリング
3.2 連続・高次元化に向けた方向性、深層学習との融合
*関数近似の利用、離散化の工夫
*連続空間上のIRL:分配関数(積分計算)の近似がポイント
*この分野も深層NN、さらにはGANの導入が始まってきている
セミナー講師
下坂 正倫(しもさか まさみち) 氏
東京工業大学 情報理工学院 情報工学系 准教授(博士(情報理工学))
セミナー受講料
お1人様受講の場合 51,700円[税込]/1名
1口でお申込の場合 62,700円[税込]/1口(3名まで受講可能)
受講申込ページで2~3名を同時に申し込んだ場合、自動的に1口申し込みと致します。
受講について
- 本セミナーの受講にあたっての推奨環境は「Zoom」に依存しますので、ご自分の環境が対応しているか、お申込み前にZoomのテストミーティング(http://zoom.us/test)にアクセスできることをご確認下さい。
- インターネット経由でのライブ中継ため、回線状態などにより、画像や音声が乱れる場合があります。講義の中断、さらには、再接続後の再開もありますが、予めご了承ください。
- 受講中の録音・撮影等は固くお断りいたします。
※セミナーに申し込むにはものづくりドットコム会員登録が必要です
開催日時
10:30 ~
受講料
51,700円(税込)/人
※本文中に提示された主催者の割引は申込後に適用されます
※銀行振込
開催場所
全国
主催者
キーワード
機械学習・ディープラーニング AI(人工知能) 情報技術
※セミナーに申し込むにはものづくりドットコム会員登録が必要です
開催日時
10:30 ~
受講料
51,700円(税込)/人
※本文中に提示された主催者の割引は申込後に適用されます
※銀行振込
開催場所
全国
主催者
キーワード
機械学習・ディープラーニング AI(人工知能) 情報技術関連セミナー
もっと見る関連教材
もっと見る関連記事
もっと見る-
ニューラルネットワークとは?仕組みと種類、活用事例等をご紹介!
【目次】 ニューラルネットワークは、人工知能(AI)の中でも特に注目されている技術の一つです。人間の脳の働きを模倣したこの仕組みは、... -
生成AIの能力比較:生成AI、工場でどこまで使えるのか(その3)
近い将来、対話型AIが現行の検索エンジンにとって代わる可能性が指摘されていますが、今回は、連載解説(その3)生成AIの能力比較。を解説... -
生成AIの回答を検証する:生成AI、工場でどこまで使えるのか(その2)
近い将来、対話型AIが現行の検索エンジンにとって代わる可能性が指摘されていますが、今回は、連載解説(その2)生成AIの回答を検証するを... -
プロンプトエンジニアリング:生成AI、工場でどこまで使えるのか(その1)
近い将来、対話型AIが検索エンジンにとって代わる可能性が指摘されていますが、今回は、生成AIの活用方法をいろいろと試す「生成AIは、工...