データ生成・蓄積・活用に基づいたマテリアルズ・インフォマティクス入門 ~ベイズ最適化・データベース構築・スパースモデリングの基礎と実例~

マテリアルズインフォマティクスに必要な機械学習の知識、機械学習以外のノウハウ、実践知識までしっかりわかる!

セミナー趣旨

  マテリアルズ・インフォマティクス(MI)や研究デジタルトランスフォーメーション(DX)は、情報科学・技術を駆使して材料研究・開発を刷新することが目的であり、今後の国際競争を勝ち抜くための必須テーマです。本講座では、MIの実践事例を通じて、研究活動で生じるデータの生成・蓄積・活用のサイクルについて知っていただき、データ生成の観点からベイズ最適化、データ蓄積の観点からのデータベース構築、そしてデータ活用の観点からのスパースモデリングについて、必要な考え方・基礎知識について学んでいただきます。

受講対象・レベル

・マテリアルズ・インフォマティクスに興味はあるが、何から始めて良いかわからない方
・機械学習ライブラリをとりあえず使っているが中身について詳しく知りたい方
・具体的な材料開発の課題に対して機械学習を利用したいが、アプローチが不明な方

必要な予備知識

・材料研究/開発に関する基礎知識
・高校数学程度の知識
・情報科学やプログラミングに関する用語の知識

習得できる知識

・マテリアルズ・インフォマティクスでよく用いられる機械学習の基礎知識
・マテリアルズ・インフォマティクスを活用するための「機械学習」以外の重要なノウハウ
・マテリアルズ・インフォマティクスの適用事例に関する知識

セミナープログラム

1. マテリアルズ・インフォマティクス概要
 1.1 情報科学の活用に至った経緯
 1.2 機械学習の概要
 1.3 データ駆動型材料研究について
 1.4 データ駆動型材料研究の要素:データ生成
 1.5 データ駆動型材料研究の要素:データ蓄積
 1.6 データ駆動型材料研究の要素:データ活用
 1.7 機械学習応用の流れと課題設定の重要性
 1.8 物質・材料データの特徴と注意点
 1.9 「分かりたい」のか「見つけたい」のか
 1.10 情報科学市民権
2. データ取得のためのベイズ最適化
 2.1 ベイズ最適化の背後にある数理
 2.2 自律実験装置とAIソフトウェア
 2.3 ロボット制御のための環境整備
 2.4 GPyOpt
 2.5 OPTUNA
 2.6 PHYSBO
3. 材料データ蓄積を行う上で必要なこと
 3.1 データベース構築の3つの目的
 3.2 データベースの種類
 3.3 フラットファイルフォーマット
 3.4 ツリー構造を利用した実験データ蓄積
 3.5 電子ラボノートの事例
4. データベース開発に必要なスキルセット
 4.1 誰のためのDBか?
 4.2 開発コストの見積もり
 4.3 デスクトップアプリとウェブアプリ
 4.4 フロントエンドとバックエンド
 4.5 ウェブアプリ開発:Django
 4.6 ウェブアプリ開発:Streamlit
 4.7 ウェブアプリ開発:JavaScript
 4.8 ウェブアプリ開発:SQL
 4.9 ウェブアプリ開発:noSQL
 4.10 アジャイル開発という考え方
5.DB構築の出口戦略
 5.1 パーソナルDB
 5.2 DBを介した共同研究
 5.3 DBの共有・共用
 5.4 パブリックDB
 5.5 材料データと課題の多様性への対応
6. 予測(回帰):予測モデルとスパースモデリング
 6.1 予測・モデル選択の応用例
 6.2 「モデル」と「損失関数」
 6.3 線形回帰とカーネル法の違い
 6.4 損失関数の変更によるモデル選択
 6.5 交差検証によるモデル評価
 6.6 モデル推定の種類(最尤法, MAP推定, ベイズ推定)
 6.7 スパース性とL0, L1正則化
 6.8 説明可能性と特徴量選択 
7. 分類:スペクトルデータの低次元化とクラスター解析
 7.1 高次元データとしてのスペクトルと低次元化の重要性
 7.2 分類:教師あり学習と教師なし学習
 7.3 特徴空間と類似性
 7.4 主成分解析によるスペクトルの低次元化
 7.5 k-means法によるスペクトルの分類
 7.6 階層的クラスタリングによるスペクトルの分類
8. データ解析:スペクトル解析のためのEMアルゴリズムによるピーク検知
 8.1 ピーク検知のための処理フロー
 8.2 非線形最小二乗法の困難
 8.3 EMアルゴリズムによる最尤推定
 8.4 スペクトル解析のための改良EMアルゴリズム
 8.5 解析事例
<質疑応答>


■講演中のキーワード
マテリアルズ・インフォマティクス、プロセス・インフォマティクス、スパースモデリング、
機械学習、 データベース、 ベイズ最適化、予測、分類

セミナー講師

 東京工業大学 科学技術創成研究院 准教授 博士(理学)  安藤 康伸 氏

■ご略歴
2012年03月 東京大学 大学院理学系研究科 物理学専攻博士後期課程修了. 博士(理学).
2012年04月〜2013年04月 産業技術研究所 産総研特別研究員.
2013年05月〜2016年03月 東京大学大学院 工学系研究科マテリアル工学専攻 助教
2016年04月〜2018年09月 産業技術総合研究所 研究員.
2018年10月〜2024年03月 同所 主任研究員.
2022年07月〜 早稲田大学 先進理工学部 客員准教授
2024年より現職
■専門および得意な分野・ご研究:
計算物質科学, マテリアルズ・インフォマティクス, 表面・界面科学
■本テーマ関連学協会での活動:

日本表面真空学会 データ駆動表面科学研究部会 部会長 
学術誌Science and Technology of Advanced Materials: Methods 編集委員

セミナー受講料

【オンラインセミナー(見逃し視聴なし)】:1名47,300円(税込(消費税10%)、資料付)
*1社2名以上同時申込の場合、1名につき36,300円

【オンラインセミナー(見逃し視聴あり)】:1名52,800円(税込(消費税10%)、資料付)
*1社2名以上同時申込の場合、1名につき41,800円

*学校法人割引;学生、教員のご参加は受講料50%割引。

受講について

  • 配布資料はPDF等のデータで送付予定です。受取方法はメールでご案内致します。
    (開催1週前~前日までには送付致します)
    ※準備の都合上、開催1営業日前の12:00までにお申し込みをお願い致します。
    (土、日、祝日は営業日としてカウント致しません。)
  • 受講にあたってこちらをご確認の上、お申し込みください。
  • Zoomを使用したオンラインセミナーです
    →環境の確認についてこちらからご確認ください
  • 申込み時に(見逃し視聴有り)を選択された方は、見逃し視聴が可能です
    →こちらをご確認ください

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


10:30

受講料

47,300円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込、コンビニ払い

開催場所

全国

主催者

キーワード

マテリアルズインフォマティクス/ケモインフォマティクス   機械学習・ディープラーニング   化学技術一般

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


10:30

受講料

47,300円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込、コンビニ払い

開催場所

全国

主催者

キーワード

マテリアルズインフォマティクス/ケモインフォマティクス   機械学習・ディープラーニング   化学技術一般

関連記事

もっと見る