自然言語処理を活用した研究開発、材料分野への適応事例
★論文、特許、書籍、、書式・表現の統一性をどうするか?
材料関連分野に特化したモデルとは?
事例とともに解説します !
セミナープログラム
【10:00-11:30 】
1.分子シミュレーションとマテリアルズ・インフォマティクスを活用した高信頼材料の高効率設計
(株)日立製作所 研究開発グループ シニア所員 理学博士 岩崎 富生 氏
【習得できる知識】
マテリアルズインフォマティクスと分子シミュレーションを組み合わせることにより、異種材料界面を効率的に高強度化する技術の全体的な流れを習得できます。
【講座の趣旨】
マテリアルズインフォマティクスと分子シミュレーションを組み合わせることにより、異種材料界面を効率的に高強度化する技術を、具体的な事例を紹介しながら解説します。
1.技術潮流
2.マテリアルズ・インフォマティクスの概要
2.1 マテリアルズ・インフォマティクスによる最適設計とは
2.2 最適設計の流れ
2.3 適用事例の概要(1)
2.4 適用事例の概要(2)
3.材料設計効率化の課題とアプローチ
3.1 パラメータサーベイにおける課題
3.2 課題へのアプローチと分子シミュレーション
4.マテリアルズ・インフォマティクスによる複合材料界面の設計事例
4.1 樹脂との密着強度を向上させる金属の設計
4.2 はんだの破断伸びを向上させる添加元素の選定
4.3 環境・生体に適合する材料の界面密着強度を向上させる設計
4.4 金属との界面接着強度が高いバイオマス由来材料の設計
4.5 薄膜配線の信頼性を高める材料設計の事例
5.まとめ
5-1 有効性の確認
5-2 今後の展望
【質疑応答】
【12:10-13:40】
2.MIにおけるデータの記録と蓄積、加工およびその活用
シュレーディンガー(株) ストラテジック・デプロイメント兼ビジネス開発マネージャー 理学(博士) 石崎 貴志 氏
【習得できる知識】
材料研究におけるデータの記録と活用のベストプラクティス
製薬研究におけるインフォマティクスの実例
ソフトウェア・ベンダーとの付き合い方
【講座趣旨】
マテリアルズ・インフォマティクス(MI)では、実験条件や結果などのデータを機械学習でモデル化し、これから作る材料の特性を予測することで、効率的な研究スタイルを誰もが実行できるようにすることが目的になります。 自然言語処理や大規模言語モデル(LLM)により、報告書からデータを吸い出すことが出来るようになりつつありますが、活用できる綺麗なデータを収集するには、定型データとして入力・蓄積し、共通の仕組みで機械学習などに使えることが重要になります。 本講演では、材料研究での一般的な課題を確認し、製薬研究を例に商用パッケージソフトを活用したインフォマティクス基盤構築について説明します。
1.マテリアルズ・インフォマティクスの現在地
1.1 MI向けソフトウェアの歴史
1.2 企業研究における一般的なMIの課題
1.3 データ駆動型研究
2.データの記録
2.1 付番管理
2.2 電子実験ノート/ELN
2.3 アッセイデータ管理システム
3.データの活用
3.1 研究で生じるデータの種類
3.2 Pythonなどによるデータ処理
3.3 データ計算システム
4.データ駆動型研究の実現のために
4.1 商用パッケージソフトか自社開発か
4.2 製薬研究で使うソフト
4.3 ソフトウェアベンダーの事情
【質疑応答】
【13:50-15:20】
3.自然言語処理を含む機械学習の化学・材料分野への適用
信州大学 繊維学部 化学・材料学科 教授 博士(工学) 長田 光正 氏
【習得できる知識】
・自然言語処理を含む機械学習の化学・材料分野への適用
・機械学習による化学に関する物性値推算
・自然言語処理による化学反応経路の予測
【講座趣旨】
自然言語処理を含む機械学習によって,化学・材料分野の研究の進め方に大きな変化が起こっています.従来の技術者・研究者の知識や経験と,機械学習により導き出された結果をどのように融合させるかが問われる段階になっています.
本講座では,自然言語処理を含む機械学習の化学・材料分野への適用と,そこから得られた結果を従来の知識や経験と合わせて人間が解釈できるのか、その現状を説明できればと考えています.
1.自然言語処理を含む機械学習の化学・材料分野への適用
1.1 化学・材料分野での機械学習の利用例
1.2 機械学習を用いた際の課題
2.化学に関する物性推算への適用
2.1 機械学習を用いない従来の方法
2.2 機械学習を用いた方法
3.化学反応経路の予測
3.1 量子化学計算など機械学習を用いない従来の方法
3.2 機械学習(自然言語処理を含まない)を用いた方法
3.3 自然言語処理を用いた方法
4.まとめと今後の展望
【質疑応答】
【15:30-17:00】
4.材料科学分野における言語処理技術の応用展望
(国研)物質・材料研究機構 特別研究員, 名誉研究員 吉武 道子 氏
【習得できる知識】
・自然言語処理技術の種類による活用法の違い
・材料関連分野の文書の種類による言語処理技術活用の違い
・統計処理(深層学習を含む)言語処理の特徴と活用における注意点
・文法をベースにした言語処理の特徴と活用
【講座の趣旨】
以下のような事柄について、概要を理解していただき、自社で展開する際の参考にしていただく。
材料科学分野で自然言語処理技術を利用してどのようなことができるのか、やりたいことを実現するのにどの種類の技術を用いればよいのか、市販ツールがどのような技術を用いているのか、市販ツールを自社カスタマイズする発注の際に言語モデル的に注意すべき点、今後どのようなことができるようになると期待されるか。
1.概観
1.1 マテリアルズインフォマティクス
物性値、分子構造、結晶構造、化学構造式、物性名、数式、自然言語
1.2 対象とする文書の種類と特徴
論文、特許、書籍、安全・規制に関わる法的文書、社内文書
1.3 求められる処理の種類と特徴
文書分類、検索(目的文書の抽出)、情報の抽出(文中の特定情報の抽出)
2.言語処理の種類と活用
2.1 統計処理ベース(深層学習を含む)
・TF-IDE、N-gramなど
・単語ベクトル:Word2Vec、Doc2Vec
・BERT:pre-trainingとfine-tuning
・ChatGPT
2.2 文法ベース
・品詞解析
・構文解析/照応解析
2.3 材料関連分野に特化したモデル
a)様々なモデル
Word2Vec系:Mat2Vec
BERT系:SciBERT、BioBERT、BatteryBERT、MatSciBERT、MatBERT、MaterialBERT
b)モデル利用時の注意点
学習データ、単語辞書、モデル計算(初めからor代入)、学習条件、検証のデータ
3.NIMSでの活用事例
3.1 超電導データベース
3.2 PoLyInfoデータベース
3.3 マテリアルキュレーション支援システム
4.テキストと数値データの関連付け
【質疑応答】
セミナー講師
1. (株)日立製作所 研究開発グループ シニア所員 理学博士 岩崎 富生 氏
2.シュレーディンガー(株) ストラテジック・デプロイメント兼ビジネス開発マネージャー 理学(博士) 石崎 貴志 氏
3. 信州大学 繊維学部 化学・材料学科 教授 博士(工学) 長田 光正 氏
4.(国研)物質・材料研究機構 特別研究員, 名誉研究員 吉武 道子 氏
セミナー受講料
1名につき 66,000円(消費税込、資料付)
〔1社2名以上同時申込の場合のみ1名につき60,500円〕
受講について
■ Live配信セミナーの視聴環境について
- 本講座はZoomを利用したLive配信セミナーです。セミナー会場での受講はできません。
- 下記リンクから視聴環境を確認の上、お申し込みください。
→ https://zoom.us/test - 開催日が近くなりましたら、視聴用のURLとパスワードをメールにてご連絡申し上げます。
- セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
- Zoomクライアントは最新版にアップデートして使用してください。
- Webブラウザから視聴する場合は、Google Chrome、Firefox、Microsoft Edgeをご利用ください。
- パソコンの他にタブレット、スマートフォンでも視聴できます。
- セミナー資料はお申込み時にお知らせいただいた住所へお送りいたします。
お申込みが直前の場合には、開催日までに資料の到着が間に合わないことがあります。ご了承ください。 - 当日は講師への質問をすることができます。可能な範囲で個別質問にも対応いたします。
- 本講座で使用される資料や配信動画は著作物であり、
録音・録画・複写・転載・配布・上映・販売等を禁止いたします。 - 本講座はお申し込みいただいた方のみ受講いただけます。
- 複数端末から同時に視聴することや複数人での視聴は禁止いたします。
- Zoomのグループにパスワードを設定しています。
- 部外者の参加を防ぐため、パスワードを外部に漏洩しないでください。
万が一部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。