テキストマイニングを利用した特許情報解析手法と実践にむけた演習 ~デモ・付録付~
開催日 |
10:30 ~ 16:00 締めきりました |
---|---|
主催者 | 株式会社 技術情報協会 |
キーワード | 知的財産マネジメント 機械学習・ディープラーニング データマイニング/ビッグデータ |
開催エリア | 全国 |
開催場所 | Zoomを利用したLive配信※会場での講義は行いません |
実際に手を動かしてテキストマイニングを学べる!!
自分でできる特許情報解析ツール紹介!!
セミナー講師
安藤 俊幸 先生 アジア特許情報研究会/花王(株)
セミナー受講料
1名につき 55,000円(消費税込、資料付)
〔1社2名以上同時申込の場合のみ1名につき49,500円〕
受講について
- 本講座はZoomを利用したLive配信セミナーです。セミナー会場での受講はできません。
- 下記リンクから視聴環境を確認の上、お申し込みください。
→ https://zoom.us/test - 開催日が近くなりましたら、視聴用のURLとパスワードをメールにてご連絡申し上げます。
セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。 - Zoomクライアントは最新版にアップデートして使用してください。
Webブラウザから視聴する場合は、Google Chrome、Firefox、Microsoft Edgeをご利用ください。 - パソコンの他にタブレット、スマートフォンでも視聴できます。
- セミナー資料はお申込み時にお知らせいただいた住所へお送りいたします。
お申込みが直前の場合には、開催日までに資料の到着が間に合わないことがあります。ご了承ください。 - 当日は講師への質問をすることができます。可能な範囲で個別質問にも対応いたします。
- 本講座で使用される資料や配信動画は著作物であり、
録音・録画・複写・転載・配布・上映・販売等を禁止いたします。 - 本講座はお申し込みいただいた方のみ受講いただけます。
複数端末から同時に視聴することや複数人での視聴は禁止いたします。 - Zoomのグループにパスワードを設定しています。
部外者の参加を防ぐため、パスワードを外部に漏洩しないでください。
万が一部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。
セミナー趣旨
テキストマイニングと商用ツール、オープンソースを用いた機械学習の特許情報解析への応用を、事例、演習、デモを交え解説します。さらに、自分でできる特許情報解析ツールも紹介しますので、プログラムやサンプルデータを実際にお試しいただくことができます。特許情報解析を自分で行いたい方にお勧めです。
セミナープログラム
1.はじめに
・講師自己紹介
・アジア特許情報研究会紹介
2.特許調査とテキストマイニングの基礎
・調査対象と調査範囲の特定・明確化
・マッチングと適合
・特許調査における再現率(網羅性)と適合率(効率)
・先行技術調査と侵害防止調査の検索モデルの違い
・「完全一致」⇔「最良一致」検索モデルの比較
・検索・分類とテキストマイニングの違い
・テキストマイニングの基本的な仕組み
3.テキストマイニングの概要と特許情報解析への応用
・テキストマイニングとは
・形態素解析と分かち書き (演習付き)
・注目ワードのハイライト表示と抽出 (演習付き)
・特徴抽出(BoW,TF-IDF,BM25,単語N-gram)
・抽出語の頻度分析 (演習付き)
・共起語のネットワーク分析 (演習付き)
・ネットワーク分析の応用(発明者、引用-被引用)
・「文書×抽出語」行列作成と解析・可視化
・文書の類似度行列作成と解析/可視化
4.各種ツールのテキストマイニング関連機能活用事例
・KH Coder(フリー版)の活用事例
・Text Mining Studio(商用)の活用事例
・パテントマップEXZのキーワード抽出、類似特許抽出
・Patentfieldの類似語、AIセマンティック検索、AI分類予測
・THE調査力AI(Deskbee5)の専門用語抽出、サーチ/ノイズ確率
・RとPythonによるテキストマイニング
5.オープンソースを用いた機械学習の特許情報解析への応用
・機械学習の概要と特許調査への応用
・機械学習概要(分類、回帰、クラスタリング、次元圧縮)
・先行技術調査の流れ(進め方)
・分散表現(単語埋め込み)とは
・分布仮説に基づいた文脈中の単語の重み学習(word2vec)
・word2vecによる類似語の抽出 (演習付き)
・doc2vecによる公報(文書)単位の類似度計算 (演習付き)
・doc2vecによる発明の要素(文)単位の類似度計算
6.機械学習のクラス分類の応用事例
・機械学習による文書分類
・SDI調査、動向調査への応用
7.教師無し機械学習(クラスタリング、次元圧縮)の応用
・単語/文書のクラスタリングによる動向調査への応用
・文書ベクトルの次元圧縮による特許公報の俯瞰可視化 (デモ付き)
・文書分類との組み合わせによるパテントマップの自動作成
【演習・デモ・付録】 自分でできる特許情報解析ツール紹介
1.キーワード抽出関係
・word2vec,doc2vecによる単語・文書の類似度計算と類似単語・文書抽出 (演習付き)
・termextractによる専門用語(キーワード)自動抽出 (演習付き)
・Cytoscapeによる文脈語のネットワーク分析 (演習付き)
・Cytoscapeによるネットワーク分析の応用(発明者、引用-被引用) (演習付き)
2.Pythonで始める機械学習(デモ付解説)
・Python環境構築の概要
・doc2vecによる文書・単語の類似度計算と類似文書・単語抽出の解説
【質疑応答】