テキストマイニング技術のビジネスへの応用とその効果(その1)

更新日

投稿日

 

 テキストマイニングは報告書・議事録・提案書など企業内に散在する日本語情報とネット上のビジネスに有益な情報を自動収集し、日本語解析をかけて整理整頓して、様々な角度から情報を解析・グラフ化するシステムにより業務の品質向上と効率向上がどの程度達成できるかを考察します。今回は企業内およびネット上の大規模データの自動収集および解析システムのビジネスへの応用を解説します。

1、企業内およびネット上の大規模データ

(1) 21世紀の情報利活用

 インターネットが社会基盤になり情報量が急速に増加する情報爆発という現象が起こり、今後それがさらに加速することが予測されます。その大量な情報を利活用できるかどうかが競争力を大きく左右する新しい情報利活用ルールの時代となりました。

 IDC(Internet Data Center)の予測ではインターネットの情報量は2020年に35ゼタバイトに達するようです。[1]これらの大量のデータは、すでにそのままの形で人間が取り扱うことは不可能なレベルであり 何らかの加工をしてこれら大量のデータを利活用できるようにし、それを企業の競争力に結びつけることが企業の戦略に大きく影響します。
 [1]wordpress.digital-universe-iview_5-4-10.pcdofm /2010/05/2010-

情報マネジメント

 http://www.soumu.go.jp/main_content/000124276.pdfより引用。

 もちろん、情報利活用は目的達成の手段であり目的ではありません。情報利活用の前に目的の明確化が大切であるという原則は変わりません。例えば革新的商品創出のための情報利活用と顧客満足度のための情報利活用はやり方が違うわけです。

(2) 企業が利活用する情報

 企業が利活用できる情報のソースは大きく2種類です。一つは社内にあるMicrosoft Office、PDF、テキスト形式などさまざまな形で存在するファイルです。

 これらは、メール・議事録・作業日報・営業報告などの作業情報、製品検証レポートの解析・顧客クレームの分析などの解析情報、顧客データ・販売データなどの各種実データといった、社内で時間をかけて作成されたさまざまな情報です。これらの社内情報はデータソースが確認されている確定情報です。しかしながらせっかく多くのリソースをかけて作成されたこれらの確定情報もあまりにも大量にあり、さまざまなシステムに散らばって存在しているため誰にも気づかれずに眠っていることが多いようです。

 もう一方がインターネット上に数多(あまた)存在するブログや口コミサイト、Q&am...

 

 テキストマイニングは報告書・議事録・提案書など企業内に散在する日本語情報とネット上のビジネスに有益な情報を自動収集し、日本語解析をかけて整理整頓して、様々な角度から情報を解析・グラフ化するシステムにより業務の品質向上と効率向上がどの程度達成できるかを考察します。今回は企業内およびネット上の大規模データの自動収集および解析システムのビジネスへの応用を解説します。

1、企業内およびネット上の大規模データ

(1) 21世紀の情報利活用

 インターネットが社会基盤になり情報量が急速に増加する情報爆発という現象が起こり、今後それがさらに加速することが予測されます。その大量な情報を利活用できるかどうかが競争力を大きく左右する新しい情報利活用ルールの時代となりました。

 IDC(Internet Data Center)の予測ではインターネットの情報量は2020年に35ゼタバイトに達するようです。[1]これらの大量のデータは、すでにそのままの形で人間が取り扱うことは不可能なレベルであり 何らかの加工をしてこれら大量のデータを利活用できるようにし、それを企業の競争力に結びつけることが企業の戦略に大きく影響します。
 [1]wordpress.digital-universe-iview_5-4-10.pcdofm /2010/05/2010-

情報マネジメント

 http://www.soumu.go.jp/main_content/000124276.pdfより引用。

 もちろん、情報利活用は目的達成の手段であり目的ではありません。情報利活用の前に目的の明確化が大切であるという原則は変わりません。例えば革新的商品創出のための情報利活用と顧客満足度のための情報利活用はやり方が違うわけです。

(2) 企業が利活用する情報

 企業が利活用できる情報のソースは大きく2種類です。一つは社内にあるMicrosoft Office、PDF、テキスト形式などさまざまな形で存在するファイルです。

 これらは、メール・議事録・作業日報・営業報告などの作業情報、製品検証レポートの解析・顧客クレームの分析などの解析情報、顧客データ・販売データなどの各種実データといった、社内で時間をかけて作成されたさまざまな情報です。これらの社内情報はデータソースが確認されている確定情報です。しかしながらせっかく多くのリソースをかけて作成されたこれらの確定情報もあまりにも大量にあり、さまざまなシステムに散らばって存在しているため誰にも気づかれずに眠っていることが多いようです。

 もう一方がインターネット上に数多(あまた)存在するブログや口コミサイト、Q&A コミュニティ、SNS(ソーシャルネットワーキングサービス)、COI(CommunityOf Interest)サイトなどです。これらはCGM(Consumer Generated Media)と呼ばれインターネットなどを活用して消費者が内容を生成していくメディアです。個人の情報発信をデータベース化、メディア化したWebサイトのことで商品・サービスに関する情報を交換するものから、単に日常の出来事をつづったものまでさまざまなものがあります。CGM コンテンツはUGC(User Generated Contents)です。

 次回に続きます。

   続きを読むには・・・


この記事の著者

木村 礼壮

企業戦略・方針にあった製品企画をしたい、 顧客要求に応える製品を明確にしたい方々にピッタリの解決法をご提供します。特に仕様変更に悩むIT企業には必須のスキルです。

企業戦略・方針にあった製品企画をしたい、 顧客要求に応える製品を明確にしたい方々にピッタリの解決法をご提供します。特に仕様変更に悩むIT企業には必須のスキ...


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
IoT「モノのインターネット化」とは(その3)

 前回のその2に続いて解説します。   3.HMD:ヘッドマウントディスプレイの応用例  HMD(ヘッドマウントディスプレイ)は製造ラインの業務...

 前回のその2に続いて解説します。   3.HMD:ヘッドマウントディスプレイの応用例  HMD(ヘッドマウントディスプレイ)は製造ラインの業務...


ダッシュボードとレポートの重要な相違点とは:データ分析講座(その312)

     BIツールの普及とともに、パワーポイントやワードなどのレポートの代替として利用する企業や組織などが増えてきまし...

     BIツールの普及とともに、パワーポイントやワードなどのレポートの代替として利用する企業や組織などが増えてきまし...


データサイエンティストを支える人財とは データ分析講座(その118)

◆ データサイエンティストの最高の相棒はデータエンジニア  ビジネスの世界に生きるデータサイエンティストの仕事とは、データとその活用領域であるドメイ...

◆ データサイエンティストの最高の相棒はデータエンジニア  ビジネスの世界に生きるデータサイエンティストの仕事とは、データとその活用領域であるドメイ...


「情報マネジメント一般」の活用事例

もっと見る
電子メール、簡潔過ぎると逆効果

◆電子メール:多忙な人に確実な返信をもらうテクニック  皆様は仕事で電子メールを一日に何通受信しますか、企業の従業員数、所属部署、職務、職位などでも...

◆電子メール:多忙な人に確実な返信をもらうテクニック  皆様は仕事で電子メールを一日に何通受信しますか、企業の従業員数、所属部署、職務、職位などでも...


‐情報収集で配慮すべき事項(第1回)‐  製品・技術開発力強化策の事例(その9)

 前回の事例その8に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...

 前回の事例その8に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...


人的資源マネジメント:製品開発の滞留を引き起こすファイルとは(その2)

 今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。    前回まで続けていたテ...

 今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。    前回まで続けていたテ...