テキストマイニング技術のビジネスへの応用とその効果(その1)

更新日

投稿日

 

 テキストマイニングは報告書・議事録・提案書など企業内に散在する日本語情報とネット上のビジネスに有益な情報を自動収集し、日本語解析をかけて整理整頓して、様々な角度から情報を解析・グラフ化するシステムにより業務の品質向上と効率向上がどの程度達成できるかを考察します。今回は企業内およびネット上の大規模データの自動収集および解析システムのビジネスへの応用を解説します。

1、企業内およびネット上の大規模データ

(1) 21世紀の情報利活用

 インターネットが社会基盤になり情報量が急速に増加する情報爆発という現象が起こり、今後それがさらに加速することが予測されます。その大量な情報を利活用できるかどうかが競争力を大きく左右する新しい情報利活用ルールの時代となりました。

 IDC(Internet Data Center)の予測ではインターネットの情報量は2020年に35ゼタバイトに達するようです。[1]これらの大量のデータは、すでにそのままの形で人間が取り扱うことは不可能なレベルであり 何らかの加工をしてこれら大量のデータを利活用できるようにし、それを企業の競争力に結びつけることが企業の戦略に大きく影響します。
 [1]wordpress.digital-universe-iview_5-4-10.pcdofm /2010/05/2010-

情報マネジメント

 http://www.soumu.go.jp/main_content/000124276.pdfより引用。

 もちろん、情報利活用は目的達成の手段であり目的ではありません。情報利活用の前に目的の明確化が大切であるという原則は変わりません。例えば革新的商品創出のための情報利活用と顧客満足度のための情報利活用はやり方が違うわけです。

(2) 企業が利活用する情報

 企業が利活用できる情報のソースは大きく2種類です。一つは社内にあるMicrosoft Office、PDF、テキスト形式などさまざまな形で存在するファイルです。

 これらは、メール・議事録・作業日報・営業報告などの作業情報、製品検証レポートの解析・顧客クレームの分析などの解析情報、顧客データ・販売データなどの各種実データといった、社内で時間をかけて作成されたさまざまな情報です。これらの社内情報はデータソースが確認されている確定情報です。しかしながらせっかく多くのリソースをかけて作成されたこれらの確定情報もあまりにも大量にあり、さまざまなシステムに散らばって存在しているため誰にも気づかれずに眠っていることが多いようです。

 もう一方がインターネット上に数多(あまた)存在するブログや口コミサイト、Q&am...

 

 テキストマイニングは報告書・議事録・提案書など企業内に散在する日本語情報とネット上のビジネスに有益な情報を自動収集し、日本語解析をかけて整理整頓して、様々な角度から情報を解析・グラフ化するシステムにより業務の品質向上と効率向上がどの程度達成できるかを考察します。今回は企業内およびネット上の大規模データの自動収集および解析システムのビジネスへの応用を解説します。

1、企業内およびネット上の大規模データ

(1) 21世紀の情報利活用

 インターネットが社会基盤になり情報量が急速に増加する情報爆発という現象が起こり、今後それがさらに加速することが予測されます。その大量な情報を利活用できるかどうかが競争力を大きく左右する新しい情報利活用ルールの時代となりました。

 IDC(Internet Data Center)の予測ではインターネットの情報量は2020年に35ゼタバイトに達するようです。[1]これらの大量のデータは、すでにそのままの形で人間が取り扱うことは不可能なレベルであり 何らかの加工をしてこれら大量のデータを利活用できるようにし、それを企業の競争力に結びつけることが企業の戦略に大きく影響します。
 [1]wordpress.digital-universe-iview_5-4-10.pcdofm /2010/05/2010-

情報マネジメント

 http://www.soumu.go.jp/main_content/000124276.pdfより引用。

 もちろん、情報利活用は目的達成の手段であり目的ではありません。情報利活用の前に目的の明確化が大切であるという原則は変わりません。例えば革新的商品創出のための情報利活用と顧客満足度のための情報利活用はやり方が違うわけです。

(2) 企業が利活用する情報

 企業が利活用できる情報のソースは大きく2種類です。一つは社内にあるMicrosoft Office、PDF、テキスト形式などさまざまな形で存在するファイルです。

 これらは、メール・議事録・作業日報・営業報告などの作業情報、製品検証レポートの解析・顧客クレームの分析などの解析情報、顧客データ・販売データなどの各種実データといった、社内で時間をかけて作成されたさまざまな情報です。これらの社内情報はデータソースが確認されている確定情報です。しかしながらせっかく多くのリソースをかけて作成されたこれらの確定情報もあまりにも大量にあり、さまざまなシステムに散らばって存在しているため誰にも気づかれずに眠っていることが多いようです。

 もう一方がインターネット上に数多(あまた)存在するブログや口コミサイト、Q&A コミュニティ、SNS(ソーシャルネットワーキングサービス)、COI(CommunityOf Interest)サイトなどです。これらはCGM(Consumer Generated Media)と呼ばれインターネットなどを活用して消費者が内容を生成していくメディアです。個人の情報発信をデータベース化、メディア化したWebサイトのことで商品・サービスに関する情報を交換するものから、単に日常の出来事をつづったものまでさまざまなものがあります。CGM コンテンツはUGC(User Generated Contents)です。

 次回に続きます。

   続きを読むには・・・


この記事の著者

木村 礼壮

企業戦略・方針にあった製品企画をしたい、 顧客要求に応える製品を明確にしたい方々にピッタリの解決法をご提供します。特に仕様変更に悩むIT企業には必須のスキルです。

企業戦略・方針にあった製品企画をしたい、 顧客要求に応える製品を明確にしたい方々にピッタリの解決法をご提供します。特に仕様変更に悩むIT企業には必須のスキ...


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
成果を出したいなら、汚いデータから データ分析講座(その3)

   「社内にデータが溜まっているんだけど、何かに使えないかな」よくこのような相談を受けます。できれば、収益拡大につながる儲かるデータ分析...

   「社内にデータが溜まっているんだけど、何かに使えないかな」よくこのような相談を受けます。できれば、収益拡大につながる儲かるデータ分析...


標準化か正規化か?機械学習データ処理の選択肢:データ分析講座(その348)

【目次】  ▼さらに深く学ぶなら!「データ分析」に関するセミナーはこちら! 機械学習におけるデータの前処理は、モデルの性能に大き...

【目次】  ▼さらに深く学ぶなら!「データ分析」に関するセミナーはこちら! 機械学習におけるデータの前処理は、モデルの性能に大き...


5つのデータ分析 データ分析講座(その224)

  【この連載の前回:データ分析講座(その223)数値予測は9つのシナリオで実施するへのリンク】 ◆関連解説『情報マネジメントとは』 ...

  【この連載の前回:データ分析講座(その223)数値予測は9つのシナリオで実施するへのリンク】 ◆関連解説『情報マネジメントとは』 ...


「情報マネジメント一般」の活用事例

もっと見る
‐社内の問題克服による開発活動‐  製品・技術開発力強化策の事例(その14)

 前回の事例その13に続いて解説します。社内における様々な問題を高いレベルで深く追及して解決することが、競争力のある技術を育成し、売れる製品を生み出す事に...

 前回の事例その13に続いて解説します。社内における様々な問題を高いレベルで深く追及して解決することが、競争力のある技術を育成し、売れる製品を生み出す事に...


‐販路開拓に関する問題 第1回‐  製品・技術開発力強化策の事例(その17)

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...


人的資源マネジメント:製品開発の滞留を引き起こすファイルとは(その2)

 今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。    前回まで続けていたテ...

 今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。    前回まで続けていたテ...