個票データの共用化でコストダウン

投稿日

 inf342データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の前にデータを項目別に並べ替える等の整理作業が必要です。
 
 この整理作業の結果として得られた資料を「個票データ」と言います。 個票データが上手く纏められていれば解析もスピーディです。逆に、綺麗な個票データを作るにはデータ収集方法がより重要であり、採集フォーマット、対象、日時など、収集プランを熟慮し作成する事が求められます。個票データは解析のベースとなるデータなので、整理の段階で過度にバイアスが掛からないように注意が必要です。バイアスとは一部情報の強調、統合、排除です。
 
 例えば喫煙者意識の調査で、喫煙容認派と嫌煙派を20代男女だけのデータで代表したり、データ収集手段や、時期、地域等、結果に関係する情報を外したり、また一部の情報を統合して(30代と40代の結果を足してしまうなど)整理したりする事で、解析により推測される結果にも影響が生じてしまいます。
 
 個別データ作成の段階で、この様な解析誤差が発生する事は好ましくありません。偏りが無い解析を行うためには、過度な整理を伴わないデータが必要です。一方で我々が普段目にする統計情報は、個票データでは無く集計データです。
 
 例えば喫煙容認派:嫌煙派=30%:70%などの様に既に個票データが整理・集約された情報なったしまっているデータです。普段メディアや各種機関から提供されるデータは集計データであり、個別データが公表されているケースはほとんどの場合ありません。それは標本データの収集に時間とコストがかかっており、貴重だからです。
 
 一方で行政機関を中心に個票データを公表し、活用してもらおうと言う考えも広まっています。収集したデータは採取方法やエリア、期間などのバックデータがわかっていれば別の目的での解析にも利用が可能です(二次利用)。
 
 喫煙意識のデータは喫煙・禁煙グッズ関係者、医療関係者、保険関係者等で用途がありますし、金融財産や貯蓄情報などはさらに多くの業界で活用されるでしょう。既に加工された二次情報は、冒頭で述べたようにバイアスが掛けられている場合もありますので、個票データの入手が可能であれば、それを用いて検証する事を推奨します。
 
 また現時的には、個別データの共有は同一企業内でも実施されていると言えません。理由としては、データシェアの方法やルール、形態を決められていないからです。ルールを決めて共用サーバーに保存すれば各部署で採ったデータを繰り返し活用できるし、重複採取によるムダも減らせると思うのですが、シェア意識の欠如やセクショナリズムにより実行されません。
 
 経営者が必要性を実感す...
 inf342データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の前にデータを項目別に並べ替える等の整理作業が必要です。
 
 この整理作業の結果として得られた資料を「個票データ」と言います。 個票データが上手く纏められていれば解析もスピーディです。逆に、綺麗な個票データを作るにはデータ収集方法がより重要であり、採集フォーマット、対象、日時など、収集プランを熟慮し作成する事が求められます。個票データは解析のベースとなるデータなので、整理の段階で過度にバイアスが掛からないように注意が必要です。バイアスとは一部情報の強調、統合、排除です。
 
 例えば喫煙者意識の調査で、喫煙容認派と嫌煙派を20代男女だけのデータで代表したり、データ収集手段や、時期、地域等、結果に関係する情報を外したり、また一部の情報を統合して(30代と40代の結果を足してしまうなど)整理したりする事で、解析により推測される結果にも影響が生じてしまいます。
 
 個別データ作成の段階で、この様な解析誤差が発生する事は好ましくありません。偏りが無い解析を行うためには、過度な整理を伴わないデータが必要です。一方で我々が普段目にする統計情報は、個票データでは無く集計データです。
 
 例えば喫煙容認派:嫌煙派=30%:70%などの様に既に個票データが整理・集約された情報なったしまっているデータです。普段メディアや各種機関から提供されるデータは集計データであり、個別データが公表されているケースはほとんどの場合ありません。それは標本データの収集に時間とコストがかかっており、貴重だからです。
 
 一方で行政機関を中心に個票データを公表し、活用してもらおうと言う考えも広まっています。収集したデータは採取方法やエリア、期間などのバックデータがわかっていれば別の目的での解析にも利用が可能です(二次利用)。
 
 喫煙意識のデータは喫煙・禁煙グッズ関係者、医療関係者、保険関係者等で用途がありますし、金融財産や貯蓄情報などはさらに多くの業界で活用されるでしょう。既に加工された二次情報は、冒頭で述べたようにバイアスが掛けられている場合もありますので、個票データの入手が可能であれば、それを用いて検証する事を推奨します。
 
 また現時的には、個別データの共有は同一企業内でも実施されていると言えません。理由としては、データシェアの方法やルール、形態を決められていないからです。ルールを決めて共用サーバーに保存すれば各部署で採ったデータを繰り返し活用できるし、重複採取によるムダも減らせると思うのですが、シェア意識の欠如やセクショナリズムにより実行されません。
 
 経営者が必要性を実感すれば、実施に際しては社内ネットワークを担当する部門に命じて構築と管理をやってもらえば良いと思います。逆にボトムアップで経営者に有用性を訴え、社内整備を働きかける事でも実現可能な事だと思います。個票データのシェアと集計データのシェアでは二次利用に大きな差が生まれます。業務効率化の考えているなら、情報のシェアは優先度を高くして行ってよいアクションアイテムになると思います。
 
 特に普段受託業務が多いIT部門が率先して行うと良いと思います。データベースから簡単に情報を引っ張れる方がユーザーフレンドリーですし、ITに詳しい部門が率先して行うほうが時間もコストも少なくして構築出来るはずです。
 

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「ゼネラルマネジメント」の他のキーワード解説記事

もっと見る
:5Sでシンプルな仕事の流れに改善  事務の生産性向上とは(その3)

【目次】 1. 事務改善のすすめ方 2. 見える化で改善対象を明確に 3. 5Sでシンプルな仕事の流れに改善 1. 5Sとは  ...

【目次】 1. 事務改善のすすめ方 2. 見える化で改善対象を明確に 3. 5Sでシンプルな仕事の流れに改善 1. 5Sとは  ...


中小製造業のための採用戦略、企業の競争力強化

       【目次】 1. 企業の競争力強化 1.1 中小製造業の採用の重要性の説明 ...

       【目次】 1. 企業の競争力強化 1.1 中小製造業の採用の重要性の説明 ...


「会議」の再認識とは、なぜ、会議の効率を問題にするのか

  世の中にはダメ会議があふれています。ちなみに、私は、IBMでの35年間、SE、プロジェクトマネージャー、コンサルタントとして、常に最前...

  世の中にはダメ会議があふれています。ちなみに、私は、IBMでの35年間、SE、プロジェクトマネージャー、コンサルタントとして、常に最前...


「ゼネラルマネジメント」の活用事例

もっと見る
業務は時間型から価値型へ

1、業務に対する考え方が変わる  IT企業などでは15年以上前から一般社員の間でもテレワークシステムを使い、顧客との連絡、設計業務などで幅広く活用さ...

1、業務に対する考え方が変わる  IT企業などでは15年以上前から一般社員の間でもテレワークシステムを使い、顧客との連絡、設計業務などで幅広く活用さ...


‐開発品の効果的な生産の仕組み創り‐ 製品・技術開発力強化策の事例(その24)

 前回の事例その23に続いて解説します。多品種少量生産で利益が出る経営形態を実現するに際して、最も効果が上がるのは設計時点の取り組み方です。設計段階の思想...

 前回の事例その23に続いて解説します。多品種少量生産で利益が出る経営形態を実現するに際して、最も効果が上がるのは設計時点の取り組み方です。設計段階の思想...


‐販路開拓に関する問題 第1回‐  製品・技術開発力強化策の事例(その17)

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...