スモールデータとビッグデータの違いとは

更新日 2022-07-01

投稿日 2019-08-28

　ビッグデータの活用と声高に叫ばれています。無論、自動的にビッグデータが取れれば多いに越したことはありませんが、スモールデータでも十分に検証できます。

　私は顧客アンケート調査の設計から実査、分析までを頻繁に行っていますが、今回は最適な回収データ数について解説します。

　よく、データを何人取ったら有効でしょうか？と質問を受けます。データはたくさん取った方がいいなど、いろいろな意見が飛び交いますが。データ数50人よりデータ数100人。三桁のデータを扱うことを目標にしましょう。特に根拠はありませんが、調査データが 50人よりは 100人の方がよさそうです。

　100人と200人となると、多い方がいいですが、人数が多くなるとそのための工数や費用が掛かります。そこで、統計解析には誤差を推定することが可能です。この考え方から必要なデータ数を考えて見ましょう。

　統計学の中に少ないデータで全体を推定することができます。その時の前提としては

データが少ないと全体の誤差が大きい。
データが多いと全体の誤差は少ない。

　ではどの程度でしょうか。比率の誤差は簡便法で 1/ √ｎで推定できるのです。

　100人の比率の誤差は最大 10％、400人の比率の誤差は最大 5％、1万人の比率の誤差は最大 1％になります。

　例としてアンケート調査等で回答の比率の結果：男性 50％と結果が出ました。

　その時、100人の場合は ± 10％、400人の場合は ± 5％、1万人の場合は ± 1％。

　100人ですと、± 10％も誤差があるので、問題が出てきます。400人ですと、± 5％の誤差なので、統計でよく使う95％の許容範囲に入ってきます。

　また、アンケート調査の段階評価や得点評価において平均値を使うことも多いでしょう。

　平均値の誤差は、簡便法で 2/ √ｎで推定できます。

　100人の場合、誤差は ± 0.2点、400人の場合、誤差は ± 0.1点、1万人の場合、誤差は ± 0.02点になります。

　400人ですと、平均値 3.5点の結果は全体では 3.4点～ 3.6点にあることが推...

　ビッグデータの活用と声高に叫ばれています。無論、自動的にビッグデータが取れれば多いに越したことはありませんが、スモールデータでも十分に検証できます。

　私は顧客アンケート調査の設計から実査、分析までを頻繁に行っていますが、今回は最適な回収データ数について解説します。

　よく、データを何人取ったら有効でしょうか？と質問を受けます。データはたくさん取った方がいいなど、いろいろな意見が飛び交いますが。データ数50人よりデータ数100人。三桁のデータを扱うことを目標にしましょう。特に根拠はありませんが、調査データが 50人よりは 100人の方がよさそうです。

　100人と200人となると、多い方がいいですが、人数が多くなるとそのための工数や費用が掛かります。そこで、統計解析には誤差を推定することが可能です。この考え方から必要なデータ数を考えて見ましょう。

　統計学の中に少ないデータで全体を推定することができます。その時の前提としては

データが少ないと全体の誤差が大きい。
データが多いと全体の誤差は少ない。

　ではどの程度でしょうか。比率の誤差は簡便法で 1/ √ｎで推定できるのです。

　100人の比率の誤差は最大 10％、400人の比率の誤差は最大 5％、1万人の比率の誤差は最大 1％になります。

　例としてアンケート調査等で回答の比率の結果：男性 50％と結果が出ました。

　その時、100人の場合は ± 10％、400人の場合は ± 5％、1万人の場合は ± 1％。

　100人ですと、± 10％も誤差があるので、問題が出てきます。400人ですと、± 5％の誤差なので、統計でよく使う95％の許容範囲に入ってきます。

　また、アンケート調査の段階評価や得点評価において平均値を使うことも多いでしょう。

　平均値の誤差は、簡便法で 2/ √ｎで推定できます。

　100人の場合、誤差は ± 0.2点、400人の場合、誤差は ± 0.1点、1万人の場合、誤差は ± 0.02点になります。

　400人ですと、平均値 3.5点の結果は全体では 3.4点～ 3.6点にあることが推定できます。

　一方費用の観点で見ると、400人と1万人で人数は 25倍にも関わらず。精度は 5倍しか上がりません。となると、闇雲にデータをたくさん取ると、費用対精度で大きく差が開いてきます。これらの観点で、私はアンケート調査で最適回収データ数は 500人と伝えます。

◆関連解説『情報マネジメントとは』

　続きを読むには・・・

新規会員登録

この記事の著者

石川朋雄

石川朋雄

有限会社企画システムコンサルティング

日本のものづくりは品質向上に切磋琢磨し，高品質な商品を開発しました。高品質商品と顧客価値創造を融合する商品企画のシステム化を提案します。

この記事の著者

石川朋雄

日本のものづくりは品質向上に切磋琢磨し，高品質な商品を開発しました。高品質商品と顧客価値創造を融合する商品企画のシステム化を提案します。

日本のものづくりは品質向上に切磋琢磨し，高品質な商品を開発しました。高品質商品と顧客価値創造を融合する商品企画のシステム化を提案します。

「情報マネジメント一般」の他のキーワード解説記事

もっと見る

サイバーフィジカルシステム（CPS）とは？デジタルデータで分析するリスク管理の最前線

サイバーフィジカルシステム（CPS）とは？デジタルデータで分析するリスク管理の最前線

【目次】ものづくり企業ではデータ分析の重要度が従来以上に増してきています。IoT（Internet of Things）によって製...

【目次】ものづくり企業ではデータ分析の重要度が従来以上に増してきています。IoT（Internet of Things）によって製...

メタ知識とデータカタログデータ分析講座（その69）

メタ知識とデータカタログデータ分析講座（その69）

◆ データ分析の属人化を避けるためのメタ知識とデータカタログ　データ分析の特徴として、「属人化しやすい」という特徴があります。　なぜか属人化し...

◆ データ分析の属人化を避けるためのメタ知識とデータカタログ　データ分析の特徴として、「属人化しやすい」という特徴があります。　なぜか属人化し...

非構造化データにまで拡大！ビッグデータの活用で変わるものづくり

非構造化データにまで拡大！ビッグデータの活用で変わるものづくり

　近年、大量データを分析して、顧客や市場、あるいは自社の現状を定量的に把握し、そこから人間の勘だけでは分からない新たな知見を見出し、それをマーケティングや...

　近年、大量データを分析して、顧客や市場、あるいは自社の現状を定量的に把握し、そこから人間の勘だけでは分からない新たな知見を見出し、それをマーケティングや...

「情報マネジメント一般」の活用事例

もっと見る

人的資源マネジメント:製品開発の滞留を引き起こすファイルとは（その2）

人的資源マネジメント:製品開発の滞留を引き起こすファイルとは（その2）

　今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。　前回まで続けていたテ...

　今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。　前回まで続けていたテ...

‐技術開発の目標について第1回‐ 製品・技術開発力強化策の事例（その15）

‐技術開発の目標について第1回‐ 製品・技術開発力強化策の事例（その15）

　前回の事例その14に続いて解説します。製品開発を目指している企業の中には、テ－マが見つかったら、または、アイデアが閃いたら開発に取り組む。そのような淡い...

　前回の事例その14に続いて解説します。製品開発を目指している企業の中には、テ－マが見つかったら、または、アイデアが閃いたら開発に取り組む。そのような淡い...

たかがWord、されどWord

たかがWord、されどWord

　マイクロソフトOfficeはどこでも使われているので、ITリテラシーとしてWordを使えることが求められます。『 Wordが使える』と言っても、そのレ...

　マイクロソフトOfficeはどこでも使われているので、ITリテラシーとしてWordを使えることが求められます。『 Wordが使える』と言っても、そのレ...

この記事の著者

石川朋雄

石川朋雄

有限会社企画システムコンサルティング

日本のものづくりは品質向上に切磋琢磨し，高品質な商品を開発しました。高品質商品と顧客価値創造を融合する商品企画のシステム化を提案します。

エバンジェリスト大岡が解説！

ものづくりドットコムご利用ガイド

オンデマンドセミナー一覧

ranking_on-demand

専門家（エキスパート）登録をお考えの方へ

ものづくりドットコム Facebook

よくある質問はこちら

専門家コーディネートサービス

関連セミナー

経営における「個人データ」の利活用の実務

経営における「個人データ」の利活用の実務

3ステップで成功させるデータビジネス「データで稼げる」新規事業をつくる

3ステップで成功させるデータビジネス「データで稼げる」新規事業をつくる

NTTが目指すデータ流通プラットフォーム

NTTが目指すデータ流通プラットフォーム

関連教材

５Ｇ、ローカル５Ｇで変わる競争環境と事業展望

５Ｇ、ローカル５Ｇで変わる競争環境と事業展望

在庫あり

勃興するデータビジネスの未来

在庫あり

「Ｇｏｏｇｌｅ　ＡＩ」の全貌　〜ＡＩで世界を制覇

「Ｇｏｏｇｌｅ　ＡＩ」の全貌　〜ＡＩで世界を制覇

在庫あり

関連Q&A

ANSYS MAPDL と Workbench の違い

IT導入補助金

システム化による業務効率化

専門家登録をご希望の方へ

中部最大級！製造業の展示会　ものづくりワールド名古屋　2025.4.9-11

カリキュラム_半導体

カリキュラム_品質管理

広告掲載をご希望の方