統計的区間推定は%などの比率データにも適用できます。比率データとして代表的なものに視聴率データがあります。予備知識としてビデオリサーチ社のウェブサイト情報を元に記載します。視聴データは調査対象となる家庭に設置した機器から自動的に視聴結果を吸い上げる方法と記録用紙への記入方法の2種類があるようです。現在は機器を設置し自動で吸い上げる方法が主流の様です。瞬間視聴率は機器を用いた連続測定ならではの情報と言えるでしょう。放送エリアは全国で32に分かれており、27エリアが調査対象となっています。 27エリアは都市規模に応じて3つに分類されており調査方法が微妙に異なります。関東、関西、名古屋の3地区は600世帯と最大サンプル数、且つデータが最も詳細に取るシステムを設置するエリアの様です。残りは24エリアは世帯数は200と共通で収集方法も共通ですが、速報発信の頻度が異なるようです。このように全国平均としての視聴率は集計されずエリア集計の様です。
さて本題に入りましょう。 関東エリアで視聴率10%のドラマについて考えてみます。 一話目が10%で二話目が9%だったら視聴率が落ちたと断言して良いでしょうか、ここで母比率の区間推定を行ってみます。大都市圏600世帯の調査で視聴率10%の場合の推定区間を算出します。信頼度は95%とすると、計算式と式中の各記号は、次のようになります。
r=0.1 n=600を代入して計算すると、推定区間は10%±2.4%となります。視聴率が10%の時、2.4%は標本誤差になるので二話目が9%になっても一話目より視聴率が下がったとは断言出来ない事になります。言い換えれば標本の採り方でこの区間で視聴率が変動し9%も誤差範囲と言うわけです。計算式からわかりますがこの誤差を半分にするにはn数が4倍必要で、2400世帯に機器を設置する必要があります。それでも誤差は1.2%なので2話めの視聴率が下がったと統計的には言い切れません。
4倍にしても1%以下になりませんからサンプリングコストと得られる誤差精度が見合うかと言われると確かに疑問ですね。機器設置コスト考えると仕方ないかもしれません。都市圏以外のエリアはサンプル数が200なので誤差は±4.2%に増大します。標本誤差については調査会社のサイトにも記載があります。
95%の信頼区間について補足すると、異なる600世帯100グループの調査を行った場合、95グループは上記の10%±2.4%の範囲に収まる確率という事になります。 600世帯のサンプルをどれだけ採取しても常に視聴率がこの範囲に収まって変動するというわけではないのでご注意下さい。
インターネットのニュースで1%未満の視聴率変動について主観的に分析した記事が良く掲載されていますが、非常に非論理的だと思ってみています。恐らく今は視聴したか、してないというオンオフ視聴率よりももっと時間を細かく見た瞬間視聴率が重要な情報...