【統計学入門】割付、ウェイトバックとは?|データ活用戦略講座④

アンケート調査を行う際、調査対象者のデータが母集団(全体)の特性を正確に反映することが重要です。そのために用いられるのが割付とウェイトバックという手法です。これらを正しく活用することで、データの信頼性が向上し、調査結果に基づいた的確な意思決定が可能になります。本記事では、それぞれの手法の定義や具体例を交えて解説します。

割付とは、調査・リサーチをする際、回収する回答数をセグメントごとに事前に決めておくことです。調査結果が偏らないよう、あらかじめ設定された条件に従ってデータを収集します。

例えば、下記のような調査を見てみましょう。

この結果を目的に沿って考察しようとすると、下記のような問題が生じます。
・標本サイズの小さいセルがある
母集団との誤差が大きく、推定が出来ない
・セル毎の標本サイズが違いすぎる
セル同士(属性間)比較に誤差が出る

こうした問題を解決するために、以下のように割付をおこないます。
割付をすることにより、属性毎に分析が出来るだけのサンプルサイズを確保し、サンプルサイズ差による誤差を考慮せず属性間比較を行うことができます。

割付のセグメント例

上記のような性別×年代に限らず、調査の目的に合ったセグメントを使って割付をおこないます。例えば、下記のようなセグメントを利用します。

  • 居住エリア
  • 職業
  • 未既婚、子供の有無
  • 製品利用者、非利用者

調査設計で割付について考える際は、下記のポイントを検討し、割付を設定していきましょう。
1. 推定したい母集団は何か
2. 自然回収でその標本は集まるのか
3. 比較したい属性はあるのか
4. 母集団との誤差はどの程度に収めたいのか

ウェイトバックとは

ウェイトバックは、調査データを母集団の構成比に基づいて補正する手法です。

調査で集められたサンプルが実際の人口構成や市場特性と異なる場合、各セルにウェイト(重み)をかけて調整します。これにより、データを母集団に近づけ、より正確な分析を可能にします。特に、偏りがあるサンプルや小規模な調査で有効です。

下図は、先ほどの調査例(標本)と実際の20代以上の日本人口(母集団)の性年代構成比を比較したイメージ図です。

調査例の性年代構成比は、母集団に対し、30代以下の割合が多く40代以上の割合が少なく(男性60代を除く)なっています。したがって、母集団(真の値)より30代以下の意見が多く、40代以上の意見が少なく反映された「全体」傾向になってしまう点が分析の際に問題になります。

つまり、ウェイトバックをせずに調査を行った場合、下記のような問題が生じています。

・全体の性年代構成が母集団と異なっている
=標本全体が母集団の縮図になっていない

この問題を解決するために、ウェイトバックを利用します。

ウェイトバックの仕方

ここまで、ウェイトバックの必要性についてお伝えしました。次に、実際にウェイトバック集計はどのように算出するのかについて説明します。

ウェイトバックを行う際には、まず調査サンプルと母集団の構成比を比較し、各セルごとにウェイト(重み)を算出します。計算方法は、母集団の構成比を調査サンプルの構成比で割ることで求められます。

例えば、調査サンプルにおける30代男性の割合が10%で、母集団における30代男性の割合が9%であれば、その属性のウェイトは(0.09÷0.1=0.9)0.9となります。これを30代男性のデータに掛け合わせて補正します。

このように、各属性にウェイトをかけて調整することで、調査結果全体が実際の母集団を正確に反映する形に近づきます。

ウェイトバックの注意点

1.ウェイトバックが必要なのは”全体”を見る時
母集団の構成に則った全体傾向を見る事ではなく、均等に回収した(割付通りの)全体傾向を見る事が目的の場合は、ウェイトバックは不要です。

2.ウェイトバックには十分なサンプルが必要
少数しか回答者がいない場合、その少数回答を属性全体の回答に拡大してしまうことになります。したがって、結果が大きく歪んでしまうことがあります。

同様の理由で、定性調査で得たデータをウェイトバックによって定量データのように扱うのも適切ではありません。n数とウェイトバック値がどの程度なのかに注意しましょう。(少数を10倍とかしてない?)

3.ウェイトバック値の元になる構成比は間違っていないか
例えば、1都3県を対象とした調査では、日本全国の性年代構成比ではなく、1都3県全体の性年代構成比もしくは東京都・神奈川県・埼玉県・千葉県 毎の性年代構成比を利用する方が適切です。

4.ウェイトバックするかどうかは最初に決める
データ取得後に結果を見てからウェイトバック集計の有無を判断すると、母集団の構成比が分からずに不適切なウェイトバック値を利用したうえ、少数しか回答者がいないセルを10倍以上拡大してしまうといったことが起こりかねません。

データ取得前(調査設計)の段階からウェイトバック集計を想定して事前にウェイトバック値を用意し、またウェイトバックに耐えられるだけのサンプルサイズを確保できるよう割付をおこないましょう。

まとめ

本記事は、調査データの信頼性を高めるための手法である「割付」と「ウェイトバック」について解説しました。

割付とは、回収する回答数をセグメントごとに事前に決めておくことです。
ウェイトバックは、回収したサンプルが母集団の構成と異なる場合に、調査データに重みをかけて補正し、より現実に近い結果を得るための手法です。

これらを適切に活用することで、調査結果の精度を向上させ、マーケティングや意思決定の成功に繋げることが可能になります。

SKYFLAGリサーチについて

広告マネタイズプラットフォームの「SKYFLAG」を導入しているマンガアプリやゲームアプリなどさまざまなサービスで構成される独自のモニタからアンケート回答を取得できるマーケティングリサーチサービスです。

従来のアンケート回収の基盤となっているポイントサイト以外のユーザーからアンケート聴取ができるため、より市場の声に近い調査を行うことができます。

\ポイ活ユーザー以外に聞けるアンケート調査/