この連載ではビジネスにおける「マーケティングリサーチ」を捉え直していきたいと思っています。前回まで、マーケティングリサーチとは何か、また本来どうあるべきなのか。何を目的にリサーチをするのかについてお伝えしてきました。
前回の最後でも紹介した通り、本来あるべき効果的なリサーチを実施するためには、マーケティングリサーチャーが適切に設計し、ディレクションする必要があります。そしてそのためには、マーケティングリサーチャー自身が、そのリサーチが技術的に正しいか、当初の目的に沿ったものになっているかなどを判断しなければなりません。
そこで今回から 2 回にわけて、マーケティングリサーチの重要な手法である「定量調査」と「定性調査」について、基本的な考え方やデータの読み方を紹介します。まず今回は定量調査についてです。
定量調査の “ 厄介な問題 ”
定量調査というと、パネルを使った調査(対象者を固定し、一定期間に継続して同じ質問をするアンケート方法)を想像する人が多いかもしれませんが、それだけではありません。テレビの視聴率調査のように、家庭を 1 軒ずつ訪問して協力をお願いする場合もあれば、新聞社などによる世論調査のように無作為に電話をかけて回答をお願いする RDD(Random digit dialing、乱数番号法)と呼ばれる方法もあります。これらはいずれも「無作為サンプリング」によって回答者を選ぶ方法です。
この「無作為サンプリング」についてもう少し紹介します。
リサーチの対象者になり得るすべての人を母集団と言います。たとえば成人を対象にした世論調査であれば、母集団である20 歳以上の全員に質問して回答を得られれば最も正確ですが、現実的ではありません。そこでこの母集団の中から、構成比を同等にした(これを代表性があるといいます)小さな標本(サンプル)を作り、その人たちにのみ回答を依頼します。これが「無作為サンプリング」です。
パネル調査や RDD などの方法は、この正確なサンプルを作るために開発された方法です。そしてサンプリング調査の最大の特徴は、結果が「パーセント」で表示される点にあります。「この質問に A と回答した人は、サンプルに調査した結果 X% だったため、母集団でも X% だと考えられる」といった具合です。
しかしこのパーセント表示には、実は厄介な問題があります。本当にそのサンプルに代表性があるのか、ということです。つまり母集団とサンプルが同質で、正確な無作為サンプリングができていることが担保されていなければなりません。サンプリング調査において、N 数(サンプルサイズ)が大きいほど、誤差が小さくなる理由もここにあります。誤差が小さいほど、同じリサーチを同じ母集団の異なるサンプルに対して実施したときに、同じ結果が得られる、つまりリサーチに再現性があるということを意味しています。
また厄介な問題を引き起こすものとしては他に「無意識のバイアス」が挙げられます。定量調査に限らずリサーチの設計には、ある程度の仮説が必要ですが、経験あるマーケティングリサーチャーほど容易に仮説を立てられます。しかしその仮説がそのまま採用されるほど環境に変化がないのであれば、そもそもリサーチの必要はありません。
リサーチとは、市場環境や顧客、消費者、その情報環境に何かしらの変化が起こっていると感じるからこそ実施するものです。「以前のリサーチではこうだった」という経験は、事実としては重要ですが、「無意識のバイアス」にしてはいけません。
定量調査の基礎は「母集団」の設計にあり
ここから「母集団」について考えてみましょう。
たとえば「今回のリサーチ対象者は企業のマーケティング担当者です」と言われたらどうでしょうか。企業でもその規模や業種はさまざまです。ここでそれらすべてを含めるべきでしょうか。
次に、母集団を提示する場合、その集団が調査対象地域内に何人いるかを推計できなければなりません。なぜならその数が「% 値」の分母になるからです。定量調査をしたいのであれば、事前に対象地域に、リサーチ対象にしたい「マーケティング担当者」が何人いるかを調査(母集団調査)しなければなりません。そうでなければ、結果として出てきた「パーセンテージ」が何に対するものなのか、わからなくなるためです。
残念ながら、これはよくある失敗です。母集団を把握できていないと、たとえばリサーチの本来の目的は「企業でマーケティングを担当している人の X%」が当該商品に対して肯定的なのかを知ることだったはずなのに、結果は「この調査に回答した人の X%」が肯定的だったという数字でしかなくなってしまうことがあります。この 2 つは、似ているようでまったく異なります。前者は % 値を母集団の人数に戻せますが、後者はそれができません。これでは、定量調査とは言えません。
さらに調査設計上、まったく同じ母集団を対象にしなければならないリサーチであるならば、異なる条件でサンプリングしてしまわないように注意が必要です。たとえば母集団の条件が「企業でマーケティングを担当している人」なのに、A のリサーチでは「自分の業務の中にマーケティングが含まれると自認している人」をサンプル対象とし、B のリサーチでは「具体的に個別のマーケティング業務を挙げ、その中で担当している業務が 2 つ以上含まれている人」だけをサンプル対象にしているといったケースです。いずれも単体で見れば間違いとは言い切れませんが、サンプルの母集団が異なるため、この 2 つのリサーチを比較することはできません。
設計の段階で、得られるデータは決まっている
定量調査ではさらに、データを取得した後にどのような集計をするのか、あらかじめ設計しておく必要があります。主成分分析やクラスター分析などをすることで「データを似たもの同士に分類したい」、各種回帰分析をすることで「データ間の因果関係を説明(予測)したい」など、目的が明確な場合には、あらかじめその目的にあった対象者の選定や質問票の設計が必要ですし、目的と直接関係ない要素は極力含めないようにしなければなりません。適切に設計できていない調査データを使い、無理やりデータを分類したり因果関係を説明したりしようとすると、要素の抜け漏れや重複が多く発生してしまいます。
シンプルなクロス集計でも同様です。通常、クロス集計の軸を最も細かく分解したときの N 数を統計的に有意な数に設定し、そこから逆算して全体の回答者数を決定します。
たとえば、最も細かく分解したクロス集計の軸を「商品の利用者 × 女性 × 20 代」とします。その商品の利用率が 20% となるような母集団があり、その半数が女性で、かつ 20 代が 20%とすると、1×0.2×0.5×0.2で、母集団に対して 2% の出現率であることが想定できます。そのため N 数を 200 確保するには 1 万人の回答が必要だと判断できるのです。
それに対して母集団を「国内における商品の利用者」とはじめから限定したらどうなるでしょうか。同じ N 数 200 に対して、出現率が母集団中の 10% の場合、母集団から 2,000 人の回答で済みます。しかしこのリサーチでは、その商品を利用していない人の回答はまったく得られないため、利用者と非利用者の比較はできません。このように、リサーチで集計できることは、設計の段階ですべて決まっているのです。
しかしリサーチの結果を見ると、マーケターはまた新しい視点やアイデアが浮かぶものです。こんな集計、あんな集計がほしいと、さまざまな要望も出てくることでしょう。先ほどの例だと「女性 20 代の利用者で独身と既婚、さらに子供の有無で分けたい」といった要望が出たりします。しかしながら、そもそも女性の 20 代利用者を最小単位として設計しているリサーチなので、いずれもサンプルサイズが不足していることは明らかです。表計算ソフトを使えばそれなりに集計できてしまうこともありますし、それが一切ダメというわけではありませんが、N 数が少ないと「誤差」が大きくなり、信頼性は落ちてしまいます。
このような場合は必ず、得られた値の差が統計的に信頼できるかどうかを判定する有意差検定をした上で、信頼区間も提示しなければなりません。逆にいえば、調査会社からのデータのチャートに検定結果と信頼区間が表示されていれば、そのデータは信頼に値するデータだといえるでしょう。N 数が 2 桁しかないのに、検定もせず、信頼区間も無視した 1 〜 2% 程度の違いのランキングチャートが貼り付けられていたら、その調査レポートは信頼できませんし、もちろんそのデータから何かを発見することもできません。
またたとえばマーケティングリサーチの中には、1 年に 1 回、半年に 1 回など、定期的に実施するものがあります。時系列に沿って市場や消費者のトレンドを分析することが目的なので、「質問文」「選択肢」「選択肢の数」「選択肢」の表示される順番は毎回同じか、もしくはランダムにして回答者にとっての一貫性を担保しなければいけません。それにもかかわらず、リサーチに関わるさまざまなステークホルダーからの依頼で、質問票が変わってしまうことがあります。変更してしまえば、その前後のトレンドを比較することはもはやできなくなってしまいます。
定量調査を計画しているマーケター、あるいはマーケティングリサーチャーは、当初予定していない集計のほとんどは参考値であり、それをさらに突き詰めたければ、別途そのためのリサーチをしなければならないということを認識しなければなりません。それがマーケティングリサーチのあるべき姿なのです。