「ビッグデータ」という言葉がマーケティングの世界で流行し始めたのは2010年頃でした。それまでにも巨大なデータを保有し、「データマイニング」によって様々なマーケティング課題を解決しようとする試みは行われていましたが、インターネットがマーケティングの領域で幅広く活用されるようになり、それに伴い、多種多様なデータが蓄積され、本格的にデータの活用が求められるようになったのがこの頃でした。
さらに10年以上が経ち、データ関連のテクノロジーはAIの再ブームの影響もあり、さらなる発展を遂げています。一方で、消費者の生活の多くの場面でデータが取得できるようになり、プライバシー保護の問題なども浮上してきました。
本稿では、「ビッグデータ」がマーケティング領域で活用されるようになってからの歴史を振り返りつつ、関連するテクノロジーや、法的な問題など、近年の動向についての概要を見ていきたいと思います。
「ビッグデータ」の歴史
「ビッグデータ」以前のマーケティングデータ
いわゆる「ビッグデータ」と呼ばれるような巨大なデータベースをマーケティング目的で活用するようになる以前、消費者分析などのデータは消費者調査によって得られるものでした。例えば、ビデオリサーチの「ACR/ex」や「日経企業イメージ調査」のように、アンケートによる回答をもとにしたデータが活用されてきました。このようなアンケートデータは、消費者の意識や商品の認知度などについての情報が得られるといったメリットがある一方で、アンケートの実施の際に手法によってはコストが嵩むことがあったり、あくまでも消費者の意識について記憶や印象を頼りに回答してもらうので記憶が曖昧だったり、さらには回答時の気分によって回答が変わったりするなどの問題点がありました。現在でも、このようなアンケートをもとにしたデータは、消費者意識を把握するという目的で重要な手法ですが、上記のようなデータの正確性に関する問題が生じることもあり、その点は現在でも課題として残っています。
「ビッグデータ」によるマーケティングデータの変化
上記の消費者調査データは、アンケートデータがもとになっているため、必然的に、対象とする消費者全員の情報を集めることは困難で、該当する消費者の中から、調査対象者となる人をピックアップして、その対象者に対してのみ質問をすることになります。例えば、20~40代の女性をターゲットにした、Aというサプリメントの商品があったとして、その商品についてのアンケートを実施したいと考えたときに、世の中にいる20~40代の女性でAを購入したことのある人全員についてアンケートを行うということは、Aの購入者の数が多い場合には、現実的には不可能です。他の例でいえば、テレビの視聴率調査も、ビデオリサーチの調査システムでは、エリアによって異なるものの、数百万人の視聴者がいるエリアから数百~1,000人強の対象者をピックアップして調査をすることになります。
このように、該当する消費者全員ではなく、その中から対象者をピックアップすることを「サンプリング」といいますが、このようなサンプリング調査の場合、その結果は当然ながらあくまでも近似値となります。例えば、あるテレビ番組の視聴率が、視聴率調査によっては10%の視聴率であったという結果が出たとしても、それは調査対象者である数百人の中での結果であって、実際にそのエリアでテレビを保有している多くの視聴者の実際の数字とは乖離している可能性もあります。このような実際の数値と、サンプリング調査による結果の違いを「サンプリング誤差」といいます。ただし、「サンプリング誤差」は、サンプリングの際に調査対象者が無作為にサンプリングされていて、十分に多くの数が確保されていれば、±数%以内に収まることが統計学的に証明されています。
これに対し、「ビッグデータ」の場合、条件にもよりますが、全てのターゲットのデータを収集することが可能な場合も多くあります。例えば、あるネット配信の動画コンテンツがあったとして、そのコンテンツの視聴者全員が、その番組を何分見たか、あるいはその番組の中のCMをスキップしたかどうか、といった情報については、視聴ログデータを調べることで「サンプリング誤差」無しに測定することができます。また、サプリメントの例でいえば、あるECサイトで当該商品Aを買った人全員が、その次にはどんな商品を買ったかといった情報も、サイトのログデータを調べることで、条件に該当する全員の情報が得られるため、「サンプリング誤差」は生じません。「ビッグデータ」は、アンケートデータとはこの点で異なるということで、多くのマーケティング担当者に重要視されるようになりました。
ただ、アンケートデータでないと補足できないデータもあります。例えば「Aという商品名を知っていまか?」といった認知率や、「Aという商品が好きですか」といった好意度のデータはアンケートでないと情報を得ることができません。このように、ビッグデータと、アンケートデータはどちらが優れているというものではなく、それぞれに目的があるため、適切に使い分けることが重要です。
Tips ビッグデータとサンプリング調査、それぞれに長所と短所
「ビッグデータ」の活用例
世の中に「ビッグデータ」という言葉が流行する以前から、巨大なデータをマーケティングに活用するという動きはありました。従来から、「データマイニング」と呼ばれる手法や、「データベース・マーケティング」といった言葉は存在しており、アンケートデータとは異なった巨大なデータを活用することでマーケティング課題を解決した事例は多くあり、「ビッグデータ」の時代になってからも、その当時に活用されていた手法は主流の分析手法として活用されています。
例えば、有名なデータベース・マーケティングの成功事例の一つに、「おむつとビール」の事例というものがあります。これは、アメリカのスーパーマーケットが、ポイントカードの購買履歴から得られるデータを活用し、おむつとビールを併買する人が多いということから、おむつとビールの陳列棚を店内のレイアウト上、近くに配置したところ、販売量が大幅に増えた、という事例です。これは、従来のデータでは、おむつの購買ターゲットとビールの購買ターゲットは、異なった属性を持つ消費者であると考えられていたため、おむつとビールを同時に購入する人が多いということを発見するのが困難だったのに対して、ポイントカードのデータのように巨大な購買履歴データと、そのデータを保存することのできるサーバの登場と、データを簡易に分析することのできるソフトの普及があったからこそ発見ができたことで、それによってマーケティングが成功したという事例です。
ただ、ここで知っておくべきなのは、データが自動的に上記のような併売施策を導き出したのではなく、アメリカにおいては自家用車で週末にスーパーに買い物に行く消費者が多く、その際におむつを使用する小さい子供がいる家庭では父親が一人で買い物に行く場合があり、その年齢の子供を持つ父親は年代的にもビールの消費が多い層であった、という情報から、「おむつを買いに行くついでに、ビールを手に取ってもらえるようなレイアウトにすればよいのではないか」といった、マーケティング担当者の周辺情報の活用と想像力があってはじめて成功したとも言えるものです。データは自動的に答えを導き出してくれる魔法のツールではなく、あくまでも、目的を持ったマーケティング担当者が日頃の観察眼や知識を活用してこそ、そのパワーを発揮するものであるということを知っておくべきでしょう。
Tips 「ビッグデータ」は魔法のツールではない。マーケティング担当者の想像力とアイディアが重要。
「ビッグデータ」の今とこれから
「ビッグデータ」のデータソース
データの出どころのことをデータソース(データの源、の意味)といいますが、ビッグデータのデータソースは他種多様で、その種類はいまも増え続けています。 マーケティングに活用されるデータソースの代表的なものはオンラインショッピングのデータです。どんな商品を買ったのか、また、ある商品を買った人が他にどのような商品を買ったのか、そのサイトに訪れる前はどのサイトに行ったのか、といったことが分かります。
Amazonの創業は1994年、日本では楽天の創業が1997年で、1990年代の後半は、まだオンラインでの購買者は消費者のごく一部に過ぎず、書籍やCDなどの特定の商品に集中している傾向がありましたが、2000年代以降、ECでの購買行動は一般的になり、対象となる商品も多くの商品カテゴリーに拡大しました。また、オンライン広告のデータも代表的なマーケティングデータです。ある広告を何秒間にわたって見たのか、見た結果クリックしたのか、クリックして遷移した先のサイトでどのようにサイト内を動いたのか、といった情報から、次の広告の打ち方を考える際の情報を得ることができます。また、スマートフォンの普及以降、位置情報のデータも蓄積されてきました。スマートフォンを持って移動し、移動した先で広告に接触したり、商品を購買したりしたデータを活用して、交通広告との連動や、実店舗での購買履歴のデータとの統合といった活用がなされています。また、スマートウオッチなどのウェアラブルデバイスの普及による、心拍数や発汗といった生体反応のデータも捕捉できるようになったり、スマートフォンのアプリも多様化したりしているため、アプリ内での課金やEC関連のアプリによる購買履歴データと、上記の位置情報、生体反応なども統合して、様々なデータを活用したサービスが開発されています。さらには、従来は情報機器ではなかった冷蔵庫や洗濯機のような家電をIoT技術によってオンライン接続することで得られるデータや、自動車のドライブレコーダー普及に伴い収集される大量のデータなども、重要なデータソースになりつつあります。
データの活用領域は、AIの技術の発達により、さらに拡大しています。データは蓄積しているだけでは意味を持たないことが殆どですが、膨大なデータの中から、特定の法則性を見出したり、人間が分析するだけでは発見できなかった傾向を見つけたりするなど、AIの発展によって、データ活用の領域も急速に拡大しています。 今後も様々なデータが補足できるようになり、データを活用するマーケター側からはさらに新しいサービスを開発する可能性が広がるのと、消費者からは、新しいサービスによって、より楽しく豊かな生活が得られることが期待されます。
「ビッグデータ」とプライバシー
ここまで見てきたように、「ビッグデータ」には様々な利点がありますが、一方で、あまりにも人々の行動の多くの部分が可視化されてしまうことにより、消費者の生活を脅威にさらす可能性も指摘されています。
自分の名前、年齢、性別、住所といった、自分を個人として特定できる情報と、どのような商品を買ったのか、どんな映画を見てどんな音楽を聴いているのか、いつどこにいて、何をしていたのか、といったことが様々な機器を通じて情報が収集されていきます。その傾向が強まることによって、自分の生活が全て誰かに知られてしまうのではないか、という恐れを抱く人が増えています。
個人情報を保護する法律は各国が整備していますが、国によってその内容は異なります。なかでも、「EU一般データ保護規則(GDPR; General Data Protection Regulation)」は従来の規則よりも厳しいものであり、多くの企業が対応を余儀なくされています。
特に、近年のマーケティングデータで大きな話題となっているのは「クッキー(Cookie)」です。クッキーはインターネットのブラウザを特定することができる識別情報として活用されていますが、クッキーによってどのサイトを訪問したのかといった情報から趣味嗜好を推測されてしまったり、特定のジャンルのサイトの訪問履歴から、そのジャンルに関連する商品の広告ばかりが頻繁に表示されるようになったりしてしまいます。クッキー自体は名前や住所といった個人を特定する情報ではありませんが、EUやアメリカではクッキーの使用が制限されるようになりました。これによって、広告配信に用いられているデータを入手することができなくなったり、サイトの訪問履歴などの情報が得られなくなったりします。
そのため、クッキーのデータをマーケティングに活用してきた多くの企業で、将来的にクッキーを活用しないようにする「クッキーレス」の時代に対応しようとする動きが加速しています。自社で独自に取得したデータのみを活用することで対応しようとする企業も多く、今後、さらに多種多様なデータが混在することが予想される社会においては、クッキーを使用せずとも従来の目的を超える情報が得られるようになるかもしれません。
Tips 「ビッグデータ」とプライバシーの問題は、データを活用する企業にとって、とても重視すべき問題。今後も各企業や法令の動向に要注目。
まとめ
「ビッグデータ」によって、生活はますます便利になると同時に、知らない間に個人情報が活用される恐れも増しており、企業のマーケティング担当者は、自社の顧客に損害を発生させないように慎重なデータの活用が求められると同時に、データをいかに活用すれば顧客に利便性を提供できるか、常に想像力を働かせて、新しいアイディアを生むことが期待されていると言えるでしょう。