2019.4.10

Google アナリティクスの「サンプリング」を理解し、解決する方法

小川 卓(株式会社日本ビジネスプレスCAO)

分析 メディア
  • このエントリーをはてなブックマークに追加

Google アナリティクスではページビュー数が多いサイトで分析を行おうとすると(例:デバイス別や記事別の記事ランキングを見るなど)サンプリングが発生する事があります。

サンプリングとは、調査を行いたい母集団から、調査の対象となる部分を抜き出して集計されるということです。テレビの視聴率をイメージしていただくと分かりやすいかと思います。全世帯に調査をするわけでは無く、一部に対して調査を行い、その結果から割り返して視聴人数を出しているのと同じ考え方です。

Google アナリティクスでサンプリングが発生しているかは、Google アナリティクスで何かのレポートを見ている時に、レポート名の横に黄色いアイコンが表示されているかで判別できます。

黄色いアイコンをクリックすると、下図のような表示が出てきます。

 
『このレポートは8.66%のセッションに基づいて作成されています』※パーセンテージは変わります

こちらはサイト全体の8.66%のセッション(訪問)データを使って全体のデータを計算しているという意味です。つまり10,000の訪問のうち、866訪問を使って閲覧したページなどを取得し、その結果を最後0.0866で割り算して全体の数値を計算しています。これは1ページビュー数あれば、それが約12ページビューとして計測されていることを意味します。

実際にこのレポートのページランキングの最下位を見ると以下の通りとなっています。


何故、どういう条件でサンプリングが行われるのか?

サンプリングを行う理由は、レポート表示時間の短縮のために行われます。既に集計されたデータの場合はサンプリングがかからず、すぐに表示されますが、デバイス別に見たい、流入元別に見たいなど、その場でデータを計算して出すデータに関しては、データ量が多いと時間がかかってしまいます。

目安として、何かしらの集計をする際に、選択した期間でのセッション数が50万件を超える場合となります。メディアサイトのようにページビューが多いサイトの場合は影響を受けるケースが多そうですね。
 

サンプリングによって精度は変わるのか

サンプリングのパーセンテージによっても大きく変わってきます。また見るデータによっても変わってきます。サイト全体の訪問者数・ページビュー数などにサンプリングがかかっても影響はほぼありませんが(数%程度のズレ)、ページビュー数が少ない記事や、流入数が少ない流入元はほぼ参考にならないでしょう。全体の数値を把握する場合は、ほとんど気にする必要ありません。
 

サンプリングはどのように相対すればよいか?

最後にサンプリングを無くす、あるいは、極力減らすための方法をいくつか紹介いたします。

1)    集計期間を短くする
集計期間のセッション数でサンプリングが決まってくるため、(多少手間ではありますが)月単位ではなく週単位でデータを出して別途集計するというような形でサンプリングを無くしたり、割合を減らしたりすることは可能です。

2)    データ自体を最初から分割しておく
Google アナリティクスは「ビュー」という単位でレポートが集計・生成されてします。そこで「モバイルのみの流入」「検索エンジンからの流入」など分析する条件が決まっている場合は、それぞれのビューを最初から作成しておくことにより、同期間でのセッション数を減らすことが出来ます。ビューは作成してからの集計開始になるので、決まった分析軸がある場合は早めに設定をしておきましょう

3)    外部ツールやサービスを利用する
集計期間を短くして後で集計する作業を行ってくれるサービス等もいくつかあります。筆者が使っているのは「unSampler」というサービスです。興味がある方は、ぜひ以下の記事をご覧ください。無料では過去半年のデータまで対応できます。

 

筆者が書いた記事(https://kobit.in/archives/9926/)


4)    Google アナリティクス有償版にアップグレードする
お金はかかりますが、一番確実な解決方法です。ただ有料版でも1億セッションというサンプリングが発生はします。
 

Google アナリティクスをメディアサイトで利用する際にサンプリングは避けられない問題です。出来る範囲で工夫する事で、サンプリングの影響をなるべく減らすことを意識してデータを活用してみましょう。
 

株式会社日本ビジネスプレスCAO

小川 卓

【プロフィール】University College London (UCL:英国)・早稲田大学大学院理工学研究科を卒業。渡米・渡英合計14年。TOEIC 965点(2010年)・GAIQ(2017年)・ウェブ解析士マスター(2016年)。趣味はピアノ・テレビゲーム・サッカー・温泉。ウェブアナリストとしてリクルート、サイバーエージェント、アマゾンジャパン等で勤務後、独立。複数社の社外取締役、大学院の客員教授などを通じてウェブ解析の啓蒙・浸透に従事。株式会社HAPPY ANALYTICS代表取締役。2018年3月より株式会社日本ビジネスプレスCAO。

 

※日本ビジネスプレスではMediaWeaver(メディアウィーバー)をご利用のメディア様向けに「グロースハックコンサルティングサービス」を行っております。ぜひ担当者までお声掛けください。

 

  • このエントリーをはてなブックマークに追加