GA4でリファラースパムをアナリティクスから除外する

anti-spam website image

GA4にNews.Grets.Storeのようなサイトから大量のリファラースパムがおくられGA4のレポートが実情とかけ離れたものになることは実は既に広く知られた既知の問題です。対策方法は一つではありませんが、一番簡単で確実な解決方法を説明します。この対策を行っておかないと「ここ最近ウェブサイトのアクセスが伸びています!」等と浮かれていてもそのほとんどが参照スパムだったというGA4あるあるに陥ってしまいます。

この記事で解決すること

リファーラースパムをGA4のレポートから確実に除外します。現在、GA4(Google Analytics 4)などのアナリティクスツールでは、参照スパムやリファラースパムのアクセスがフィルタリングされず、これが問題となっています。その結果、本当のウェブサイト利用者のアクセスデータの精度が損なわれている可能性があります。これは、偽のトラフィックが全体のデータを歪め、ウェブサイトの運営者が正確なユーザー行動を把握することを困難にしています。以下のような参照スパムが多く報告されています。実に鬱陶しいです。

news.grets.store

代表的なリファラースパムです。

rida.tokyo

リファラースパムです。

info.seders.website

これもリファラースパムです。

static.seders.website

これもリファラースパムです。鬱陶しいたらありゃしない。

GA4にこれらのリファラースパムアクセスを除外するための設定をおこないましょう。

様々な解決法がウェブ上に散見されますが、古い情報もあり困っている人も多いと思います。2024年時点で確実に効果のある設定方法を紹介します。少々めんどくさいですが本当のウェブサイト利用者のアクセスデータを把握することはこれからのマーケティングの第一歩ですのでしっかりと設定していきましょう。

設定方法詳細

GA4に管理者権限で開き、以下の設定を行います。

まずはリファラースパムの確認を行いましょう。

GA4のレポート/集客/ユーザー獲得/をクリックし、テーブル表示の一番上の行(ヘッダー)のドロップダウンをクリックして「ユーザーの最初の参照元」を選択します。static.seders.websiteのようなスパム参照元に相対的に大きな数字がある場合、データを歪めてしまいますので対処していきます。

instruction

スパム参照元のIPアドレスを調べる

https://www.nslookup.io/ のようなウェブサイトIPチェッカーを利用してスパムURLのIPを特定しましょう。news.grets.storeの場合はIPアドレスが77.222.40.224であるということが分かります。

管理ページから設定したいデータストリームを選択する

GA4の管理/データの収集と修正/データストリームをクリックし、表示されたデータストリームから自分が意図するサイトを選択します。

instruction

タグ設定を行うをクリック

Googleタグというセクションから タグ設定を行う をクリックします。

instruction

内部トラフィックの定義をクリック

タグ設定ページが開いたら、「もっと見る」をクリックして、「内部トラフィックの定義」をクリックします。ここで注意しないといけないことがあります。設定するのは「内部トラフィックの定義」で、その直下に表示されている「除外する参照のリスト」ではないということです。この「除外する参照のリスト」設定は指定した参照トラフィックを参照トラフィックではなくダイレクトトラフィックとして扱うための設定で、トラフィック自体を除外するものではありません。実にわかりにくいです。

instruction

内部トラフィックの定義設定画面でパラメーターを入力する

この設定は本来自分たちのアクセスをデータから除外するために使うものですが、今回の目的にも適応可能ですし問題解決手法としても正しいです。以下のようにtraffic_typeは「internal」と設定、IPアドレスの欄に先ほど特定したIPアドレスを追加していきましょう。今回はスパム元がIPを少し変更しても対応できるよう範囲で指定する方法を紹介します。除外したいIPが77.222.40.224である場合、マッチタイプを「IPアドレスが範囲内(CIDR表記)」を選択し、77.222.40.0/24と記入します。詳しいことは省略しますがこれは77.222.40.0~77.222.40.255までの全てを除外することを意味します。これで設定は完了です。

instruction

それでも除外したはずのリファラースパムが出てくる場合

上記の設定で除外できたと思いますが、それでもリファラースパムが出てくる場合は、スパムとなっているURLに関連づけられているIPが複数あり、IPチェッカーで特定したIPだけでは不十分な可能性があります。その場合は、https://dnschecker.org/all-dns-records-of-domain.php このウェブサイトの「DNS Lookup」を利用して、対象のドメインURLを入力すれば、関連づけられたIPアドレスをすべて確認することができます。参考としてrida.tokyoを入力してみると以下の画像のように追加で4つのIPアドレスを取得できました。こちらも上記設定方法で除外設定を行いましょう。このようなスパム本当に鬱陶しいですが、これからのデジタル時代、スパムも進化、増加していきます。スパムと効率的に付き合うための準備も重要なDX施策の一つと言えるのではないでしょうか。

instruction

GA4等のアナリティクスサービスではこのような継続的な対応が必要

上記の設定で当座、問題であったリファラースパムは除外できたと思います(設定の反映に24時間程度要することもあります)が、グーグルアナリティクスのような一般的なサービスではこのような対策を定期的にしていく必要があります。これは専門の部署がない中小企業などでは大きな負担です。レガシスが提供する「AI搭載のウェブサイト」なら、設定不要で確実にボットのトラフィックやスパムトラフィックは除外され、正確なユーザー行動を詳細に把握することが可能です。GA4のデータ活用が面倒な方、本当のユーザー行動に興味がある方、是非お気軽にご相談ください。