こんにちは、B-K(@analyzesiraberu)です。
Googleアナリティクスでアクセス解析を行っていると、色々な迷惑行為(スパム)をされてデータの信憑性を狂わされます。
そこで、今迄行ってきたスパム行為(リファラスパムなど)のデータをGoogleアナリティクスから除外する設定です。
現状、この方法で98%以上のスパム行為を防ぐ事が出来ます。
Googleアナリティクスへのスパム行為
これは、2015年1月1日から9月7日までのGoogleアナリティクスのアクセス記録です。
これは、全てスパム行為のアクセス数になります。
なぜなら、このサイト自体を公開していないからです。
検索にもヒットしないし、Googleの検索キャッシュにも存在しない。
Googleアナリティクスのアカウントを作っただけです。
Referralに1,775 Directに1,452 Organicsearchに5のスパム行為を記録しています。
その総3,232にになっています。
オーガニック検索へのスパム行為
オーガニック検索の検索キーワードへのスパム行為です。
以前記事にも書いています。
記事中の除外方法でもフィルタ除外出来ますが、色々調べていくともっと簡単に効率良く除外出来ます。
ちなみに、これらのアクセスのホスト名を表示させると
全て、forum.topic○○○○○.darodar.comになっています。
Directセッションへのスパム行為
Drectセッション数へもスパム行為が行われデータが改ざんされています。
このスパム行為の記録のホスト名を表示させてみます。
全てのホスト名が”not set”を記録しています。
リファラへのスパム行為
このリファラへのスパム行為が非常に横行しています。
特に当サイトでも色々見つけ次第記事にしていますが、毎月新しいリファラスパムがやってきます。
数え上げたらキリがありません。
そして、これらのリファラスパムのホスト名を表示させると
これまた、ホスト名が”not set”の割合が多いです。
リファラスパムの97%のホスト名が”not set”です。
全てのチャネルでのホスト名
全てのチャネルでホスト名を表示させると、”not set”の総数は3,188に上ります。
その割合は、98.6%になります。
ホスト名に”not set”を含む場合除外して表示させてみると、
当たり前ですが、セッション数44になりました。
ホスト名を使ってフィルタ除外設定
ホスト名が”not set”を除外
このようにホスト名が”not set”の場合は、フィルタで除外する設定を行います。
- Googleアナリティクス上のビュー内のフィルタをクリックします。
- 新しいフィルタを作成を選択します。
- フィルタ名を記入します。(自分でわかりやすいフィルタ名でいいです。)
- フィルタの種類は、”カスタム”を選択。
- 除外を選択後、フィルターフィールドで”ホスト名”を選択。
- フィルターパターンに、”not set”をセット。
- 最後に保存。
これで、98%以上のリファラ行為によるデータを除外出来ます。
この設定で除外出来るリファラスパム
(2017年5月30日追記)
このホスト名が”not set”の場合にフィルタ除外出来るリファラスパムの一覧です。
- site1.free-floating-buttons.com
- site2.free-floating-buttons.com
- site3.free-floating-buttons.com
- site4.free-floating-buttons.com
- site5.free-floating-buttons.com
- site6.free-floating-buttons.com
- site9.free-floating-buttons.com
- site10.free-floating-buttons.com
- floating-share-buttons.com
- site1.floating-share-buttons.com
- site2.floating-share-buttons.com
- site3.floating-share-buttons.com
- site4.floating-share-buttons.com
- site5.floating-share-buttons.com
- site7.free-floating-buttons.com
- site8.free-floating-buttons.com
- simple-share-buttons.com
- site19.simple-share-buttons.com
- site23.simple-share-buttons.com
- site38.simple-share-buttons.com
- site○○○○○○○.snip.to
- snip.to
- snip.tw
- share-buttons.xyz
- free-share-buttons.com
- site3.free-share-buttons.com
- site4.free-share-buttons.com
- site5.free-share-buttons.com
- site6.free-share-buttons.com
- free-social-buttons.com
- www1.free-social-buttons.com
- www2.free-social-buttons.com
- www3.free-social-buttons.com
- www4.free-social-buttons.com
- www5.free-social-buttons.com
- www6.free-social-buttons.com
- www7.free-social-buttons.com
- www9.free-social-buttons.com
- www10.free-social-buttons.com
- get-free-social-traffic.com
- get-your-social-buttons.info
- www.event-tracking.com
- www.Get-Free-Traffic-Now.com
- adf.ly
- hosting-tracker.com
- domination.ml
- youporn-forum.uni.me
- pornhub-forum.ga
- traffic2cash.xyz
- web-revenue.xyz
- build-a-better-business.2your.site
- smarter-content.for-your.website
- build-audience.for-your.website
- social-widget.xyz
- net-profits.xyz
- free-traffic.xyz
- domain-tracker.com
- law-enforcement-ee.xyz
- law-enforcement-bot-hh.xyz
- social-buttons-ggg.xyz
- (2017/05/30)
とりあえず、これらのリファラスパムは一括でフィルタ除外出来ます。
オーガニック検索キーワードにも同様にスパム行為をしてきますが、やはりホスト名がnot setの場合には除外設定を行っておけばいいです。
そのフィルタ除外設定で除外出来るキーワードスパム一覧です。
(2017年5月29日 追記)
- www.get-free-social-traffic.com
- why.does.keycode○○○○○.spacebarnot.work?(○の部分は自分のGID)
- www.facebook-mobile.xyz
- www.m-google.xyz
- www.share-button.xyz
- eu-cookie-law.info
- sharebutton.org share buttons
- sharebutton.to
- share this button sharebutton.to
- social sharing buttons code for website sharebutton.to (2016/12/13)
- share button generator sharebutton.to (2016/12/21)
- social sharing buttons sharebutton.to (2016/12/23)
- share buttons sharebutton.to(2016/12/25)
- social share buttons sharebutton.to(2017/01/6)
- dist-it cdn site:nodepm.com (2017/05/23)
- grunt-coffeelint cdn site:nodepm.com (2017/05/23)
- site:sharebutton.to social media sharing buttons (2017/05/23)
- trees cdn site:nodepm.com (2017/05/23)
- urun cdn site:nodepm.com (2017/05/23)
- site:compliance-checker.info (2017/05/29)
参照名にGAのトラッキングIDを含む物を除外
(2015年12月5日追記)
※以前、参照名の所がホスト名として記述をしていました。正しくは、参照になります。参考にされていた方には大変ご迷惑をおかけ致しました。GAのトラッキングIDをリファラに含む物の除外には、フィルターフィールドは”参照”にして下さい。
さらに、残ったリファラスパムで”darodar.com”などは自分のGoogleアナリティクスのトラッキングIDが参照名に含まれています。
ちなみに、トラッキングIDとは、
UAー○○○○○○○○ー1とかの○の部分になります。
そこで、参照名にこのトラッキングIDの○の部分をセットして除外します。
このように参照に自分のトラッキングIDを含む場合は、フィルタで除外する設定を行います。
- Googleアナリティクス上のビュー内のフィルタをクリックします。
- 新しいフィルタを作成を選択します。
- フィルタ名を記入します。(自分でわかりやすいフィルタ名でいいです。)
- フィルタの種類は、”カスタム”を選択。
- 除外を選択後、フィルターフィールドで”参照”を選択。
- フィルターパターンに、”自分のトラッキングID”をセット。
- 最後に保存。
この設定で除外出来るリファラスパム
参照名に自分のGoogleアナリティクスのトラッキングIDを含むリファラスパム等でこの設定で除外出来るものです。
(2016年6月28日)
○の部分にトラッキングIDが記されているリファラを除外します。
ネットワークドメイン名を指定してフィルタ除外設定
(追記 2016/07/26)
ネットワークドメインを指定して、まとめてフィルタ除外設定をする場合には、下記記事を参考にして下さい。
まとめ
現在、自分のサイトにあるスパム行為によるデータの実に98%以上を今回紹介した設定で除外出来ています。
今迄、言語設定が”not set”の場合を除外設定したりしていましたが、それよりもホスト名が”not set”の場合が効果がかなり高い事が判り今回記事にしました。
順次、記事にしている部分にも訂正を入れていきますが、簡単に効率良くGoogleアナリティクスへのスパム行為のアクセス記録を除外するには今回の設定が一番でしょう。
コメント
参考になりました。
スパムセッションを除外出来たようです。
>sheephuman さん
コメントありがとうございます。
毎月毎月発生する新しいリファラスパムだけでは無く、directやキーワードにもスパム行為を行ってきます。
その対策に困っている方などに、この記事の対策方法が参考になれば幸いです。
今日見たら、オーガニックがスパムにやられていたため、参考にさせて頂きました。
おかげさまで設定することが出来ました。ありがとうございます。
大変参考になります。ありがとうございます!
リファラスパムに気づいてから注意してみていると、毎月出てきますね。
何が楽しくてこういうことをするのかわかりませんが、フィルタで除外しかできないのも悔しいものですが、いちちごっこのように対策しまくります!
>ありんこ様へ
コメントありがとうございます。参考になって何よりです。
Googleアナリティクスへのスパム行為は、毎月のように新しいのが発生しますが、特に1年を通して年末年始とGW頃が一番多く記録されています。
この記事の対策方法を取りながら、それでも除外出来ないリファラスパムには個別で対応していった方がいいでしょうね。
特にロシアからのリファラスパムが多いので、ロシアからのアクセス記録が必要なければフィルタの国でロシアを除外しておくのも効果的です。
オーガニック検索でキーワードが出なく困ってた所
こちらのサイトを知りました、対処法などありがとう御座います
他に下記のスパムも私の所には出てきてました。
add social share buttons to website sharebutton.to
add this share button sharebutton.to
youtube share button sharebutton.to
これらも「not set」の設定で除外できるのでしょうか?
もし、ご存知でしたら宜しくお願い致します
こんにちは、はじめまして、兵庫県在住BINGEと申します。
自分は、自分の書いた文章が、何人に読まれたか?というのを、確認するために、
文章に、カウンターをつけているんですが・・・。最近なんですが、サーチエンジン
にもインデックスされていないのに、アクセス数が100とか、何と400とかあり。
自分)→サーチエンジンにも登録されていないのに、アクセス100って、何?
と、奇妙に思い、ネットで、調査してみたんですが?どうやら、ご指摘のとおり、
リファラースパムという、うそカウントみたいです・・・。(もう・・・!)
そこで、google analticsで、反映しないように、設定しました。
まったく、迷惑な話ですね、これ?
カウント100だ!ってよろこんだ自分って・・・。
それでは。
>BINGEさんへ
はじめまして、B-Kです。
急にアクセス数が増えているとすごく嬉しくなって、そして、その原因がリファラースパムだった時の気持ち。
よく分かります。
最近はだいぶリファラースパム自体が昨年と比べて少なくなってきていますが、監視しているとやはりまだスパム行為をしてきています。
この記事の設定だけでもある程度は防げますが、それをすり抜けてくるスパムもあるので困ったものです。
了解いたしました。
最初?カウンターのバグ?とか思いました。
実は、リファラースパム・・・。