Anleitung zum Entfernen und Verhindern von Spam in Google Analytics

Sie finden neuerdings Verweise von lifehacĸer.com, abc.xyz, 31302025-1.compliance-fred.xyz, buketeg.xyz, motherboard.vice.com, webmasters.stackexchange.com und anderen in ihren Google Analytics Berichten. Bei den Sprachen finden sich Einträge wie „Secret.ɢoogle.com You are invited! Enter only with this ticket URL. Copy it. Vote for Trump!“ oder „o-o-8-o-o.com search shell is much better than google!“

Kann Traffic Spam meiner Website schaden?

Keine Angst, dieser Spam macht ihre Website nicht kaputt. Der einzige Schaden ist, dass ihre Google Analytics Daten nicht mehr aussagekräftig sind. So wie man die eigenen IP Adressen (im Büro oder Home Office) über einen Filter in Google Analytics ausschalten sollte, damit man nicht die eigenen Besuche auf der Website zählt, so sollten diese nervigen Spam Verweise aus den Berichten gelöscht werden. Wobei, löschen kann man sie nicht. Man kann nichts dagegen tun, dass diese Bots auf ihre Website kommen, aber man kann sie mit ein paar Maßnahmen aus der Google Analytics Ansicht entfernen.

Lösung gegen Spam in Google Analytics

Der häufigste Lösungsvorschlag ist, einzelne Filter für jeden Verweis anzulegen. Das funktioniert prinzipiell, doch man muss ständig den Spammern hinterherlaufen und manuell neue Filter anlegen. Das ist sehr zeitintensiv und mühselig.

Ich habe eine Methode gefunden wie das besser geht. Sie besteht aus mehreren Schritten.

  1. Ihre Daten schützen: Die Ansichten in Google Analytics richtig anlegen, damit eventuelle falsche Einstellungen nicht die Daten ruinieren.
  2. Den Spam und anderen irrelevanten Besuch mit effizienten Filtern stoppen, die nicht ständig erweitert werden müssen.
  3. Die Daten bereinigen. Ein Segment anlegen, um den Spam von den früheren Daten zu entfernen.

 

1. Ihre Daten schützen und mehrere Ansichten anlegen

Zuerst sollte man mindestens zwei Views in Google Analytics anlegen. Eine ungefilterte Ansicht, in der man die Rohdaten ohne Filter belässt. Und eine zweite gefilterte Master Ansicht, die man zum Daten analysieren verwendet. Als dritte View kann man auch eine „Test“ Ansicht anlegen, um Filter zu testen o.ä.

Sie wollen diese SPAM Filter, aber Sie haben die Zeit dafür nicht?
Ich kann das gerne für Sie in Ihrem Google Analytics Account übernehmen. Google Analytics SPAM Filter anlegen

Ich gehe davon aus, dass Sie noch keine weiteren Datenansichten angelegt haben. Dann gehen Sie zur ursprünglichen Ansicht – Google Standardname „Alle Website-Daten“ – und klicken auf „Einstellungen der Datenansicht“

Benennen Sie die ursprüngliche Datenansicht um in „Master – gefiltert“ und speichern diese.

Jetzt kopieren Sie die „Master – gefiltert“ Ansicht.
Wählen Sie „Datenansicht kopieren“ – es wird eine Kopie dieser Datenansicht erstellt. (Die Daten werden nicht übernommen, nur die Einstellungen)
Datenansicht kopieren

 

Geben Sie der Datenansicht den Namen „Alle Website-Daten – ungefiltert“ und klicken auf „Datenansicht kopieren“
Datenansicht benennen

Wiederholen Sie den Vorgang, wenn Sie eine Test Ansicht anlegen möchten.

Gehen Sie zu den Einstellungen der neu angelegten Datenansicht „Master – gefiltert“

An dieser Stelle bietet Google ein Bot Filtering an, welches sie gleich anhaken. (gelb markiert). Speichern.
Bekannte Bots ausschliessen

Nun haben Sie zwei Datenansichten. Am besten ist es, Sie legen auch eine dritte als Test Ansicht an!
Legen Sie zur Sicherheit eine Test Ansicht an.

Die weiteren Schritte nehmen Sie in der Ansicht „Master – gefiltert“ vor.

2. Google Analytics Spam und anderen irrelevanten Traffic stoppen

Wenn Sie die Ansichten angelegt haben, folgen diese Schritte in der „Master – gefiltert“ Ansicht:

a) Filter für Ghost Spam (stoppt jede Art von irrelevantem Traffic von Verweisen, organischer Suche, Seiten und Sprache)
b) Filter für Crawler Spam.
c) Filter für Language Spam.
d) Filter für internen Traffic (hat nichts mit Spam zu tun)

Anmerkungen:
In der Regel dauert es 24h bis Änderungen an den Filtern in Google Analytics greifen. Also ein wenig Geduld haben.
Sie wenden diese Filter entweder in der gefilterten Master View an oder in der Test Ansicht. Nicht in der ungefilterten Ansicht.

a) Einen Filter für alle gültigen Hostnamen gegen Ghost Spam einrichten

Dieser Filter schützt effektiv gegen Ghost Spam.
Der Hostname ist die Seite auf der der User ankommt. Das heisst in der Regel ist das ihre Domain und es könnten noch ein paar andere sein wie zum Beispiel eine Subdomain von ihnen oder eine Domain ihres Newsletter Providers. Als Website BetreiberIn müssten Sie wissen, welche Services Sie verwenden. Mit diesem Filter werden alle anderen Hostnamen wie „secret.Google.com“ ausgeschlossen.

Schritt 1:
Finden Sie Ihre gültigen Hostnamen.
Gehen sie in Google Analytics in der Ansicht „Alle Website-Daten – ungefiltert“ zum Menüpunkt Zielgruppe -> Technologie -> Anbieter und dann wählen Sie „Hostname“

Sie sehen eine Liste an Domains, die durchaus plausibel aussehen.
Nun definieren Sie alle Hostnamen, die zu Ihrer Website gehören. Hier ist das die Domain der Website und zwei Services, die ich verwende nämlich Mailchimp und Spreadshirt.
Zusätzlich könnten hier alle Services auf denen Sie ihren Google Tracking Code (UA-123456-1) angegeben haben, aufscheinen. Zum Beispiel ein Warenkorb oder youtube.com, ein Caching Service, Paypal oder Shopify.

Alle anderen Hostnamen, die Sie nicht aus ihrer Website-Umgebung kennen, sind nicht gültig. Auch bekannte Namen wie google.com oder amazon.com (Spammer benutzen diese Namen, um Nutzer zu täuschen), ebenfalls wenn der Hostname „not set“ ist.

Ein ungültiger Hostname, den Sie filtern möchten, ist jeder von dem Sie nichts wissen wie zum Beispiel:

  • Hostnamen mit URLs, die auf die Spammer Website leiten.
  • Bekannte Seiten, die nicht nach Spam aussehen, aber Sie haben dort nichts eingerichtet oder unter Kontrolle wie cnn.com, foxnews.com, google.com oder apple.com.
  • Der häufigste Hostname für Spam ist (not set). Das passiert, wenn die Spammer es nicht mal der Mühe wert finden einen fake Hostnamen einzurichten.

Hier in grün umrahmt, ein Beispiel gültiger Hostnamen. Alle anderen sollten ausgeschlossen werden.
Die gültigen Hostnamen (grün markiert) notieren

 

Schritt 2
Das heißt wir legen nun eine Liste der gültigen Hostnamen an, die wir in der Ansicht inkludieren wollen. Alle anderen werden dadurch automatisch ausgeschlossen.

Sie wollen diese SPAM Filter, aber Sie haben die Zeit dafür nicht?
Ich kann das gerne für Sie in Ihrem Google Analytics Account übernehmen. Google Analytics SPAM Filter anlegen

Dazu müssen Sie einen regulären Ausdruck (REGEX) https://support.google.com/analytics/answer/1034324 bilden.

In obigem Beispiel sind die regulären Hostnamen
bikesisters.net
bikesisters.us2.list-manage.com
100062098.spreadshirt.net

Der REGEX dafür sieht so aus: bikesisters\.net|bikesisters\.us2\.list\-manage\.com|100062098\.spreadshirt\.net

Am Anfang und Ende des regulären Ausdrucks darf kein | (Pipe Symbol) stehen.
Es ist wichtig, dass Sie alle relevanten Hostnamen einbeziehen. Sobald ein neuer Service dazu kommt, zb. ein Caching Service oder ähnliches, müssen Sie dies im regulären Ausdruck ergänzen. Ansonsten wird der Traffic dafür nicht in der Ansicht angezeigt.

 

Schritt 3
Jetzt legen Sie den Hostname Filter für die gültigen Hostnamen an.
Gehen Sie zur Datenansicht „Master – gefiltert“ und wählen dort „Filter“ und „+Filter hinzufügen“

Legen Sie den Filter-Namen an – „gültige Hostnamen“
Wählen Sie „benutzerdefiniert“ und „Einschließen“. Als Filterfeld „Hostname“ und in das Filtermuster geben Sie den regulären Ausdruck ein.
Filter für gültige Hostnamen anlegen

Wie gesagt: dieser Filter wird den größten Teil des Spams stoppen und braucht keine Updates bei neuem Ghost Spam, aber wenn Sie den Google Analytics Tracking Code bei einem anderen neuen Service verwenden, müssen Sie ihn zum regulären Ausdruck im Filter „gültige Hostnamen“ hinzufügen.

b) Filter für Crawler Spam einrichten

Crawler Spam verwendet gültige Hostnamen, deshalb müssen Sie einen weiteren Filter anlegen, der bekannten Crawler Spam ausschließt.

Sie gehen wieder zur Ansicht „Master – gefiltert“, wählen „Filter“ und „+Neuen Filter hinzufügen“
Nennen Sie den Filter „Crawler Spam #1“ – „Benutzerdefiniert“ -> „ausschließen“ -> Filterfeld „Kampagnenquelle“.
Jetzt geben Sie diesen Ausdruck ein

(best|dollar|success|top1)\-seo|(videos|buttons)\-for|anticrawler|^scripted\.|semalt|forum69|7makemon|sharebutton|ranksonic|sitevaluation|dailyrank|vitaly|profit\.xyz|rankings\-|dbutton|uptime(bot|check|\.com)

Speichern.
Filter für Crawler Spam

Gehen Sie die gleichen Schritte nochmal durch und legen Sie einen zweiten Filter an „Crawler Spam 2“
Geben Sie diesen Ausdruck ein:

datract|hacĸer|ɢoogl|responsive\-test|dogsrun|tkpass|free\-video|keywords\-monitoring|pr\-cy\.ru|fix\-website|checkpagerank|seo\-2\-0\.|platezhka|timer4web|share\-buttons|99seo|3\-letter|top10\-way

Speichern.

 

Sie haben nun diese 3 Filter angelegt.
Google Analytics Filter

Falls neuer Crawler Spam auftaucht, müssen Sie einen neuen Filter anlegen.

c) Einen Filter für Sprachen Spam anlegen

Sie gehen genauso vor wie oben und legen einen weiteren Filter namens „Language Spam“ an.

Sie gehen wieder zur Ansicht „Master – gefiltert“, wählen „Filter“ und „+Neuen Filter hinzufügen“
Nennen Sie den Filter „Language Spam“ – „Benutzerdefiniert“ -> „Ausschließen“ ->
Das Filterfeld ist „Spracheinstellung“

Verwenden Sie als regulären Ausdruck:
\s[^\s]*\s|.{15,}|\.|,

 

Sprachen Spam Filter

 

4. Filter für internen Traffic

Interner Traffic ist zwar kein Spam, aber wenn Sie ein großes Team haben oder Agenturen, die an Ihrer Website arbeiten und diese testen oder kleine Besucherzahlen, dann kann das Mitzählen der internen Besuche auf ihrer eigenen Webseite das Ergebnis stark verfälschen. Um dem vorzubeugen, legt man auch einen IP Filter an.

Dazu benötigen Sie die öffentliche IP Adresse des Netzwerks/WLAN das sie ausschließen möchten. Diese finden Sie z.b hier https://www.wieistmeineip.de/. Sie sieht in etwa so aus
171.155.118.80
Finden Sie alle IPs heraus von denen aus Ihre Seite von Ihnen oder Ihren MitarbeiterInnen selbst besucht wird. Home Office, Büro, Agentur…. Sie können den gleichen Filter verwenden, wenn Sie die IP Adressen in einem regulären Ausdruck kombinieren.
Reihen Sie alle IP Adressen mit einem | (Pipe) Symbol dazwischen auf. Zum Beispiel so:

12.345.678.90|34.567.890.12|11.222.333.44

Dann legen sie den neuen Filter an.
Sie gehen zur Ansicht „Master – gefiltert“, wählen „Filter“ und „+Neuen Filter hinzufügen“
Nennen Sie den Filter „IP Adressen ausschließen“ – „Benutzerdefiniert“ -> „Ausschließen“ ->
Das Filterfeld ist „IP Adresse“.
Geben Sie Ihren IP Adressen an. Speichern.

Um diesen Filter zu testen (kann sein, dass er erst nach 24h greift) müssen Sie auf die „Echtzeit“ Ansicht wechseln. Wenn Sie Ihre Seite besuchen, darf Ihr Besuch nicht angezeigt werden.
Mehr Infos hier: https://www.ohow.co/exclude-static-and-dynamic-internal-traffic-in-google-analytics/

Sie haben nun fünf Filter angelegt.

Spam Filter in Google Analytics

Bei den Crawler Spams können weitere dazukommen und die gültigen Hostnamen müssen Sie bei Bedarf ändern. Wenn neue MitarbeiterInnen dazu kommen oder Sie Ihr Netzwerk wechseln, müssen Sie den IP Filter anpassen.
Ansonsten sollte dieser Spam in Zukunft in ihrer „Master – gefiltert“ Ansicht nicht mehr ausgewiesen werden.

3. Letzter Schritt – historische Daten bereinigt ansehen (optional)

Um ihre bisherigen Daten (vor der Einrichtung der Spam Filter) gesäubert zu sehen, können Sie noch ein Segment erstellen.

Gehen Sie in Ihrem GA Account zu „Berichte“ und klicken Sie auf „Alle Nutzer“
Segment erstellen

Klicken Sie hier auf „+ Neues Segment“
Segment erstellen

Nun sehen Sie diese Eingabefelder.

1) geben Sie diesem Segment einen sprechenden Namen (Alle Sessions, kein Spam, Website Name)

2) gehen Sie zu „Erweitert“ -> „Bedingungen“

3) Legen Sie den ersten Filter an. Genauso wie Sie den „gültige Hostnamen“ Filter angelegt haben. „Sitzungen“ – „Einschließen“ – „Hostname“ – „stimmt mit regulärem Ausdruck überein“ -> Ihr gültiger Hostnamen Ausdruck, den Sie zu Beginn schon in den Filter eingebaut haben. Bei mir ist es bikesisters\.net|bikesisters\.us2\.list\-manage\.com|100062098\.spreadshirt\.net

4) klicken Sie „+Filter hinzufügen“

5) Filter einrichten mit „Sitzungen“ -> „Ausschließen“ -> „Quelle“ -> „stimmt mit regulärem Ausdruck überein“ -> Crawler Spam #1 Ausdruck

(best|dollar|success|top1)\-seo|(videos|buttons)\-for|anticrawler|^scripted\.|semalt|forum69|7makemon|sharebutton|ranksonic|sitevaluation|dailyrank|vitaly|profit\.xyz|rankings\-|dbutton|uptime(bot|check|\.com)

6) ODER

7) „Quelle“ -> „stimmt mit regulärem Ausdruck überein“ -> Crawler Spam #2 Ausdruck

datract|hacĸer|ɢoogl|responsive\-test|dogsrun|tkpass|free\-video|keywords\-monitoring|pr\-cy\.ru|fix\-website|checkpagerank|seo\-2\-0\.|platezhka|timer4web|share\-buttons|99seo|3\-letter

8) ODER

9) „Sprache“ -> „stimmt mit regulärem Ausdruck überein“ -> Language Spam Ausdruck
\s[^\s]*\s|.{15,}|\.|,

10) Speichern

Google Analytics Segment Einstellungen

Nun haben Sie ein Segment erstellt, das ihre historischen Daten bereinigt anzeigt.
Sie können das sehen, wenn Sie beide Segmente zur Ansicht auswählen.

Fügen Sie das Segment in Ihrem Bericht hinzu
Google Analytics Segment vergleichen

 

Wählen Sie das zu vergleichende Segment aus.
Google Analytics Segment vergleichen

Auf „Anwenden“ klicken.

Sie sehen die unterschiedlichen Daten. Das ist in diesem Beispiel nur ein geringer Unterschied, aber wenn Sie höhere Besucherzahlen haben, macht sich der Spam deutlich bemerkbar.
historische Daten Segment ohne Spam

Das ist es. Sie haben nun (für den Moment) eine bereinigte Datenansicht ohne Spam. Wie gesagt, die Spammer lassen sich immer wieder Neues einfallen. Daher sollten Sie diese Filter regelmäßig überprüfen und ergänzen.

Ich wende diese Maßnahmen bei eigenen und Kundenwebsites an. Die Quellen dafür sind folgende Artikel:
https://www.ohow.co/ultimate-guide-to-removing-irrelevant-traffic-in-google-analytics/
http://help.analyticsedge.com/spam-filter/definitive-guide-to-removing-google-analytics-spam/

Teilen:Share on Facebook8Tweet about this on TwitterShare on LinkedIn0Share on Google+1Buffer this pageEmail this to someone

Getagged unter:

Kommentar verfassen

Ihre Email-Adresse wird nicht veröffentlicht.