Interne Benutzer in Google Analytics-Views filtern

Möchten wir in Google Analytics Rückschlüsse auf das Verhalten unserer Nutzer ziehen, so setzen wir (stillschweigend) voraus, dass die Daten, mit denen wir arbeiten, sauber und qualitativ hochwertig sind. Allerdings werden ohne weiteres Zutun in Google Analytics die Daten externer und interner Benutzer zusammengeworfen. Das Verhalten dieser beiden Nutzergruppen dürfte sich aber grundsätzlich voneinander unterscheiden.

Wenn in Unternehmen die Startseite eines Browser standardmäßig mit der Corporate Website belegt ist, diese nach Aufruf aber in den meisten Fällen wieder verlassen wird, stehen am Ende viele Sitzungen mit erhöhten Absprungraten.

So ist es also ratsam, externe und interne Benutzer getrennt zu betrachten.

Wir sollten also eine separate Datenansicht anlegen, in der interne Benutzer ausgeschlossen werden. Im folgenden beleuchten wir zwei Möglichkeiten, interne Nutzer auszuschließen. Erste Erfahrungen im Umgang mit Google Analytics und dem Google Tag Manager sind sicherlich von Vorteil.

CreativeCommons: StockSnap / pixabay.com

Möglichkeit eins: Ausschluss über einen IP-Filter

Zunächst legen wir in Google Analytics eine neue Datenansicht an, benennen diese und wählen die passende Zeitzone aus.

Google Analytics - Datenansicht erstellen
Datenansicht in Google Analytics erstellen

Anschließend legen wir einen Filter an (Verwaltung ▹ Datenansicht ▹ Filter ▹ Filter hinzufügen).
Google Analytics - Datenansicht konfigurieren
Die View-basierten Filter in Google Analytics bieten die Möglichkeit, Nutzer anhand ihrer IP-Adresse ein- oder auszuschließen. Unternehmen haben in der Regel eine oder mehrere feste IP-Adressen.

Zunächst sollte klar sein, welche IP-Adresse ausgeschlossen werden soll. Ein Besuch von https://www.wieistmeineip.de liefert einen ersten Hinweis – vergewissert Euch sicherheitshalber bei Eurer IT, ob es ggf. mehrere feste IP-Adressen oder IP-Ranges gibt, die später im Filter berücksichtigt werden sollen. Unter Umständen hat Euer Unternehmen auch verschiedene Niederlassungen in unterschiedlichen Ländern. Das macht es natürlich etwas komplizierter. Das Prinzip bleibt aber dasselbe.

Vorsicht: Ist Google Analytics datenschutzkonform eingesetzt, so werden die IP-Adressen maskiert, d. h. das letzte Oktett der IP-Adressen wird vor der Verarbeitung der Daten auf „0“ gesetzt. Aus 194.145.124.105 wird 194.145.124.0. Wird das letzte Oktett in dem IP-Filter nicht genullt, so funktioniert dieser Filter leider nicht, da es ja keine Übereinstimmung gibt.

Wie lässt sich ermitteln, ob anonymizeIP verwendet wird?

Sofern Google Analytics über den Google Tag Manager konfiguriert wurde – und Ihr Zugriff auf den GTM habt – könnt ihr dort prüfen, ob die Funktion „anonymizeIp“ auch wirklich aktiv ist. Normalerweise wird die Funktion innerhalb des Variablentyps „Google Analytics-Einstellungen“ gesetzt.

Unter „Festzulegende Felder“ findet Ihr den Eintrag „anonymizeIp“, dem ein boolescher Wert zugewiesen wird. Ist dieser Wert „true“, ist alles fein.
Verwendet ihr keinen Google Tag Manager, oder habt keinen Zugriff darauf, könnt Ihr Euch mit dem Browser-AddOn „WASP“ (Web Analytics Solution Profiler) behelfen, welches in den Entwicklertools ausgeführt wird.

In folgendem Screenshot wird skizziert, wie und wo Ihr in WASP die Information abruft (Zur Erinnerung: Der Wert, den die Funktion anonymizeIp zurückgibt, ist ein boolescher Wert. Dieser ist also wahr (=1) oder falsch (=0).

 

WASP - anonymizeIP

Kurzer Exkurs: IP-Adressen pseudonymisieren

Leider verarbeitet Google Analytics die IP-Adressen standardmäßig nicht pseudonymisiert, d. h. hier müsst Ihr etwas nachhelfen (den Unterschied zwischen Pseudonymiserung und Anonymisierung erläutert Rechtsanwalt Dr. Thomas Schwenke).

Variante A: Google Tag Manager

Am einfachsten könnt Ihr die Funktion über den GTM-Variablentyp „Google Analytics-Einstellungen“ ausspielen. In dieser Variable wird u. a. die Tracking-ID von Google Analytics gespeichert, aber auch andere Funktionen können hinzugefügt werden.

Die Tracking-ID kann natürlich auch innerhalb der Tags definiert werden, aber das Zurückgreifen auf eine Variable ist etwas einfacher, da Ihr nicht bei Erstellung neuer Tags jedesmal die UA-ID raussuchen müsst.

Im GTM klickt Ihr zunächst auf „Variablen“ und anschließend auf „Neu“ unter „Benutzerdefinierte Variablen“. Ihr gebt eurer Variablen zunächst einen Namen mit Wiedererkennungswert, z. B. „Google Analytics ID“ und wählt dann unter „Variable konfigurieren“ den Variablentyp „Google Analytics-Einstellungen“ aus.

Google Tag Manager - Google Analytics Settings (1)

Jetzt tragt Ihr Eure Tracking-ID ein, klickt anschließend auf „Weitere Einstellungen“, „Festzulegende Felder“ und die Schaltfläche „Feld hinzufügen“. Unter Feldname tragt Ihr „anonymizeIp“ (in der „CamelCase“-Notation) ein und weist den Wert „true“ zu. Speichern nicht vergessen.

Google Tag Manager - Google Analytics Settings (2)

Nun müsst Ihr nur noch in jedem Tag des Typs „Universal Analytics“ unter „Google Analytics-Einstellungen“ die eben angelegte und gespeicherte Variable auswählen und zuweisen.
Google Tag Manager - GA Pageview Tag

Danach speichert Ihr die Einstellungen und veröffentlicht den Container.

Variante B: Ergänzung des Trackingcodes

Habt Ihr den Trackingcode (Universal Analytics / analytics.js) direkt und ohne Umweg über den Google Tag Manager in den Quellcode Eurer Webseiten eingefügt, so müsst Ihr diesen lediglich um eine Funktion ergänzen:

ga('set', 'anonymizeIp', true);

Wichtig ist, dass Ihr diese Zeile vor dem Aufruf zum Senden des Pageviews einfügt. Insgesamt sollte der Trackingcode dann in etwa so aussehen:

<script>
(function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){
(i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),
m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)
})(window,document,'script','https://www.google-analytics.com/analytics.js','ga');

ga('create', 'UA-12345678-X', 'auto');
ga('set', 'anonymizeIp', true);
ga('send', 'pageview');
</script>

Seit kurzem empfiehlt Google die Verwendung des sog. Allgemeinen Website Tags, kurz gtag.js. Der gtag.js Tracking-Code sieht in etwa so aus:

<!-- Global site tag (gtag.js) - Google Analytics -->
<script async src="https://www.googletagmanager.com/gtag/js?id=UA-12345678-X"></script>
<script>
  window.dataLayer = window.dataLayer || [];
  function gtag(){dataLayer.push(arguments);}
  gtag('js', new Date());

  gtag('config', 'UA-12345678-X');
</script>

Die Zeile vor dem schließenden </script> muss wie folgt ergänzt werden:

gtag('config', 'UA-12345678-X', { 'anonymize_ip': true });

Die IP-Adressen werden nun pseudonymisiert von Google Analytics gespeichert und verarbeitet, und unser IP-Filter schließt internen Traffic aus. So weit so gut. Aber…

Nachteil des IP-Filters

Die Kombination von anonymizeIp und der Filterung einer IP-Adresse bewirkt, dass ich eben nicht nur eine IP-Adresse ausschließe, sondern alle IP-Adressen, die das letzte Oktett „maskiert“.
Der Filter ist so eingestellt, dass die Adresse 194.145.124.0 gefiltert wird. Dahinter befindet sich sowohl „unsere“ 194.145.124.105 als auch
194.145.124.0
194.145.124.1
194.145.124.2
194.145.124.3

194.145.124.255
Wir nehmen also das gesamte letzte Oktett in Sippenhaft und verteilen hier eine Kollektivstrafe. Der negative Effekt verstärkt sich, sobald mehrere, unterschiedliche IP-Adressen (keine IP-Ranges, die sich nur im letzten Oktett unterscheiden) gefiltert werden.

Möglichkeit zwei: Zeig‘ mir Deine IP-Adresse und ich sage Dir, wer Du bist!

Um diesen Weg nachbilden zu können, benötigt Ihr den Google Tag Manager. Habt Ihr? Gut.

Kurz zusammengefasst: Im folgenden zeige ich, wie Ihr die IP-Adresse eurer Benutzer feststellt, noch bevor diese im Nebel der Pseudonymisierung verblasst. Das passiert, ohne dass diese Daten an die Google Analytics-Server gesendet werden. Dazu wird über den GTM ein Dienst (ipify.org) angesprochen, der Euch die IP-Adresse der Nutzer zurückgibt, die wiederum einem Abgleich (interner oder externe Benutzer?) unterzogen wird. Diese Information wiederum schreibt Ihr in eine benutzerdefinierte Dimension, anhand derer im letzten Step ein Filter erstellt wird.

Über den Webservice ipify.org lasst Ihr euch die IP-Adresse des Nutzer ausgeben. Diese wird anschließend in den dataLayer gepusht (dadurch lässt sich die IP-Adresse an anderer Stelle wiederverwenden).
Zunächst legt Ihr einen Tag des Typs „Benutzerdefiniertes HTML“ an. Als Trigger wählen Ihr  „All Pages“ (Seitenaufrufe).

<script type="application/javascript">
  function getIP(json) {
    dataLayer.push({"event":"getIp","ipAddress" : json.ip});	
  }
</script>

<script type="application/javascript" src="https://api.ipify.org?format=jsonp&callback=getIP"></script>

GTM - Tag "benutzerdefiniertes HTML"
Die IP-Adresse wird also über das benutzerdefinierte HTML-Tag in den dataLayer geschrieben. Diese Variable werdet Ihr gleich noch verwenden, daher leget Ihr als nächstes eine benutzerdefinierte Variable des Typs „Datenschichtvariable“ an (Name der Datenschichtvariable: „ipAddress“, den Ihr bereits oben im dataLayer.push definiert habt):
Google Tag Manager - Datenschichtvariable
Die Einstellungen könnt Ihr nun kontrollieren, indem Ihr nach dem Speichern in den Vorschaumodus (Schaltfläche oben rechts) wechselt und Eure Website anschließend ladet. Im unteren Teil des Fensters sollte sich der Debug-Mode des GTM öffnen. In der linken Spalte sollte das Event „getIp“ auftauchen. Klickt dies an und wechselt auf die Data Layer-Ansicht. Jetzt wird, wenn alles geklappt hat, Eure IP-Adresse angezeigt (jetzt können die ersten Sektkorken knallen):
GTM - Debug-Mode - ipAddress
So weit, so gut. Der nächste Schritt besteht darin, dem Google Tag Manager mitzuteilen, welche IP-Adresse(n) den internen Benutzern zugewiesen wird. Das erledigt die benutzerdefinierte Variable „Suchtabelle“ für Euch. Wie immer, müssen Variablen genauso wie Tags und Trigger benannt werden. Als nächstes wählt Ihr die Eingabevariable aus: Das ist in diesem Fall die Datenschichtvariable „DSV – IP address“, die Ihr vorhin angelegt habt.

Der Wert dieser Variable wird nun ausgelesen. In das Feld „Eingabe“ gebt Ihr eure interne(n) IP-Adresse(n) ein, die später gefiltert werden soll(en) und gebt einen gängigen Namen als Ausgabewert ein, z. B. „internal“. Das Häkchen bei „Standardwert festlegen“ solltet Ihr setzen, denn hier könnt Ihr der Suchtabelle mitteilen, dass alles, was nicht einer internen IP-Adresse entspricht, als „extern“ ausgegeben werden soll.
Google Tag Manager - Suchtabelle
Die Werte „internal“ bzw. „external“ sollen als nächstes als Eigenschaften einer benutzerdefinierten Dimension ausgegeben werden. Bevor Ihr die notwendigen Einstellungen im Google Tag Manager erledigt, müsst Ihr den sog. Indexwert in Google Analytics ermitteln. Dazu werft einen Blick in die zugehörige GA-Property (Verwaltung ▹ Property ▹ Benutzerdefinierte Definitionen ▹ Benutzerdefinierte Dimensionen).
Google Analytics - Property
Dort klickt Ihr auf die rote Schaltfläche „+ Neue Benutzerdefinierte Dimension“.
Google Analytics - Benutzerdefinierte Dimension
Im nächsten Fenster könnt Ihr Eure benutzerdefinierte Dimension benennen. Ich habe diese „Traffic Type“ genannt. Als nächstes entscheidet Ihr, auf welcher Ebene die benutzerdefinierte Dimension angelegt werden soll. Ich habe mich hier für die Nutzer-Ebene entschieden.

Das Merkmal, ob der Websitebesucher als interner oder externer Benutzer eingeordnet wird, wird im Besucher-Cookie gespeichert und ändert sich nicht, solange der Cookie nicht gelöscht wird. Das heißt: Werdet Ihr bei Eurem ersten Besuch als interner Besucher einsortiert, so ändert sich dieser Status bei weiteren Besuchen nicht (wie erwähnt: es sei denn, der Cookie wird gelöscht oder Ihr besucht die Website mit einem anderen Gerät oder Browser).
Google Analytics - Benutzerdefinierte Dimension bearbeiten
Das Häkchen bei „Aktiv“ setzt Ihr bitte ebenso. Nachdem Ihr die Einstellungen gespeichert habt, generiert Google Analytics Code-Schnipsel, damit die Benutzerdefinierte Dimension später passend in den Tracking Code integriert werden kann. Für Euch ist an dieser Stelle aber nur eine Zahl relevant, in diesem Fall (siehe Bildschirmfoto) die „2“ hinter dimension.

Dies ist der Indexwert, den Ihr als Nächstes im Google Tag Manager verwenden dürft. Die Benutzerdefinierte Dimension legt Ihr in der Variable „Google Analytics-Einstellungen“ an. Zur Erinnerung: Das ist die Variable, in der Ihr die Funktion „anonymizeIp“ angelegt habt (siehe oben).
Unter „Weitere Einstellungen“ klickt Ihr auf „Benutzerdefinierte Dimensionen“, dann auf „+ Benutzerdefinierte Dimension hinzufügen“.
Google Tag Manager - Benutzerdefinierte Dimension hinzufügen
In das Feld „Index“ tragt Ihr den eben in Google Analytics ermittelten Indexwert der Benutzerdefinierten Dimension ein. Als Dimensionswert wählt Ihr die vorhin angelegte Variable (Suchtabelle). Der Name der Variable muss zwischen zwei geschweiften Klammern stehen (nachdem Ihr zwei sich öffnende geschweifte Klammern eingetippt habt, öffnet sich wie von magischer Hand ein Auswahlmenü Eurer bereits angelegten Variablen). Oder Ihr könnt genauso gut auf das Legostein-Symbol klicken und anschließend die passende Suchtabellen-Variable auswählen. Speichern, und dann ist auch dieser Schritt erledigt.

Wichtiger Hinweis: Belasst Ihr es bei diesen Tag Manager-Einstellungen, wird der Filter, den Ihr im nächsten Schritt anlegt, vermutlich nicht funktionieren. Wie Ihr in unten dargestelltem Screenshot des GTM Debug-Fensters erkennen könnt (linke Spalte), wird das getIp-Event zeitlich nach dem Page View-Event („gtm.js“) geladen.

Das heißt: In diesem Zustand wird die Unterscheidung zwischen externen und internen Benutzern noch nicht vorgenommen, sodass alle Benutzer zunächst den Standardwert „external“ erhalten. Für den GA-Filter sind diese Benutzer also erstmal externe Besucher und fallen durch das Raster. Ihr solltet die Reihenfolge der abzufeuernden Tags so wählen, dass der HTML-Tag, der für die IP-Abfrage zuständig ist, vor den GA-Tags (Seitenaufruf-Tags etc.) gefeuert wird.

Geht dazu in die Einstellungen des GA-Tags und klickt in den Bereich Erweiterte Einstellungen ▹ Tag-Reihenfolge. Dort aktiviert Ihr das Kästchen „Ein Tag auslösen, bevor das Tag GA – Pageview – All Pages ausgelöst wird“ und wählt als Setup-Tag Euer benutzerdefiniertes HTML-Tag aus. Dies bewirkt, dass die Tags sequenziell gefeuert werden.
oogle Tag Manager - Tag-Sequenz
Wie immer im Google Tag Manager solltet Ihr unbedingt von der Vorschaufunktion Gebrauch machen. Die liefert gleich die Antwort auf die Frage, ob die Einstellungen korrekt vorgenommen wurden. Nachdem Eure Website geladen wurde, wird (idealerweise) in der linken Spalte des Debug-Fensters das vorhin angelegte Event „getIp“ aufgerufen. Nachdem Ihr auf „getIp“ geklickt habt, prüft im größeren Sichtbereich des Fensters die ausgegebenen Variablen. Sofern Ihr mit einer als „intern“ festgelegten IP-Adresse unterwegs seid, seht Ihr in den Google Analytics-Einstellungen nun die Eigenschaft, die der benutzerdefinierten Dimension „Traffic Type“ zugewiesen wurde.
Google Tag Manager - Debug Modus

Zu guter Letzt: Filter in Datenansicht anlegen

Bevor Ihr den internen Traffic kategorisch ausschließt. empfehle ich, dafür eine neue Datenansicht anzulegen. Ihr wählt die gewünschte View (Datenansicht) aus und klickt in der Verwaltung auf „Filter“. Dort legt Ihr einen neuen Filter an und wählt folgende Settings:

  • Filtertyp: „Benutzerdefiniert“ und „Ausschließen“
  • Filterfeld: „Traffic Type“
  • Filtermuster: „internal“

Diese Einstellungen speichert Ihr ab und überprüft diese über die Google Tag Manager Vorschauansicht und – doppelt hält besser – über den Google Analytics-Echtzeitbericht. Befindet Ihr euch im Netzwerk, dessen IP-Adresse Ihr gerade ausgeschlossen habt, sollte der Real Time Report Eure Sitzung nicht protokollieren. Falls auf Eurer Website soviel Traffic aufläuft, sodass Ihr eure Zugriffe im Echtzeitreport denen von „regulären“ Besuchern nicht unterscheiden könnt, empfehle ich die Erstellung einer Datenansicht mit „inversem“ Filter. Beziehungsweise könnt Ihr, falls Ihr bereits eine Testdatenansicht nutzt, den gleichen Filter wie oben aufsetzen, mit dem kleinen Unterschied, dass Ihr den Filtertyp „Nur einschließen“ anstatt „Ausschließen“ wählt. In dieser Datenansicht taucht dann ausschließlich der interne Traffic auf.

Ein kleiner Tipp zum Schluss: Haltet auch immer eine Datenansicht vor, in der sowohl interner als auch externer Traffic auflaufen. Für beide Traffictypen lassen sich wunderbar benutzerdefinierte Segmente erstellen, die nebeneinander angewendet werden können, um so das Benutzerverhalten beider Gruppen miteinander zu vergleichen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.