Browser-Fingerprinting ist die systematische Sammlung von Informationen von einem entfernten Gerät mit dem Ziel, den Nutzer eindeutig zu identifizieren und zu verfolgen. Die Hauptmotivation hinter dieser Technik ist die Monetarisierung von Nutzerdaten, oft für personalisierte Werbekampagnen und Nutzerprofilierung.
Im Gegensatz zu traditionellen Tracking-Methoden wie Cookies funktioniert das Fingerabdrücken lautlos und kann deutlich beständiger sein. In der Fachliteratur wurde es als "cookieloses Monster" beschrieben, da es keine Dateien auf dem Gerät eines Benutzers speichern muss und für den Nutzer völlig transparent ist.
| Funktionen | Cookies | Browser Fingerabdrücke |
|---|---|---|
| Lagerung | Speichert kleine Dateien auf dem Computer des Nutzers. | Auf dem Computer des Nutzers werden keine Dateien gespeichert ("cookie-los"). |
| Benutzertransparenz und -kontrolle | Kann vom Nutzer über die Browsereinstellungen angezeigt, gesperrt oder gelöscht werden. | Funktioniert transparent. Der Nutzer hat keine direkte Möglichkeit, zu wissen, dass es passiert, oder es zu verhindern. |
| Persistenz | Kann vom Nutzer entfernt werden. | Sehr hartnäckig. Es kann sogar verwendet werden, um Cookies wiederherzustellen, die ein Nutzer gelöscht hat, und seine Identität neu zu verknüpfen. |
Jetzt, da wir verstehen, was Browser-Fingerprinting ist und warum es beständiger ist als Cookies, wollen wir die spezifischen Techniken untersuchen, mit denen diese einzigartigen digitalen Identifikatoren erstellt werden.
Die Einzigartigkeit eines Fingerabdrucks beruht auf der Kombination vieler verschiedener Informationen, von denen einige einfache Browsereigenschaften sind, während andere sehr fortschrittlich und ausgefeilt sind.
Dies sind grundlegende Merkmale, die über einen Browser gesammelt werden können, um mit der Erstellung eines Profils zu beginnen. Jedes Informationsstück hilft, wenn es mit anderen kombiniert wird, die Identität eines Geräts einzugrenzen.
Diese Methoden nutzen moderne Webtechnologien, um subtile, aber sehr identifizierende Details aus einem Gerät zu extrahieren.
Diese Technik verwendet das HTML5-Canvas-Element , um ein verstecktes Bild oder einen Text zu zeichnen. Da jedes Gerät sie aufgrund von Unterschieden in der Grafikkarte, den Treibern und dem Betriebssystem leicht unterschiedlich rendert, können die resultierenden Bilddaten in einen Hash (eine eindeutige Zeichenkette) umgewandelt werden, der als leistungsstarke Kennung dient.
Als Variante des Canvas-Fingerprintings erzeugt diese Methode mehrfach Bilder desselben Textstrings, jeweils mit einer anderen Schriftart aus einer vordefinierten Liste. Die subtilen Rendering-Unterschiede über die verschiedenen Schriftarten hinweg ermöglichen es, Metriken aus den generierten Bildern zu extrahieren und so eine eindeutige Kennung für den Browser zu schaffen.
Diese Technik verwendet die WebRTC-API (eine Technologie für Echtzeitkommunikation), um die tatsächliche lokale IP-Adresse eines Geräts zu entdecken, selbst wenn sie sich hinter einem Network Address Translation (NAT)-Router befindet. Die Kombination dieser lokalen IP mit der öffentlichen IP-Adresse schafft einen sehr stabilen und konsistenten Identifikationsfaktor.
Diese Methode verwendet die AudioContext-API, um ein standardisiertes, computergeneriertes Audiosignal (wie eine Sinuswelle) zu verarbeiten. Es hört das Mikrofon des Geräts nicht ab. Das endgültig verarbeitete Audiosignal weist aufgrund des einzigartigen Hardware- und Software-Stacks des Geräts subtile Variationen auf. Diese Ausgabe wird dann gehasht, um eine eindeutige Kennung zu erstellen.
| Technik | : Wie es funktioniert (vereinfacht) | Warum es effektiv zur Identifikation ist |
|---|---|---|
| Leinwand | Zeichnet ein verstecktes Bild und analysiert die subtilen Rendering-Unterschiede zwischen den Geräten. | Variationen in Grafikhardware, Treibern und Schriftarten machen das Endbild einzigartig für ein Gerät. |
| Leinwandschrift | Rendert denselben Text mit vielen verschiedenen Schriftarten, um Rendering-Inkonsistenzen zu messen. | Die spezifische Kombination aus installierten Schriftarten und deren Darstellung schafft ein äußerst einzigartiges Profil. |
| WebRTC | Verwendet eine Kommunikations-API, um die lokale Netzwerk-IP-Adresse des Geräts anzuzeigen. | Die Kombination der lokalen und öffentlichen IP-Adressen kann ein Gerät im Netzwerk eindeutig identifizieren. |
| AudioContext | Verarbeitet ein Standard-Audiosignal, um Unterschiede im Audio-Stack eines Geräts zu erkennen. | Die Audioverarbeitungshardware und -software auf jedem Gerät erzeugen einen leicht unterschiedlichen Ausgang. |
Obwohl jede dieser Techniken ein Puzzlestück bildet, liegt die wahre Kraft des Fingerabdrucks in der Kombination ihrer Methoden; Der nächste Abschnitt erklärt, wie wir diese Identifikationskraft wissenschaftlich messen können.
Die wissenschaftliche Methode, das Niveau der eindeutigen Identifikation durch eine Information zu messen, nennt sich Informationsentropie, die in "Bits" gemessen wird. Höhere Entropie bedeutet mehr Einzigartigkeit.
Eine einfache Analogie ist ein sechsseitiger Würfel. Ein einzelner Wurf hat sechs mögliche Ergebnisse und liefert etwa 2,58 Informationsbits. Wenn ein Ereignis nur zwei Ausgänge hätte (wie ein Münzwurf), würde es nur ein Informationsbit liefern. Je mehr mögliche Ergebnisse, desto höher ist die Entropie und desto mehr "Informationen" liefert ein Ergebnis.
Wenn eine Website eine Browser-Eigenschaft sammelt, verringert sie die Unsicherheit (Entropie) darüber, wer Sie sind. Es wird geschätzt, dass etwa 33 Bits Entropie benötigt werden, um eine einzelne Person aus der Weltbevölkerung von 7,5 Milliarden eindeutig zu identifizieren.
Das Panopticlick-Forschungsprojekt liefert ein klares Beispiel dafür, wie verschiedene Browserattribute identifizierende Informationen beitragen.
Beispiel: Identifikationsdaten
| Browser-charakteristische | Bits der identifizierenden Informationen | sind für die Identifikation bedeutsam |
|---|---|---|
| Details zu Browser-Plugins | 9,14 Bit | Ein höherer Wert bedeutet, dass diese Eigenschaft seltener ist und mehr dazu beiträgt, dich einzigartig zu machen. |
| User Agent | 7,68 Bit | Diese Kombination aus Browser und Betriebssystem ist recht ungewöhnlich und verleiht ihr erhebliche Identifizierungskraft. |
| Hash des Leinwandfingerabdrucks | 6,62 Bit | Die Art und Weise, wie dein Gerät Grafiken rendert, ist ein starker Kenner. |
| Systemschriftarten | 6,5 Bit | Die spezifische Liste der Schriftarten auf Ihrem Rechner ist sehr unterscheidbar. |
| Zeitzone | 2,7 Bits | Auch wenn es für sich genommen nicht einzigartig ist, hilft es, die Möglichkeiten erheblich einzugrenzen. |
Im Panopticlick-Test ergab die Kombination dieser und anderer Werte insgesamt mindestens 20,37 Bit identifizierender Informationen, wodurch der Browser unter mehr als 1.357.000 anderen getesteten Exemplaren einzigartig ist. Ein ähnliches Projekt, AmIUnique.org, demonstriert dies ebenfalls, indem es den Nutzern zeigt, wie ihr Browser-Fingerabdruck im Vergleich zu einer großen Datenbank mit anderen abschneidet, wobei sie ihn oft als einzigartig empfinden.
Da wir verstehen, dass Fingerabdrücken eine messbare Wissenschaft zur Reduzierung der Anonymität ist, können wir nun Strategien bewerten, um sich dagegen zu schützen.
Das wichtigste Verteidigungsprinzip für Nutzer ist einfach: Je näher ein Gerät einer allgemeinen oder Standardkonfiguration ist, desto schwieriger ist es, es eindeutig zu identifizieren.
Viele gängige Datenschutz-Tools sind gegen fortgeschrittene Fingerabdruck-Verfahren nicht wirksam.
Eine Studie, die die Effizienz verschiedener Minderungsmaßnahmen analysierte, ergab einen klaren Gewinner.
Weitere potenziell wirksame, wenn auch manchmal unpraktische Maßnahmen sind:
Mit diesen Verteidigungsstrategien im Hinterkopf fassen wir die wichtigsten Punkte aus diesen Notizen zusammen.