Voltar

Compreender a Impressão Digital do Navegador

avatar
22 dez 20254 min de leitura
Compartilhar com
  • Copiar link

Introdução: O que é a impressão digital do navegador?

Embora a maioria dos utilizadores da internet esteja familiarizada com cookies, um método de rastreio muito mais persistente e invisível está a operar na internet. Esta técnica, conhecida como fingerprinting do navegador, pode criar um perfil único seu sem armazenar nada no seu computador, tornando-a essencial para qualquer pessoa preocupada com a privacidade compreender.

Impressões digitais de dispositivos, mais conhecidas como impressões digitais de navegador, são a recolha sistemática de informação a partir de um navegador e dispositivo. O objetivo é combinar estes detalhes para criar um identificador suficientemente único para identificar, rastrear e construir um perfil detalhado do utilizador.

Esta técnica foi desenvolvida como um método de rastreio mais persistente, concebido para ultrapassar medidas de privacidade controladas pelo utilizador, como a eliminação de cookies. Ao contrário dos cookies, que o utilizador pode encontrar e remover, a impressão digital funciona frequentemente de forma transparente, sem armazenar quaisquer ficheiros no dispositivo do utilizador.

As técnicas de impressão digital foram descritas na literatura especializada como "monstros sem bolachas", dado que não é necessário instalar qualquer tipo de cookie no dispositivo para recolher a informação...

Estas "impressões digitais" são construídas combinando várias informações diferentes, que iremos explorar a seguir.

1. O Princípio Fundamental: Construir um Identificador Único

O conceito fundamental por trás da impressão digital do navegador é que, embora qualquer informação sobre o seu dispositivo possa ser comum, a combinação de muitos desses detalhes é provavelmente única. Um site reúne um conjunto destas características, criando efetivamente uma "impressão digital" para o seu navegador.

Aqui estão algumas das características comuns que podem ser recolhidas para formar uma impressão digital básica:

  • Agente de Utilizador: Uma cadeia de texto que identifica o tipo, versão e sistema operativo do seu navegador (por exemplo, Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:58.0) Gecko/20100101 Firefox/58.0).
  • Fontes do Sistema: A lista completa de fontes instaladas no seu dispositivo.
  • Fuso Horário: O fuso horário configurado do seu dispositivo (por exemplo, -120 minutos a partir do UTC).
  • Resolução do Ecrã e Profundidade de Cor: As dimensões exatas e as capacidades de cor do seu ecrã (por exemplo, 1920x1080x24).
  • Plugins de Navegador: A lista de extensões ou complementos instalados no seu navegador, como o Adobe Flash Player ou um visualizador de PDF.

Embora estes pontos de dados básicos possam criar um identificador surpreendentemente único, os rastreadores frequentemente utilizam métodos ainda mais sofisticados para aumentar a precisão.

2. Técnicas Avançadas de Impressão Digital Explicadas

Para criar impressões digitais mais robustas e precisas, os rastreadores utilizam técnicas avançadas que exploram funcionalidades modernas dos navegadores web.

2.1. Impressão Digital da Tela

Esta técnica poderosa utiliza o elemento HTML5 Canvas , uma funcionalidade concebida para desenhar gráficos e animações numa página web. O rastreador instrui o navegador a desenhar uma imagem oculta ou um pedaço de texto. A singularidade vem do facto de diferentes combinações de hardware (como a Unidade de Processamento Gráfico, ou GPU), software (drivers gráficos) e sistemas operativos renderizarem esta imagem de formas subtilmente distintas. A imagem final renderizada é convertida numa assinatura digital única, conhecida como hash, que serve como um identificador altamente estável.

2.2. Impressão Digital da Fonte da Tela

Esta é uma variação especializada da impressão digital em tela. Em vez de desenhar uma única imagem complexa, instrui o navegador a renderizar a mesma cadeia de texto várias vezes, sempre usando uma fonte diferente da lista de fontes instaladas pelo dispositivo. Ao medir as diferenças subtis na forma como cada fonte é desenhada (o seu tamanho, anti-aliasing, etc.), este método pode gerar um identificador altamente específico para a coleção única de fontes do sistema do utilizador.

2.3. Impressões digitais WebRTC

WebRTC (Web Real-Time Communication) é uma API que permite comunicação de voz e vídeo em tempo real diretamente entre navegadores. Um efeito secundário desta funcionalidade é que a API WebRTC pode ser usada para revelar o endereço IP local de um utilizador — o endereço que o seu dispositivo usa numa rede privada (como uma rede Wi-Fi doméstica), que normalmente está oculto. Ao combinar o IP local oculto de um utilizador com o seu IP público, um rastreador pode criar um identificador muito consistente e eficaz, mesmo que o IP público mude.

2.4. Impressão Digital AudioContext

Esta técnica utiliza a AudioContext API, uma ferramenta para processar sinais de áudio dentro do navegador. É importante notar que este método não ouve o microfone do utilizador. Em vez disso, gera uma onda sonora padronizada e inaudível (como uma onda senoidal) e processa-a através da pilha de áudio do navegador. O sinal digital resultante é ligeiramente diferente em cada máquina devido a variações únicas no hardware do dispositivo e nos drivers de software. Um hash deste sinal processado é então usado como identificador único.

Agora que compreendemos como as impressões digitais são criadas, vejamos como a sua singularidade é cientificamente medida.

3. Quantificação da Unicidade com Entropia de Informação

A forma científica de medir a singularidade de uma impressão digital é através da Entropia da Informação. Em termos simples, entropia é uma medida de incerteza, calculada em "bits". Quanto mais "bits de informação identificativa" uma característica fornecer, mais rara ela é e mais ajuda a identificar de forma única um utilizador.

Por exemplo, saber que um utilizador europeu está no Chrome (59% de quota de mercado em maio de 2018) fornece muito pouca informação identificativa (cerca de 1 bit). No entanto, saber que estão a usar o Internet Explorer (4% de quota de mercado) fornece muito mais informação (cerca de 4 bits) porque é muito menos comum. Ao combinar muitas dessas características, o total de bits de entropia pode rapidamente somar para criar um identificador globalmente único.

A tabela seguinte, baseada em dados de um teste Panopticlick, mostra como diferentes características do navegador contribuem com quantidades variadas de informação identificativa.

Exemplo: Bits de Informação Identificativa

de
Características do NavegadorInformação de Identificação
Hash da impressão digital da tela 6.62
Tamanho do Ecrã e Profundidade de Cor 2.45
Detalhes do Plugin do Navegador 9.14
Fuso Horário 2.70
Fontes de Sistema 6.50
Plataforma 3.17
User Agent 7.68

Esta medição da unicidade não é apenas teórica; Tem aplicações e consequências significativas no mundo real.

4. Utilização e Impacto no Mundo Real

Num estudo de 2018, a Agência Espanhola de Proteção de Dados (AEPD) analisou mais de 5.000 URLs para compreender a prevalência destas técnicas. As conclusões foram reveladoras:

  • De todos os pedidos analisados, técnicas avançadas de impressão digital foram detetadas em 28,19%.
  • As técnicas avançadas mais comuns eram:
    • Impressões digitais na tela: 15,3%
    • Impressões digitais WebRTC: 10,1%
    • Impressão Digital da Fonte da Canvas: 1,9%
    • Impressão Digital AudioContext: 0,9%
  • O uso destas técnicas de rastreio revelou-se particularmente elevado em sites relacionados com temas sensíveis, incluindo sexo, pornografia, religião, saúde e política.

O estudo confirmou também a ineficácia do sinal "Não Rastrear" (DNT), uma configuração de navegador que pede aos sites que não rastreiem o utilizador. A investigação concluiu que os sites que utilizavam impressões digitais ignoraram esmagadoramente este pedido. No caso da impressão digital Canvas, impressionantes 96,12% dos sites continuaram a compilar a impressão digital mesmo quando o utilizador ativou explicitamente o DNT. Mais alarmante ainda, o estudo concluiu que o próprio sinal DNT pode ser usado como outro ponto de dados para tornar a impressão digital do utilizador ainda mais única, transformando um pedido de privacidade numa ferramenta de identificação.

Com um problema tão generalizado e persistente, é natural perguntar o que pode ser feito para proteger a privacidade.

5. Defesa contra a impressão digital: o que funciona e o que não funciona

O estudo da AEPD testou várias medidas de mitigação para avaliar quão eficazmente poderiam prevenir a recolha de impressões digitais. Os resultados mostram uma clara diferença entre funcionalidades de privacidade passiva e ferramentas de bloqueio ativo.

Método Como Funciona Eficácia (Baseado em Estudo AEPD)
Modo Privado / Incógnito Apaga o histórico local, cookies e dados do site após o fim da sessão. Não é eficaz. Não altera as características subjacentes do dispositivo, pelo que a impressão digital permanece idêntica.
VPNs / Redes de Anonimização Esconde o endereço IP público do utilizador do servidor de destino. Parcialmente eficaz. Embora ocultem um ponto de dados chave (IP público), não filtram a coleção de outras características do dispositivo.
Opções de Privacidade do Navegador (por exemplo, bloquear cookies de terceiros, ativar DNT) Utiliza definições integradas do navegador para limitar o rastreio. Não é uma redução significativa. O estudo concluiu que estas opções tiveram pouco efeito, exceto por uma redução notável nas deteções de WebRTC.
Extensões de Navegador (bloqueadores como uBlock Origin, Ghostery) Identificar ativamente e bloquear scripts e ligações conhecidas por serem usados para rastreamento. Muito eficaz. Estas ferramentas produziram uma "redução significativa das deteções" em todas as técnicas de impressão digital.
Desabilitando Javascript Impede que os scripts que recolhem dados de impressão digital corram. Eficaz, mas impraticável. Este método quebra a funcionalidade de muitos sites modernos, tornando-se uma solução irrealista para a maioria dos utilizadores.

Estas conclusões conduzem a várias conclusões importantes para quem se preocupa com a sua privacidade digital.

6. Principais Conclusões

  1. Singularidade através da Combinação: O poder da impressão digital reside na sua capacidade de combinar muitos pontos de dados comuns e não únicos (como o tamanho do ecrã e as fontes instaladas) para criar um identificador altamente único. Esta singularidade é cientificamente medida em "bits de entropia de informação."
  2. Omnipresentes e ocultos: Como uma técnica "sem cookies", a impressão digital funciona de forma transparente para o utilizador e é generalizada em toda a web, incluindo em sites que lidam com informações pessoais sensíveis.
  3. O consentimento é frequentemente ignorado: As preferências de privacidade dos utilizadores, nomeadamente o sinal "Não Rastrear", são amplamente ignoradas pelos sites que utilizam estas técnicas avançadas de rastreamento.
  4. Uma defesa eficaz requer ferramentas ativas: Funcionalidades comuns de privacidade, como o Modo Incógnito, são ineficazes contra a impressão digital. O estudo concluiu que as defesas mais eficazes são extensões especializadas de navegador concebidas para bloquear ativamente scripts de rastreamento.
Artigos relacionados