Embora a maioria dos utilizadores da internet esteja familiarizada com cookies, um método de rastreio muito mais persistente e invisível está a operar na internet. Esta técnica, conhecida como fingerprinting do navegador, pode criar um perfil único seu sem armazenar nada no seu computador, tornando-a essencial para qualquer pessoa preocupada com a privacidade compreender.
Impressões digitais de dispositivos, mais conhecidas como impressões digitais de navegador, são a recolha sistemática de informação a partir de um navegador e dispositivo. O objetivo é combinar estes detalhes para criar um identificador suficientemente único para identificar, rastrear e construir um perfil detalhado do utilizador.
Esta técnica foi desenvolvida como um método de rastreio mais persistente, concebido para ultrapassar medidas de privacidade controladas pelo utilizador, como a eliminação de cookies. Ao contrário dos cookies, que o utilizador pode encontrar e remover, a impressão digital funciona frequentemente de forma transparente, sem armazenar quaisquer ficheiros no dispositivo do utilizador.
As técnicas de impressão digital foram descritas na literatura especializada como "monstros sem bolachas", dado que não é necessário instalar qualquer tipo de cookie no dispositivo para recolher a informação...
Estas "impressões digitais" são construídas combinando várias informações diferentes, que iremos explorar a seguir.
O conceito fundamental por trás da impressão digital do navegador é que, embora qualquer informação sobre o seu dispositivo possa ser comum, a combinação de muitos desses detalhes é provavelmente única. Um site reúne um conjunto destas características, criando efetivamente uma "impressão digital" para o seu navegador.
Aqui estão algumas das características comuns que podem ser recolhidas para formar uma impressão digital básica:
Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:58.0) Gecko/20100101 Firefox/58.0).-120 minutos a partir do UTC).1920x1080x24).Embora estes pontos de dados básicos possam criar um identificador surpreendentemente único, os rastreadores frequentemente utilizam métodos ainda mais sofisticados para aumentar a precisão.
Para criar impressões digitais mais robustas e precisas, os rastreadores utilizam técnicas avançadas que exploram funcionalidades modernas dos navegadores web.
Esta técnica poderosa utiliza o elemento HTML5 Canvas , uma funcionalidade concebida para desenhar gráficos e animações numa página web. O rastreador instrui o navegador a desenhar uma imagem oculta ou um pedaço de texto. A singularidade vem do facto de diferentes combinações de hardware (como a Unidade de Processamento Gráfico, ou GPU), software (drivers gráficos) e sistemas operativos renderizarem esta imagem de formas subtilmente distintas. A imagem final renderizada é convertida numa assinatura digital única, conhecida como hash, que serve como um identificador altamente estável.
Esta é uma variação especializada da impressão digital em tela. Em vez de desenhar uma única imagem complexa, instrui o navegador a renderizar a mesma cadeia de texto várias vezes, sempre usando uma fonte diferente da lista de fontes instaladas pelo dispositivo. Ao medir as diferenças subtis na forma como cada fonte é desenhada (o seu tamanho, anti-aliasing, etc.), este método pode gerar um identificador altamente específico para a coleção única de fontes do sistema do utilizador.
WebRTC (Web Real-Time Communication) é uma API que permite comunicação de voz e vídeo em tempo real diretamente entre navegadores. Um efeito secundário desta funcionalidade é que a API WebRTC pode ser usada para revelar o endereço IP local de um utilizador — o endereço que o seu dispositivo usa numa rede privada (como uma rede Wi-Fi doméstica), que normalmente está oculto. Ao combinar o IP local oculto de um utilizador com o seu IP público, um rastreador pode criar um identificador muito consistente e eficaz, mesmo que o IP público mude.
Esta técnica utiliza a AudioContext API, uma ferramenta para processar sinais de áudio dentro do navegador. É importante notar que este método não ouve o microfone do utilizador. Em vez disso, gera uma onda sonora padronizada e inaudível (como uma onda senoidal) e processa-a através da pilha de áudio do navegador. O sinal digital resultante é ligeiramente diferente em cada máquina devido a variações únicas no hardware do dispositivo e nos drivers de software. Um hash deste sinal processado é então usado como identificador único.
Agora que compreendemos como as impressões digitais são criadas, vejamos como a sua singularidade é cientificamente medida.
A forma científica de medir a singularidade de uma impressão digital é através da Entropia da Informação. Em termos simples, entropia é uma medida de incerteza, calculada em "bits". Quanto mais "bits de informação identificativa" uma característica fornecer, mais rara ela é e mais ajuda a identificar de forma única um utilizador.
Por exemplo, saber que um utilizador europeu está no Chrome (59% de quota de mercado em maio de 2018) fornece muito pouca informação identificativa (cerca de 1 bit). No entanto, saber que estão a usar o Internet Explorer (4% de quota de mercado) fornece muito mais informação (cerca de 4 bits) porque é muito menos comum. Ao combinar muitas dessas características, o total de bits de entropia pode rapidamente somar para criar um identificador globalmente único.
A tabela seguinte, baseada em dados de um teste Panopticlick, mostra como diferentes características do navegador contribuem com quantidades variadas de informação identificativa.
Exemplo: Bits de Informação Identificativa
de| Características do Navegador | Informação de Identificação |
|---|---|
| Hash da impressão digital da tela | 6.62 |
| Tamanho do Ecrã e Profundidade de Cor | 2.45 |
| Detalhes do Plugin do Navegador | 9.14 |
| Fuso Horário | 2.70 |
| Fontes de Sistema | 6.50 |
| Plataforma | 3.17 |
| User Agent | 7.68 |
Esta medição da unicidade não é apenas teórica; Tem aplicações e consequências significativas no mundo real.
Num estudo de 2018, a Agência Espanhola de Proteção de Dados (AEPD) analisou mais de 5.000 URLs para compreender a prevalência destas técnicas. As conclusões foram reveladoras:
O estudo confirmou também a ineficácia do sinal "Não Rastrear" (DNT), uma configuração de navegador que pede aos sites que não rastreiem o utilizador. A investigação concluiu que os sites que utilizavam impressões digitais ignoraram esmagadoramente este pedido. No caso da impressão digital Canvas, impressionantes 96,12% dos sites continuaram a compilar a impressão digital mesmo quando o utilizador ativou explicitamente o DNT. Mais alarmante ainda, o estudo concluiu que o próprio sinal DNT pode ser usado como outro ponto de dados para tornar a impressão digital do utilizador ainda mais única, transformando um pedido de privacidade numa ferramenta de identificação.
Com um problema tão generalizado e persistente, é natural perguntar o que pode ser feito para proteger a privacidade.
O estudo da AEPD testou várias medidas de mitigação para avaliar quão eficazmente poderiam prevenir a recolha de impressões digitais. Os resultados mostram uma clara diferença entre funcionalidades de privacidade passiva e ferramentas de bloqueio ativo.
| Método | Como Funciona | Eficácia (Baseado em Estudo AEPD) |
|---|---|---|
| Modo Privado / Incógnito | Apaga o histórico local, cookies e dados do site após o fim da sessão. | Não é eficaz. Não altera as características subjacentes do dispositivo, pelo que a impressão digital permanece idêntica. |
| VPNs / Redes de Anonimização | Esconde o endereço IP público do utilizador do servidor de destino. | Parcialmente eficaz. Embora ocultem um ponto de dados chave (IP público), não filtram a coleção de outras características do dispositivo. |
| Opções de Privacidade do Navegador (por exemplo, bloquear cookies de terceiros, ativar DNT) | Utiliza definições integradas do navegador para limitar o rastreio. | Não é uma redução significativa. O estudo concluiu que estas opções tiveram pouco efeito, exceto por uma redução notável nas deteções de WebRTC. |
| Extensões de Navegador (bloqueadores como uBlock Origin, Ghostery) | Identificar ativamente e bloquear scripts e ligações conhecidas por serem usados para rastreamento. | Muito eficaz. Estas ferramentas produziram uma "redução significativa das deteções" em todas as técnicas de impressão digital. |
| Desabilitando Javascript | Impede que os scripts que recolhem dados de impressão digital corram. | Eficaz, mas impraticável. Este método quebra a funcionalidade de muitos sites modernos, tornando-se uma solução irrealista para a maioria dos utilizadores. |
Estas conclusões conduzem a várias conclusões importantes para quem se preocupa com a sua privacidade digital.