Quay lại

Giới thiệu về lấy dấu vân tay trình duyệt

avatar
22 Th12 20255 Đọc trong giây phút
Chia sẻ với
  • Sao chép liên kết

1. Lấy dấu vân tay trình duyệt là gì?

Lấy dấu vân tay của trình duyệt là việc thu thập thông tin có hệ thống từ một thiết bị từ xa với mục đích xác định và theo dõi duy nhất người dùng của nó. Động lực chính đằng sau kỹ thuật này là kiếm tiền từ dữ liệu người dùng, thường là cho các chiến dịch quảng cáo được cá nhân hóa và lập hồ sơ người dùng.

Không giống như các phương pháp theo dõi truyền thống như cookie, dấu vân tay hoạt động âm thầm và có thể bền bỉ hơn nhiều. Nó đã được mô tả trong tài liệu kỹ thuật là một "con quái vật không có cookie" vì nó không yêu cầu lưu trữ bất kỳ tệp nào trên thiết bị của người dùng và hoàn toàn minh bạch đối với người dùng.

Tính năng Cookie Lấy dấu vân tay trình duyệt
Lưu trữ Lưu trữ các tệp nhỏ trên máy tính của người dùng. Không có tệp nào được lưu trữ trên máy tính của người dùng ("không có cookie").
Khả năng hiển thị và kiểm soát người dùng Người dùng có thể xem, chặn hoặc xóa thông qua cài đặt trình duyệt. Hoạt động minh bạch. Người dùng không có cách trực tiếp để biết nó đang xảy ra hoặc ngăn chặn nó.
Sự kiên trì Người dùng có thể xóa. Rất bền bỉ. Nó thậm chí có thể được sử dụng để khôi phục cookie mà người dùng đã xóa, liên kết lại danh tính của họ.

Bây giờ chúng ta đã hiểu dấu vân tay trình duyệt là gì và tại sao nó bền bỉ hơn cookie, hãy khám phá các kỹ thuật cụ thể được sử dụng để tạo các mã định danh kỹ thuật số duy nhất này.

2. Giải phẫu dấu vân tay kỹ thuật số: Các kỹ thuật chính

Tính độc đáo của dấu vân tay đến từ việc kết hợp nhiều thông tin khác nhau, một số là đặc điểm trình duyệt đơn giản, trong khi những thông tin khác rất tiên tiến và tinh vi.

Nguồn thông tin cốt lõi

Đây là những đặc điểm cơ bản có thể được thu thập thông qua trình duyệt để bắt đầu xây dựng hồ sơ. Mỗi phần thông tin, khi kết hợp với những thông tin khác, giúp thu hẹp danh tính của thiết bị.

  • Tác nhân người dùng: Một chuỗi văn bản xác định trình duyệt, phiên bản và hệ điều hành cơ bản.
  • Danh sách các plugin: Tiết lộ tiện ích mở rộng trình duyệt nào (như Adobe Flash hoặc trình xem PDF) được cài đặt, đây có thể là một sự kết hợp rất độc đáo.
  • Múi giờ: Cho biết vị trí địa lý của thiết bị hoặc cài đặt thời gian đã định cấu hình.
  • Độ phân giải màn hình và độ sâu màu: Cung cấp thông tin chi tiết về phần cứng hiển thị của thiết bị.
  • Phông chữ hệ thống: Danh sách các phông chữ được cài đặt trên hệ điều hành có thể độc đáo một cách đáng ngạc nhiên.

Kỹ thuật lấy dấu vân tay tiên tiến

Các phương pháp này khai thác các công nghệ web hiện đại để trích xuất các chi tiết tinh tế nhưng có tính nhận dạng cao từ thiết bị.

Lấy dấu vân tay canvas

Kỹ thuật này sử dụng phần tử HTML5 Canvas để vẽ hình ảnh hoặc văn bản ẩn. Bởi vì mỗi thiết bị hiển thị nó hơi khác nhau do các biến thể trong card đồ họa, trình điều khiển và hệ điều hành, dữ liệu hình ảnh thu được có thể được chuyển đổi thành một hàm băm (một chuỗi ký tự duy nhất) đóng vai trò như một mã định danh mạnh mẽ.

Dấu vân tay phông chữ Canvas

Một biến thể của dấu vân tay Canvas, phương pháp này tạo hình ảnh của cùng một chuỗi văn bản nhiều lần, mỗi lần có một phông chữ khác nhau từ danh sách được xác định trước. Sự khác biệt về kết xuất tinh tế giữa nhiều loại phông chữ cho phép trích xuất các chỉ số từ hình ảnh được tạo, tạo ra một mã định danh duy nhất cho trình duyệt.

Lấy dấu vân tay WebRTC

Kỹ thuật này sử dụng API WebRTC (một công nghệ giao tiếp thời gian thực) để khám phá địa chỉ IP cục bộ thực sự của thiết bị, ngay cả khi nó nằm sau bộ định tuyến Dịch địa chỉ mạng (NAT). Kết hợp IP cục bộ này với địa chỉ IP công cộng tạo ra một yếu tố nhận dạng rất ổn định và nhất quán.

Lấy dấu vân tay AudioContext

Phương thức này sử dụng API AudioContext để xử lý tín hiệu âm thanh tiêu chuẩn do máy tính tạo ra (như sóng hình sin). Nó không nghe micrô của thiết bị. Tín hiệu âm thanh được xử lý cuối cùng có các biến thể tinh tế do ngăn xếp phần cứng và phần mềm độc đáo của thiết bị. Đầu ra này sau đó được băm để tạo mã định danh duy nhất.

Kỹ thuậtCách thức hoạt động (Đơn giản hóa) Tại sao nó lại hiệu quả để nhận dạng
Vải bạt Vẽ một hình ảnh ẩn và phân tích sự khác biệt hiển thị tinh tế giữa các thiết bị. Các biến thể về phần cứng đồ họa, trình điều khiển và phông chữ làm cho hình ảnh cuối cùng trở nên độc đáo cho một thiết bị.
Phông chữ Canvas Hiển thị cùng một văn bản với nhiều phông chữ khác nhau để đo lường sự không nhất quán của kết xuất. Sự kết hợp cụ thể của các phông chữ đã cài đặt và kết xuất của chúng tạo ra một cấu hình rất độc đáo.
WebRTC Sử dụng API giao tiếp để tiết lộ địa chỉ IP mạng cục bộ của thiết bị. Kết hợp địa chỉ IP cục bộ và địa chỉ IP công cộng có thể xác định duy nhất một thiết bị trên mạng.
Ngữ cảnh âm thanh Xử lý tín hiệu âm thanh tiêu chuẩn để phát hiện sự khác biệt trong ngăn xếp âm thanh của thiết bị. Phần cứng và phần mềm xử lý âm thanh trên mỗi thiết bị tạo ra đầu ra hơi khác nhau.

Trong khi mỗi kỹ thuật này thu thập một mảnh ghép, sức mạnh thực sự của dấu vân tay đến từ việc kết hợp chúng; Phần tiếp theo giải thích cách chúng ta có thể đo lường một cách khoa học sức mạnh nhận dạng đó.

3. Định lượng tính độc đáo với Entropy thông tin

Cách khoa học để đo mức độ nhận dạng duy nhất được cung cấp bởi một phần thông tin được gọi là Entropy thông tin, được đo bằng "bit". Entropy cao hơn có nghĩa là độc đáo hơn.

Một phép so sánh đơn giản là một con xúc xắc sáu mặt. Một cuộn duy nhất có sáu kết quả có thể xảy ra, cung cấp khoảng 2,58 bit thông tin. Nếu một sự kiện chỉ có hai kết quả (như tung đồng xu), nó sẽ chỉ cung cấp 1 bit thông tin. Kết quả càng có thể xảy ra, entropy càng cao và kết quả cung cấp càng nhiều "thông tin".

Khi một trang web thu thập một đặc điểm của trình duyệt, nó làm giảm sự không chắc chắn (entropy) về bạn là ai. Người ta ước tính rằng khoảng 33 bit entropy là cần thiết để xác định duy nhất một người trong dân số toàn cầu 7,5 tỷ người.

Dự án nghiên cứu Panopticlick cung cấp một ví dụ rõ ràng về cách các thuộc tính trình duyệt khác nhau đóng góp các bit thông tin nhận dạng.

Ví dụ: Bit thông tin nhận dạng

Đặc Các quan
điểm của trình duyệtbit nhận dạng thông tintrọng đối với nhận dạng
Chi tiết plugin trình duyệt 9,14 bit Giá trị cao hơn có nghĩa là đặc điểm này hiếm hơn và góp phần nhiều hơn vào việc làm cho bạn trở nên độc đáo.
Tác nhân người dùng 7,68 bit Sự kết hợp giữa trình duyệt và hệ điều hành này khá hiếm gặp, bổ sung sức mạnh nhận dạng đáng kể.
Hàm băm của dấu vân tay canvas 6,62 bit Cách thiết bị của bạn hiển thị đồ họa là một mã định danh mạnh mẽ.
Phông chữ hệ thống 6.5 bit Danh sách cụ thể các phông chữ trên máy của bạn rất khác biệt.
Múi giờ 2.7 bit Mặc dù bản thân nó không phải là duy nhất, nhưng nó giúp thu hẹp đáng kể các khả năng.

Trong thử nghiệm Panopticlick, sự kết hợp của các giá trị này và các giá trị khác dẫn đến tổng cộng ít nhất 20,37 bit thông tin nhận dạng, làm cho trình duyệt trở nên độc đáo trong số hơn 1.357.000 giá trị khác được thử nghiệm. Một dự án tương tự, AmIUnique.org, cũng chứng minh điều này bằng cách cho người dùng thấy dấu vân tay trình duyệt của họ so với cơ sở dữ liệu lớn của những người khác, thường thấy nó là duy nhất.

Hiểu rằng lấy dấu vân tay là một khoa học có thể đo lường được để giảm ẩn danh, giờ đây chúng ta có thể đánh giá các chiến lược để bảo vệ chống lại nó.

4. Chiến lược phòng thủ và giảm thiểu

Nguyên tắc bảo vệ quan trọng nhất đối với người dùng rất đơn giản: Thiết bị càng gần với cấu hình chung hoặc cấu hình mặc định, thì càng khó xác định duy nhất.

Các biện pháp phổ biến nhưng không hiệu quả

Nhiều công cụ bảo mật phổ biến không hiệu quả chống lại dấu vân tay nâng cao.

  • Duyệt web riêng tư hoặc ẩn danh: Chế độ này chỉ ngăn trình duyệt lưu dữ liệu cục bộ như lịch sử, cookie và thông tin biểu mẫu cho phiên đó. Nó không thay đổi các đặc điểm cơ bản của trình duyệt (như phông chữ hoặc kết xuất đồ họa) và do đó minh bạch đối với các tập lệnh lấy dấu vân tay. Nó cung cấp một cảm giác an toàn sai lầm.
  • Sử dụng VPN hoặc mạng ẩn danh: Mặc dù các công cụ này ẩn địa chỉ IP công cộng của bạn một cách hiệu quả, nhưng chúng không ngăn máy chủ thu thập tất cả các đặc điểm khác của thiết bị và trình duyệt tạo nên dấu vân tay.

Các biện pháp hiệu quả hơn

Một nghiên cứu phân tích hiệu quả của các biện pháp giảm thiểu khác nhau đã tìm thấy một người chiến thắng rõ ràng.

  • Tiện ích mở rộng trình duyệt (Trình chặn): Nghiên cứu kết luận rằng các tiện ích mở rộng trình duyệt tăng cường quyền riêng tư hiệu quả hơn đáng kể trong việc giảm dấu vân tay so với cài đặt quyền riêng tư tích hợp của trình duyệt (như Không theo dõi hoặc chặn cookie của bên thứ ba). Các tiện ích mở rộng này hoạt động bằng cách chặn các tập lệnh theo dõi chạy ngay từ đầu. Ví dụ, nghiên cứu cho thấy các cài đặt trình duyệt như "Không theo dõi" (DNT) phần lớn bị bỏ qua; trong trường hợp lấy dấu vân tay Canvas, hơn 96% các trang web phát hiện yêu cầu DNT đang hoạt động vẫn tiến hành lấy dấu vân tay, trực tiếp bỏ qua sở thích được thể hiện của người dùng.
  • Nghiên cứu nhấn mạnh GhosteryuBlock Origin là những công cụ chặn đặc biệt hiệu quả.

Các biện pháp có khả năng hiệu quả khác, mặc dù đôi khi không thực tế, bao gồm:

  • Vô hiệu hóa hoàn toàn JavaScript (có thể làm hỏng nhiều trang web).
  • Sử dụng trình duyệt TOR, được thiết kế để chuẩn hóa cấu hình người dùng để làm cho chúng ít độc đáo hơn.
  • Đối với người dùng nâng cao, truy cập internet thông qua các máy ảo với các cấu hình khác nhau.

Với những chiến lược phòng thủ này, chúng ta hãy tóm tắt những điểm quan trọng nhất từ những ghi chú này.

5. Bài học chính

  1. Lấy dấu vân tay của trình duyệt là một phương pháp theo dõi thụ động, mạnh mẽ. Nó hoạt động mà không cần cookie bằng cách thu thập chi tiết cấu hình duy nhất của thiết bị. Bởi vì nó vô hình đối với người dùng và không thể dễ dàng xóa nên nó dai dẳng hơn và khó chặn hơn so với cookie truyền thống.
  2. Tính độc đáo được xây dựng bằng sự kết hợp và được đo lường bằng entropy. Dấu vân tay được tạo bằng cách kết hợp hàng chục điểm dữ liệu, từ những điểm đơn giản như độ phân giải màn hình đến những điểm nâng cao như kết xuất Canvas. Tính độc đáo này được đo lường một cách khoa học bằng "các bit entropy thông tin".
  3. Các công cụ bảo mật tiêu chuẩn là không đủ; các công cụ chặn là biện pháp phòng thủ tốt nhất. Các công cụ phổ biến như Chế độ ẩn danh và VPN cung cấp rất ít khả năng bảo vệ chống lại dấu vân tay. Cách bảo vệ hiệu quả nhất cho người dùng điển hình là cài đặt một tiện ích mở rộng trình duyệt có uy tín (như uBlock Origin hoặc Ghostery) chủ động chặn các tập lệnh theo dõi chịu trách nhiệm thu thập dấu vân tay.
Bài viết liên quan