首页 > 其他分享 >什么是浏览器指纹?

什么是浏览器指纹?

时间:2022-11-30 10:37:07浏览次数:72  
标签:Canvas 浏览器 音频 用户 指纹 生成 什么

https://zhuanlan.zhihu.com/p/282922459

一、什么是浏览器指纹?

我们常说的指纹,都是指人们手指上的指纹,因具有唯一性,所以可以被用来标识一个人的唯一身份。而浏览器指纹是指仅通过浏览器的各种信息,如CPU核心数、显卡信息、系统字体、屏幕分辨率、浏览器插件等组合成的一个字符串,就能近乎绝对定位一个用户,就算使用浏览器的隐私窗口模式,也无法避免。

这是一个被动的识别方式。也就是说,理论上你访问了某一个网站,那么这个网站就能识别到你,虽然不知道你是谁,但你有一个唯一的指纹,将来无论是广告投放、精准推送、安全防范,还是其他一些关于隐私的事情,都非常方便。

二、实现浏览器指纹的技术点有哪些?

1、基本指纹

浏览器基本指纹是任何浏览器都具有的特征标识,比如屏幕分辨率、硬件类型、操作系统、用户代理(User agent)、系统字体、语言、浏览器插件 、浏览器扩展、浏览器设置 、时区差等众多信息,这些指纹信息“类似”人类的身高、年龄等,有很大的冲突概率,只能作为辅助识别。可以在该网址进行查看本地浏览器的基本特征,https://www.whatismybrowser.com/

2、高级指纹

浏览器高级指纹与基本指纹的区别是,基本指纹就像是人的外貌特征,外貌可以用男女、身高、体重区分,然而这些特征不能对某个人进行唯一性标识,仅使用基本指纹也无法对客户端进行唯一性判定,基于HTML5的诸多高级功能就能生成高级指纹了。

1)、Canvas指纹

说到高级指纹,不得不提Canvas指纹,Canvas(画布)是HTML5中一种动态绘图的标签,可以使用其生成甚至处理高级图片。

Canvas指纹的原理大致如下:

相同的HTMLCanvasElement元素绘制操作,在不同操作系统、不同浏览器上,产生的图片内容不完全相同。在图片格式上,不同浏览器使用了不同的图形处理引擎、不同的图片导出选项、不同的默认压缩级别等。在像素级别来看,操作系统各自使用了不同的设置和算法来进行抗锯齿和子像素渲染操作。即使相同的绘图操作,产生的图片数据的CRC检验也不相同。Canvas几乎已被所有主流浏览器支持,可以通过大部分的PC、平板、智能手机访问。

在线测试地址:https://www.browserleaks.com/canvas,可查看浏览器的Canvas唯一性字符串。

2)、WebGL指纹

通过HTMLCanvasElement元素可以获取到Webgl对象(canvas.getContext("webgl")),通过此对象可以获取到用户的硬件信息,比如显卡名称、显卡型号、显卡制造商等,比如:ANGLE (NVIDIA GeForce GTX 1050 Ti Direct3D11 vs_5_0 ps_5_0),Google Inc.。

由于硬件一般是不会随意更换的,有些是电脑买来到电脑报废就没更换过硬件,电脑硬件种类也比较多,虽然非常大的碰撞率,但是依然可以被用来当做用户指纹的一部分,收集用户的信息也多,就越能代表用户的唯一指纹,这点不可忽视。

3)、AudioContext指纹

HTML5提供给JavaScript编程用的Audio API则让开发者有能力在代码中直接操作原始的音频流数据,对其进行任意生成、加工、再造,诸如提高音色,改变音调,音频分割等多种操作,甚至可称为网页版的Adobe Audition。

AudioContext指纹原理大致如下:

方法一:生成音频信息流(三角波),对其进行FFT变换,计算SHA值作为指纹。

方法二:生成音频信息流(正弦波),进行动态压缩处理,计算MD5值。

两种方法都是在音频输出到音频设备之前进行清除,用户根本就毫无察觉就被获取了指纹。

AudioContext指纹基本原理:

主机或浏览器硬件或软件的细微差别,导致音频信号的处理上的差异,相同器上的同款浏览器产生相同的音频输出,不同机器或不同浏览器产生的音频输出会存在差异。

从上可以看出AudioContext和Canvas指纹原理很类似,都是利用硬件或软件的差异,前者生成音频,后者生成图片,然后计算得到不同哈希值来作为标识。音频指纹测试地址:https://audiofingerprint.openwpm.com/


4)、WebRTC指纹

WebRTC(网页实时通信,Web Real Time Communication),是可以让浏览器有音视频实时通信的能力,它提供了三个主要的API来让JS可以实时获取和交换音视频数据,MediaStream、RTCPeerConnection和RTCDataChannel。当然如果要使用WebRTC获得通信能力,用户的真实ip就得暴露出来(NAT穿透),所以RTCPeerConnection就提供了这样的API,直接使用JS就可以拿到用户的IP地址。用户的内网IP地址也是大多数情况下不会改变,所以也是可以用来当做用户指纹的其中一个因子。

3、综合指纹

上面几点都说了浏览器指纹大致有哪些,还没有完全说完,只是一部分,但是零散的指纹信息并不能真正的定位到唯一用户,并不能用来代表一个用户的唯一身份(用户指纹)。

综合指纹是指将所有的用户浏览器信息组合起来,就可以近乎99%以上的准确率定位标识用户,综合指纹大致有如下:

1)、基本指纹(UserAgent、屏幕分辨率、CPU核心数、内存大小、插件信息、语言等)

2)、高级指纹部分(Canvas指纹、Webgl指纹、AudioContext指纹、WebRTC指纹、字体指纹等)

3)、地理位置、时区、DNS、SSL证书等信息。

将以上几点组合起来就可以生成综合指纹(用户指纹),就可以达到前面说的99%以上可以定位唯一用户。

4、如何防止被生成“用户指纹”?

前面我们说了一大堆网站如何使用各种技术来“生成”用户指纹,来标识唯一用户,那么下面我们来说说,如何避免被网站“生成”唯一用户指纹。

常用的手段是,通过浏览器的扩展插件,阻止网站获取各种信息,或者返回个假的数据,这种方式是在网页加载前就执行一段JS代码,更改、重写、HOOK了js的各个函数来实现的,因为JS的灵活性给这种方式提供的可能。但是这种方式始终是表层的,使用JS修改是能防止大部分网站的生成唯一指纹,但是是有手段可以检测出来是否“作弊”的。

更好的手段是从浏览器底层做处理,从浏览器底层修改API使得这些在js层获取的信息并不唯一,不管如何组合都不能生成一个唯一的代表用户的指纹。比如:猫头鹰浏览器

猫头鹰浏览器是基于chromium代码修改编译的浏览器,从底层对各种API做了修改,可以交给用户自定义返回各种数据,比如Canvas、Webgl、AudioContext、WebRTC、字体、UserAgent、屏幕分辨率、CPU核心数、内存大小、插件信息、语言等信息,这样就可以完全避免被“生成”唯一用户指纹了。

5、常用检测网站

1、BrowserLeaks - Web Browser Fingerprinting - Browsing Privacy

2、浏览器环境校验

3、AmIUnique

标签:Canvas,浏览器,音频,用户,指纹,生成,什么
From: https://www.cnblogs.com/bluestorm/p/16937646.html

相关文章

  • 颠覆我认知的 select id,为什么?
    表z:id是主键自增,b列单列做了索引,c为普通字段(其实换成其他任何带主键的表也有该问题)CREATETABLE`z`(`id`intNOTNULLAUTO_INCREMENT,`b`intDEFAULTNULL,......
  • 感觉VS Code好难用啊,配置什么的好烦呀!!!
    为什么微软要把VSCode配置做的这么复杂,难道就没有简化方案吗?-知乎(zhihu.com) 因为VSCode不是(传统)IDE。你要把VSCode看做新时代的emacs,其IDE的部分的......
  • 为什么要实现Serializable
     工作中我们经常在进行持久化操作和返回数据时都会使用到javabean来统一封装参数,方便操作,一般我们也都会实现Serializable接口,那么问题来了,首先:为什么要进行序列化;......
  • Git到底是什么?它有哪些功能?
    Git是一个免费的、开源的分布式版本控制系统,可以用于记录一个或者若干个文件内容的变化,方便查阅或者修改。Git官网:​​https://git-scm.com/​​1、常见的版本控制系统1.1、......
  • 为什么越来越多的程序员开始学机器学习的原因
    越来越多的程序员开始学习机器学习了,看了本文,也许解释了为什么?一、前言程序员容易掉头发,而且,头发的多少似乎跟能力成反比:1、PHPPHP之父,RasmusLerdorf2、JavaJava之父,James......
  • NoSQL开篇——为什么要使用NoSQL
    NoSQL开篇——为什么要使用NoSQL作者​​孙立​​发布于2011年1月13日​​架构​​,​​Java​​,​​.NET​​,​​Ruby​​......
  • 什么是自签名证书?以及如何创建它
    自签名SSL证书是一种数字证书,未经公开信任的​​证书颁发机构(CA)​​签名。自签名证书被认为不同于传统的CA签名证书,因为它们是由负责与证书关联的网站或软件的公司......
  • 什么是web3?
    Web3简介中心化网络已经帮助数十亿人融入了互联网,并在其上创建了稳定、可靠的基础设施。与此同时,少数中心化巨头几乎垄断了互联网,甚至可以为所欲为。Web3是摆脱由中心化......
  • 什么是区块链?
    上一讲,我们讲到了WEB3的定义以及互联网从WEB1、WEB2、到WEB3的变迁,课程中,对WEB3的描述里,有一个重要的概念,就是区块链技术,可以说,如果没有区块链技术,也就不会有WEB3。区块链技......
  • 【面试】如果你这样回答“什么是线程安全”,面试官都会对你刮目相看
    有读者跟我说,喜欢看我的文章,说很容易读,我确实在易读性上花费的心思不亚于在内容上。因为我不喜欢一上来就堆很多东西,而且把简单的东西搞得复杂人人都会,但是把复杂的东西讲......