在网上,你从未“孤独”。有人正躲在阴暗的角落,记录着你的一切行踪…

  硅星人的读者朋友可能记得,我们写过几篇科技“打黑”类的文章,比如

  《深扒福布斯中国30under30精英“掺水”榜》

  《科技以换壳为本的“自主国产”浏览器》

  《骗人的硅谷榨汁机在中国复活》

  等等。

  距离上一篇,已经过去了两个月,大家是不是又想看了?

  不多废话,今天再给大家分享一个科技行业小黑幕。(正好今天12月4日是国际饼干节,这个黑幕正好跟 cookie 有关……)

  这件事相信已经存在很久了,但是我是昨天看一个国外的技术博客时发现的:

  为了实现全局屏蔽广告,波兰籍数据分析专家米哈尔·库亚克 (Michał Ćwiok) 在家里装了一个名叫 Pi-Hole 的开源软件。

  Pi-Hole 能安装在树莓派电脑上,变成一个 DNS 服务器。简单来说,它能把所有广告路由到一个不存在的地方,也能屏蔽追踪请求。结果就是,在网络下的所有设备,无论是在网页还是 app 里,都再也看不到广告,个性化推荐也越来越少。

  简单介绍以下追踪 (tracking),就是网站会在用户本地保存一个 cookie 文件,在里面写入一些关键的信息,比如登录用户名、购物车之类的,方便下次访问时调取使用。同时,追踪也可以用于绘制用户画像,进行广告推荐。

  库亚克打开了 Windows 10 电脑,用系统自带的 Edge 浏览器看了几条帖子和几条新闻,过程中访问的都是波兰当地知名的新闻门户、电视台网站,以及 Facebook (facebook.com) 之类的。

  得到的结果,让从事科技行业的他也感到有点诧异。

  首先,在过去的20分钟里,Edge 浏览器一共发起了1232个请求,基本上每秒一个请求,而他一共只打开了十来个网页……

  红色是被屏蔽掉的请求,发生的时间以及域名

  这没什么,接下来才是真的奇葩:

  在总共1232个请求当中,有798个是广告和追踪请求。

  因为开着 Pi-Hole,这798个请求已经被屏蔽掉了,上网过程中没有感受到任何异样,网页都能正常打开,该有内容都能看到。

  798/1232=0.647。也就是说,那么在这20分钟里,广告和追踪占据了他上网全部流量当中的大约64%。

  最后他得到了一个细思极恐的结果:

  作为一个拥有正常上网习惯的典型网民,上网过程中使用的流量,有大约64%,至少一大半的流量,都浪费在了广告和追踪上……

  他把数据可视化做成了一个透视表,更令人触目惊心:

  横轴是时间段落,纵轴是每一分钟内发出的请求总数,黄色是正常请求,蓝色是被屏蔽掉的广告追踪类请求。

  最恐怖的发生在分钟47上:当时库亚克打开了新闻门户 wp.pl,在那一分钟里,蜂拥而至的广告和追踪请求占到了全部请求当中的95%。

  如果你也从事科技行业,可能对这种广告追踪满天飞的情况并不陌生。

  可是对于普通网友来说,64%这个数据未免也太可怕了!

  如果能去掉这一大半(对于用户而言的)无用请求,大家的上网流量得省多少啊!

  月初:

  月底:

  接下来问题来了。

  这些看得见或者压根看不见还没有用的流量,到底都去了哪儿呢?

  库亚克把这次实验的数据发布在了自己的博客上,有兴趣的读者朋友可以前往,看看更多数据: