乐读窝

我知道你是谁,我知道你做过什么

乐读窝 > 哲学心理 > 我知道你是谁,我知道你做过什么

第二章 当乔治·奥威尔遇见马克·扎克伯格 17

书籍名:《我知道你是谁,我知道你做过什么》    作者:洛丽.安德鲁斯



一个星期天的上午,我打开我的笔记本电脑,写了份备忘录给我的协理律师,我们正在考虑起诉一家生物技术公司,这是一起公益案件。我将备忘录作为附件贴在电子邮件里发给他,小心翼翼地在主题栏中写下“机密—合法邮件”几个字,并在电子邮件正文中说了几个关键的想法。然后我登录西南航空的网站,输入我的信用卡信息,准备买一张去佛罗里达州的机票。我进入由佛罗里达州鱼类和野生动物保护委员会(Florida  Fish  and  Wildlife  Con-servation  Commission)运营的官方网站,输入社会保险号码以获取一张钓鱼证。我意识到我将不能陪我妹妹过生日,于是打算从亚马逊上给她买几本书。我查看电子邮件,而后点击链接进入了一个列有大学教授岗位空缺的网站。其中一个岗位是在一个我没有听过的小镇上,所以我去Google搜索这个小镇,看它会不会太偏。跟着这个小镇的名字后面又出现了一篇文章的链接,这篇文章的内容是关于一起下毒事件的,于是我把它存到我的硬盘里,想着将来我再写悬疑小说的时候可能会用到。我阅读了一封我的医生写给我的电子邮件,她在电子邮件里告诉我她修改了我的电子处方,新药品已到达附近的便利店,我去取就可以了。出门取药前,我登录Facebook和我在佛罗里达州的朋友联系,告诉他们我将过去;并看了一些资讯,还在那里赞了我前一天晚上看的电影;有人圈了我几年前拍的一张万圣节照片,那时我还在耶鲁上大学。照片里我穿着跳肚皮舞的服装,身边的人穿得则像一瓶纯麦芽苏格兰威士忌。我解除了被圈的状态,因为我可不想在应聘工作时,有人对我说:“鲁思·巴德·金斯伯格(Ruth  Bader  Ginsburg,美国最高法院大法官)是从来不会把肚脐眼露在外面的。”

整体来说,这一上午在互联网上逛荡,安全方面我自己感觉良好。我没有回应任何寡妇富婆们为5000亿美元地产向我申请的法律援助,也没搭理来自朋友的那些处心积虑冒充的电子邮件,电子邮件里的“他们”不是在伦敦丢了钱包就是丢了护照。我也没有把信用卡信息透露给任何人,尽管那些粗陋的外国电子邮件用30美元买一个iPad的好事来诱惑我,更没有打开那封说我电子邮箱已爆满的电子邮件。我只去了我信任的网站。

尽管如此,我的每一个动作都神不知鬼不觉地被记录了下来,并有数据整合商对它们进行分析,然后将整理好的信息卖给一些公司,其中很可能就包括我正想要起诉的那家。对于这一侵犯隐私和安全的行为,我不但被蒙在鼓里,还完全束手无策。

在离线的现实世界中,发生这种事情简直不可思议。我每次输入信息时都特别谨慎,工作时从不将社会保险卡或信用卡放在桌面上或其他可能被人记下来的地方,也不会把这类信息写在明信片上邮寄出去;我更不会向全世界大肆宣扬我的医疗状况,或是我要换工作的想法。然而,我的这些信息却在被一些与数据整合商打交道的公司日常性地买进卖出。

如果是有人闯进我家把我的文件拷贝走了,那么这个人就犯下了私闯民宅和侵犯他人隐私的罪行;如果警察想要窃听我的谈话内容,他也需要获得授权许可。然而,在我们不知情和未同意的情况下,我们在社交网络或其他网站上的每次登录都被人暗地里跟踪和审视。信息同样敏感,危害同样真实,但受到的法律保护却不一样。

隐私信息被嚣张盗取的背后有一股导向力,那就是行为定向广告。秘密收集个人信息已成为一个爆炸式发展的行业,在点燃这颗炸弹的过程中,广告商对喜好、欲望等私人信息的贪求发挥了不可替代的作用。美国联邦贸易委员会(FTC)说:“在线行为定向广告追踪客户的在线活动,从而为他们量身定制广告。这种不为客户所见的做法使商业广告更易击中受众的兴趣点。”  [1]  但是,这样不受管制地收集人们的个人信息已经通过某些方式为人们招致了危害。

2010年,85%的广告公司使用了行为定向广告。  [2]  这些广告公司之所以对行为定向广告趋之若鹜,是因为它确实行之有效——63%的广告公司表示靠行为定位广告提高了总收入,30%的公司表示行为定向广告让其总收入增加了500万美元甚至更多。2010年,美国互联网广告收入比报纸的广告收入多出了32亿美元。  [3]  2010年第一季度,美国互联网用户收到的广告总数为1.1万亿个,广告赞助商的成本为27亿美元。  [4]

“它就好比一个打了鸡血的数字信息真空吸尘器,是在线广告产业的产物。”数字民主中心(Center  for  Digital  Democracy)的执行董事杰夫·切斯特(Jeff  Chester)这样对《纽约时报》(The  New  York  Times)说,“鼠标在网页上的所到之处都在他们的追踪范围内,包括你往购物车里放进了什么物品,不购买什么物品。这是一个非常高科技的商业监控系统。”  [5]

Facebook便是通过数据整合来发财致富的,它稳坐聚集了财富的信息山。据测算,Facebook的市值在2012年8月就已经达到了1000亿美元。  [6]  该公司目前正在通过充当广告商和用户个人信息数据库的中间人角色来创收,它会根据我的个人状况、喜好以及我在发帖中透露的最新旅行计划等信息来更新我的数字档案。当一家航空公司或是一家户外装备公司向Facebook付费投放针对成年旅行者的广告时,Facebook就会用到我的个人信息,把它们的广告投放在我的页面上。将我的私人信息商业化——尽管这些信息我原本只是对朋友公开的——就是Facebook在2010年能从广告投放上赚到18.6亿美元的原因。这笔收入占其总收入的90%,并且下一年的广告创收有望达到40.5亿美元。  [7]

Facebook将其用户的个人基本信息、兴趣爱好、喜好、朋友、经常访问的网站甚至联系方式作为其广告平台的根基。据媒体活动家兼博客网站Bo-ing-Boing的合作编辑科里·多克托罗(Cory  Doctorow)所说,Facebook还借助“一个很强大的、类似游戏的公开有奖机制”来鼓励用户公开更多有关自己的信息。  [8]  多克托罗将Facebook的机制比作心理学实验中著名的斯金纳箱  18  ,  [9]  但箱子里不再是一只小白鼠向前压一下杠杆就被奖励一团食物,而是Facebook用户每发布一条信息,就能从朋友和家人那里获得“赞”和关注。

“Facebook之所以这样做,并不是因为它认为公开信息必然有利于你,”多克托罗说,“而是在践行一种利用我们社会生活的宝贵资料来交易谋利的商业模式。”

尽管如此,Facebook还没有把收集和营销私人信息这件事的阴险性和盈利性发挥到极致,马克·扎克伯格的这一智慧结晶仅占有行为定向广告市场的14.6%。与其他广告商的伎俩相比,扎克伯格所做的似乎还是很温和的。那个周日上午,我在互联网上的一举一动都有某个潜在的数据整合商在通过这样或那样的方式进行捕捉。在加利福尼亚州,消费者起诉了NebuAd公司。该公司与26家互联网服务提供商签署了协议,其中包括Delaware's  Cable  One、New  York's  Bresnan  Communications和Texas's  CenturyTel等,在未征求网络用户意见的情况下,NebuAd自行将其硬件安装在了这些互联网服务提供商所提供的网络上。  [10]  借助这个硬件,NebuAd能运用深度包检测(DPI)技术——这是截取和复制网络用户所传送的数据并将其发送到NebuAd总部的一种机制。  [11]  其他数据整合商的做法也如出一辙。

你发布到社交网络或其他网站上的任何信息都在被人消化、分析和资本化。从本质上说,他们正在从你在互联网上披露的点点滴滴的琐碎信息中创建第二个你——即对你的虚拟解释。很快,这个被歪曲了的形象会决定你越来越多的事情,比如你是否能办按揭,是否可以换肾,是否可以拥有爱人,是否可以找到工作。所有这些事情与其说是根据真实的你来决定,还不如说是由你在数字世界里所表现出来的另一面所决定的。

20世纪60年代晚期,社会学家约翰·麦克奈特(John  McKnight)——后来他担任了美国民权委员会(the  U.S.Commission  on  Civil  Rights)中西部办公室主任——造了一个词叫“红线标示(redlining)”,  [12]  用来描述银行、超市、保险公司或其他机构无法为市内居民区提供服务的状态。  [13]  这一术语来自银行,因为它们会在地图上用红线来标明哪些地方不宜投资。  [14]  随后这一术语的使用扩展到了各种带有种族歧视的业务中,比如不为非裔美国人提供房屋贷款,不管他们多富有或处于中产阶级。

如今,红线标示的不再是一张地理上的地图,而是你在网络世界的旅行图。我们可以用“网络分隔(weblining)”这个新词,来概括基于所观察到的数字信息而拒绝为人们提供某些机会的行为。有时候“红线标示”和“网络分隔”会相互重叠,比如社交网络或其他网站会根据某人某次在线购物泄漏的邮政编码来限制某人获得某个机会,或向他收取更高的利率。

“所有这些做法都带有一种微妙的反民主意味,”纽约大学社会学家马歇尔·布隆斯基(Marshall  Blonsky)说,“如果我被网络分隔为一个无利可图的人,我便永远也无法获得我想要的那些商品和服务——或者说经济机会——而网上的其他人却可以。”  [15]

数据整合是个大产业,产业巨兽安客诚(Acxiom)  19  公司已收集了你从社会保险号码到上网习惯的各种详细信息。  [16]  该公司的前CEO约翰·迈耶(John  Meyer)把它描述为“你所听说过的最大的公司”。  [17]  还有一家名为Ra-pleaf的数据整合商,集包括用户名和社交网络在内的在线数据与公共档案中的离线数据于一身。  [18]  它的竞争对手ChoicePoint合并了70多家小型数据整合商,并将个人信用档案、机动车驾驶记录、警察备案、财产清单、出生或死亡证明、婚姻证明等资料制成文件夹,出售给客户。  [19]  但ChoicePoint的保密工作做得还不到位。2005年,身份信息窃取者在冒充小型企业向ChoicePoint提交申请后,便得以潜入其数据库,该数据库当时存放了16.3万客户的财务报告。  [20]  美国联邦贸易委员会将此安全漏洞归因为缺少恰当的安全操作程序,在经过一番协商之后,美国联邦贸易委员会要求ChoicePoint设立综合全面的信息安全程序,支付1000万美元的民事罚款,并对受害客户支付500万美元的赔偿金。  [21]  同年,律商联讯(LexisNexis,世界著名的数据整合商,后来用41亿美元现金收购了ChoicePoint)集团也遭遇安全漏洞,导致31万客户的个人信息被盗。  [22]

“网络分隔”的触角比传统的“红线标示”伸得更远。有时,数据整合商给出的信息会导致人们的信用卡额度被冷不丁地降低,即便持卡人什么也没做。比如,身为公寓业主和商人的凯文·约翰逊(Kevin  Johnson)持有一张最高额度为10800美元的美国运通卡。但当他度完蜜月回来后,他发现该信用卡的额度被降到3800美元了。之所以会发生这种变化并不是因为凯文有什么不当行为,而是数据整合商在作祟。他收到了运通公司的一封来信,信中说:“在你最近购物的场所里使用运通卡的其他客户有不良还款记录。”  [23]

“网络分隔”不仅(通过广告、折扣和信用限额等形式)影响着你的机遇和处境,还会决定你接收到怎样的信息。在你打开雅虎或其他新闻网站时,展现在你眼前的会是一系列个性化的文章,而在相同网址下,你的配偶或邻居看到的则又是另外一些个性化的文章。这听起来不错,但从全局来看,吃亏的可能还是你。翻一翻实体版的《纽约时报》,你至少还能从标题上粗略地了解到世界上正在发生什么,即便你只是在寻找影评部分的过程中对其他内容一扫而过。而在互联网上,一旦你流露出了某个兴趣倾向,你的浏览器里可能就只有和这个兴趣有关的内容,新闻资讯完全被挤掉了。自从我上次点开了一个有关皇室婚礼的故事以后,每次登录电子邮箱后收到的邮件话题都离不开名人恋情和时尚,而之前有关国际新闻资讯的邮件话题就不再有了。假如我们大家的阅读面都狭窄且互不交叉,那又如何能一起参与民主事业呢?

“最终,只有在公民的思想能够超越个人兴趣的情况下,民主才能起作用。但要做到这样,我们对所栖身的这个世界需要有一种共同的认识。”伊莱·帕里泽(Eli  Pariser)在他的新书《搜索引擎没告诉你的事》(The  Filter  Bubble:What  the  Internet  Is  Hiding  from  You)中写道。帕里泽解释说,互联网最初就像是一个理想的民主工具,但现在,“个性化已经让它变得面目全非:公共领域被种种算法处理和分类,被有意的设计弄得四分五裂,不再适用于对话”。  [24]

大多数人都不知道别人从社交网络和其他网站上秘密收集了多少有关自己的信息。在2010年的一次研究中,当被问及行为定向广告时,只有一半的参与者觉得它是一件正常的事情。  [25]  其中一位回答者说:“行为定向广告听起来就像我某个患有偏执症的朋友所做的梦一样,不像是会发生在现实生活中的事情。”

人们总是误信网络会保护他们的隐私。一项消费者调查报告发现,“61%的美国人相信他们在网上的活动是私密的,未经允许不会被分享”,“57%的人错误地相信,公司在获得私密信息前必须先证明自己的身份,并且有义务说明为什么要收集他们的信息,以及是否会透露给其他组织”。  [26]

当人们意识到网站和广告公司在广泛收集他们的信息时,很多人想要看到法律作出改变。一项电话调查显示,66%的美国成人反对成为行为定向广告的目标,并被推送行为定向广告的科技所困扰。  [27]  同样,也有68%的美国人反对上网时被“跟踪”,70%的人觉得应该对未经许可就收集或使用他人数据的公司处以重金罚款。大多数人(92%)认为,在必要的情况下,应该要求网站和广告公司删除已存储的个人信息。

你能否保护自己的数据不被收集,很大程度上取决于公司获得信息的技术。通过某些方法,公司可以使用你自己的电脑来对付你,它们会让你的网页浏览器存下你的电脑硬盘信息,数据整合商由此跟踪你的在线活动,并为你的在线行为建立档案,再通过其他方法在你往网页或电子邮箱发送信息时获得你的信息。(见本章末“表2-1网络跟踪表”。)

网站和社交网络竭尽所能采集数据:社交网络通常会问你是否要保存密码,亚马逊之类的网站也开始跟踪你在该网站上的购买记录,并据此为你推荐商品,在你日后登录该网站时,还为你提供不用再次输入登录密码或信用卡号码的便捷服务。如今,诸如cookie  20  、Flash  cookie  21  、网络信标(web  beacon)、DPI、数据抓取(data  scraping)、搜索查询(search  query)等跟踪技术,使广告商得以通过你在互联网上的所看、所查和所买构建一个你的形象。有时,数据跟踪的触角甚至延伸到了你的线下购物行为及其他活动。

在写这本书之前,我都不知道我的互联网服务提供商美国康卡斯特(Comcast)电信公司已经安装了100多个跟踪工具,  [28]  Dictionary(一个我最喜欢的网站,我访问它的次数比Facebook还要多)竟然没有征得允许就在一个用户的电脑上安装了234个跟踪工具,其中只有11个是来自Dictionary本身,其余223个来自于专业跟踪互联网用户的公司。  [29]  据《华尔街日报》(The  Wall  Street  Journal)的一份报告称,如此数目庞大的工具使得客户无法不被跟踪。Dictionary——该报告中排名前50个网站之一,“在暴露及监视用户信息方面位居榜首”。

科学技术越来越发达,也越来越麻烦,它们不断被用来收集有关你的更多信息。不管你是在酒吧、办公室还是在家里,只要你的苹果手机或安卓手机上安装有Color和Shopkick这两个应用程序,你手机的麦克风和相机就会自动打开,以捕捉环境中的声音和光影图像。通过类似的程序,你还能让你的苹果手机根据几句歌词就识别这首歌的名字。Color能获取你所在的位置,并向你提示社交网络上还有谁也正在附近活动。Shopkick则能检测你所进入的商店是否有适合你的折扣。硅谷的博客专栏作家迈克·埃尔甘(Mike  El-gan)指出,市场营销者能通过这些手机应用程序收集到你的大量信息,包括“你的性别、你谈话对象的性别、你的年龄范围、与你说话的人的年龄性别、你就寝的时间、你醒来的时间、你看电视和听收音机的时间、你独处的时间、你与他人在一起的时间、你是生活在大城市还是生活在小镇上、你通勤用的交通工具”。  [30]

浏览器cookie能被数据整合商用于获取用户的账号信息、喜好、个人特征、购买记录、信誉水平、登录名称、社会保险号、信用卡号码、电话号码和地址。  [31]  他们是怎样做到的呢?当用户输入一个社交网络或其他网站的网址(即URL),或点击链接进入网站——就像我在亚马逊上买书时一样,浏览器就连接网站服务器,请求生成页面,  [32]  网站服务器再将被请求的页面发送到浏览器上。网站服务器每从用户那里接收一个请求,都会重新处理,尽管有些请求是重复的——因为网站服务器没有记忆功能。  [33]  但是,如果网站服务器在你的电脑上安插入寥寥几行字符——即cookie,它就能跟踪你对这个网站的后续访问,并会记录下你在那里进行的活动(如你在亚马逊上所购书的书名,还有那些你浏览过但未购买的书的名字)。  [34]  这类信息可用来制作针对你的个性化广告,以便在将来向你推销其他商品(例如和你已购书籍同类别的其他书籍)。

cookie还可以被第三方广告商植入用户的硬盘里。截至2001年,数据整合商DoubleClick游说了11000家网站向用户电脑植入cookie。  [35]  这些网站中有1500家是人们最经常访问的网站,其中包括AltaVista  22  、《美国新闻与世界报道》(U.S.News&World  Report)官方网站、《华尔街日报》(The  Wall  Street  Journal)、theglobe  23  、美国全国广播公司(NBC)、《读者文摘》(Reader's  Digest)及彭博(Bloomberg)  24  。于是DoubleClick的数据库可收集用户在这11000个网站活动时的所有信息。它将所收集的这些信息用于行为定向广告,以使它的客户能为特定的人播放特定的广告语。举两个例子,首先是一个Double-Click的cookie:id80000008xxxxxxb  doubleclick/0  1468938752  31583413  158986260829410552*。  [36]  还有一个Hotmail通过IE浏览器安装的cookie:HMP1|1|hotmail.msn/|0|1715191808|32107852|3511491552|29421613|*|。  [37]

网络信标(别名网页臭虫、动作标记、像素标签等)是另一种篡取互联网用户数据的手段。网络信标就是一个图形图像,常常是透明的(因而不为客户所见),清晰度小于1×1像素,常被插在网站或者电子邮件中。  [38]  当互联网用户访问含有网络信标的网页或打开含有它的电子邮件时,网页或电子邮件的代码就会向电脑发出指令,让电脑连接服务器,将该网络信标下载下来。  [39]  这一服务器要么是由网站的所有者来经营,要么是由获得网站所有者的许可可以在网站上植入网络信标的第三方来经营。  [40]  当电脑连接服务器获得小图标时,服务器会同时生成有关用户特性的文件,包括互联网协议地址(发送请求的电脑的唯一地址,即IP地址)、用户正在访问的网页地址、网络信标安装的时间、获取网络信标的浏览器类型等。  [41]  以下就是DoubleClick埋藏在Quicken  25  的超文本标记语言(HTML)  26  中的一个网络信标:<imgsrc=“http://ad.doubleclick/ad/pixel.quicken/NEW”width=1height=1  border=0>。  [42]

网络信标和cookie经常会被一起使用,前者可用来将浏览器cookie发送到用户电脑上。  [43]  通过这种方法,网络信标可以在多个网域和网站中识别浏览器,这样就能让数据整合商捕获用户的网络活动。  [44]

网络信标无处不在。2009年加州大学伯克利分校开展的一项研究发现,50个最常访问的网站包含至少一个网络信标,而大部分网站会同时带有多个网络信标,有的甚至安装了上百个。  [45]  而且某些跟踪公司涉猎面颇广,例如,谷歌及其子公司的100个网站中有92个被植入了网络信标。

数据整合商也会通过Flash  cookie来收集信息,Flash  cookie被描述为“打了鸡血的浏览器cookie”。  [46]  Adobe  Flash  Player是一个用来在各种互联网浏览器上观看视频、动画、网站应用程序、游戏、文本和图片的软件。  [47]  为了实现这些功能,它拥有自己独立的存储系统,安装有Flash应用的网站能将信息存储于个人电脑的硬盘里,存储的文件名称即为Flash  cookie。它可被网站用于跟踪记录用户的个人偏好,如对某个特定Flash应用程序的音量调节。但就像浏览器cookie一样,Flash  cookie也被广告网络和数据整合商拉拢,用来采集互联网用户浏览习惯等信息。Flash  cookie带给广告商和数据整合商的甚至比普通的cookie还要多,因为它们能存储的信息量高达100KB(千字节),而普通cookie仅能存储4KB,  [48]  而且Flash  cookie也更难清理。通过清除浏览器cookie,清除浏览记录,删掉缓存,将存在浏览器中的个人数据清除或者把浏览器设置为“隐身浏览”等方法,用户可以删除浏览器cookie或使之失效。而对于Flash  cookie,这些做法却常常不管用。  [49]  并且,被删除掉的浏览器cookie还能通过Flash  cookie起死回生,变身为“僵尸”cookie。  [50]  网站服务器会将浏览器cookie和Flash  cookie一并植入用户电脑中,这样Flash  cookie便能存储浏览器cookie特定的cookie账号。当Flash  cookie被激活后,它就会检验浏览器cookie是否存在,如果不存在或是被用户删掉了,Flash  cookie就会自动生成和安装一个新的。  [51]

DPI是数据采集和行为定向广告最强有力也最容易出问题的技术。这项技术使互联网服务提供商或第三方能截取并分析互联网用户在网站上发送的数据。  [52]  这些数据被分解为数据包,每个数据包仅传送原始数据的一部分,但各个数据包合在一起,就能发现发送者和接收者的IP地址,并能提示该数据包位于整个传送过程的具体位置。这些数据包由一个路由器传到另一个路由器上,直至到达目的地。因为有些路由器可能在某些时段比较繁忙,有时数据包会同时经由几个不同的路径到达终点。

正如一位法官的解释:“如果纽约的一台电脑正在往波士顿的一台电脑上发送文件,数据包可能兵分几路。有的直接沿东海岸传送,有的则可能因为东海岸沿途路由器临时拥堵而途径西雅图或丹佛。”  [53]

由互联网服务提供商本身提供的DPI有其几种合法用途:探测网络攻击,疏导网络阻塞,对不同互联网服务项目进行收费。  [54]  但有些行为定向广告公司会与互联网服务提供商合伙串通,监视甚至拷贝用户所发送的信息。  [55]  数据采集商会在互联网服务提供商的设备里植入一个芯片,这样就可以获取和监视用户发出的所有信息的数据包。这样获得的信息是海量的,包括你发出去的每一封电子邮件、你浏览过的每一个网站、你拨打过的每一通网络电话(如通过Skype拨打的)、所有点对点传输的文件以及你在线玩过的游戏。民主与技术中心(Center  for  Democracy&Technology)的首席计算机学家阿莉莎·库珀(Alissa  Cooper)在其2008年7月对众议院电信与互联网小组委员会(House  Subcommittee  on  Telecommunications  and  the  Internet)的陈词中,  [56]  做了一个形象的比喻,指出DPI和邮局里的工作人员在信件发出之前将其拆开来阅读是一回事。  [57]

数据整合商收到个人发送信息的数据包之后,会对数据包内容进行分析,然后为该用户的在线行为及兴趣建立档案,再将档案和分析结果卖给其他人,包括靠用户个人资料起家的定向广告。

当我周日早晨在社交网络及其他网站上活动时,我压根儿不想让他人偷窥到我写了什么、买了什么、发了什么、看了什么,更别说让他们拿我的个人信息去卖钱。“在某种程度上,因为互联网的发展是基于点对点的规则,于是消费者以为他们的网络交流信息在传输的过程中不会被窥视到,”库珀说,“但DPI在为互联网服务提供商与其搭档提供监视能力的同时,戏剧化地改变着这一格局。所以,DPI可能会与客户长期以来抱有的期望背道而驰。”  [58]

甚至你所玩的游戏和你在Facebook上使用的应用程序,都能截取和发送你的私人信息。2007年,Facebook启动了一个让软件开发商在该网站上开发应用程序的平台。截至2011年,该平台已经拥有了55万个应用程序,这些应用程序构成了一个产业,其中最庞大的种类——社交类游戏,所创下的年收入预计为12亿美元。  [59]  根据Facebook  2010年的报告,70%的用户每个月会使用至少一个应用程序。  [60]

《华尔街日报》2010年的调查发现,很多在Facebook上极受欢迎的应用程序都在将用户和用户朋友的身份信息传送给广告商及互联网跟踪公司,这公然违反了Facebook的隐私政策。  [61]  《华尔街日报》分析了10个最受欢迎的Facebook应用程序,包括拥有5900万名用户的FarmVille和2190万名用户的Mafia  Wars(两个游戏均由Zynga出品),结果发现它们都在向数据整合商传送用户的账号信息。当数据整合商拿到一个Facebook账号时,它就能从个人的Facebook网页上获得任何公开信息(这些信息可能包括个人姓名、年龄、住址、职业、照片等)。而Zynga被发现与互联网跟踪公司Rapleaf  27  共享Facebook用户的账号信息,Rapleaf把这些信息纳入自己的互联网用户数据库,以增加行为定向广告的储备资源。  [62]

有些数据整合商关注的不是个人与网页之间的互动,而是使用一种叫做“抓取(Scraping)”的方法来提取所有人发布在特定网站上的信息,然后对其进行分析并售卖。网络抓取器能通过特殊编码的软件从网站上复制信息,  [63]  这些软件程序也被称为网站机器人、爬虫、网络蜘蛛或屏幕抓取器。HTML是构成网页文档的主要语言,抓取器就是用来搜索HTML,从中提取所需的信息。如果某个网站里有一个新妈妈讨论组或是一个购车讨论组,数据抓取器就会把这些信息连同人们的电子邮箱和IP地址一起发给想要瞄准该人群的广告公司。

网络抓取器“能在一分钟内进行成千上万次数据库搜索,远远超出了人工的搜索能力”,曾就职于软件行业的律师肖恩·奥赖利(Sean  O'Reilly)说:“是客户在为自身的正当利益而获取信息,还是数据整合商在为了扩充其数据库而截获他人的信息,互联网服务提供商很难识别。”  [64]

谷歌、雅虎、必应(Bing)等搜索引擎也不例外地会通过用户的搜索指令来收集、存储和分析他们的个人信息。搜索引擎会保留“服务器日志”,根据谷歌的隐私条款,它包括“网站请求、IP地址、浏览器内容、浏览器语言、请求日期和时间以及能专门识别你的浏览器的一个或多个cookie”。  [65]  微软的搜索引擎必应还增加了一项,即“根据你的IP地址来推断你所处的大体位置”。  [66]  搜索引擎使用这些信息来优化它们的搜索算法并记录个人偏好。  [67]  尽管这些日志内容是谷歌用来预防欺诈和改善搜索结果的,但同时,它也会通过分析日志信息来从定向广告中创收。  [68]  再说雅虎吧,雅虎承认自己允许其他公司在其页面上投放广告,且这些广告可能会违反雅虎的隐私政策,因为它们会“在你的电脑上安装或存取cookie”。  [69]

2006年,美国在线(AOL)  28  将research.aol网站的65.8万用户在其搜索引擎中输入的2000万条查询指令公布于众。  [70]  美国在线披露的信息中包含了所有这些用户在三个月内的搜索记录,具体到他们点击了哪些条目、条目的具体内容及其在所有条目中的具体位置等。  [71]  美国在线的研究员阿卜杜勒·乔杜里(Abdur  Chowdhury)将此次行为解释为“美国在线与想解决各种有趣问题的人之间的更紧密的合作”。  [72]  但不管怎样,此项目的结果就是侵犯了人们的隐私。有些情况下,通过查阅一个人的搜索指令,就能了解搜索者的身份。

粗略地扫一眼美国在线泄露的搜索日志,就不难想象在当事人处于刑事、民事或离婚案件中时,一项搜索日志到底可以具有多大的破坏力。

用户11574916:

尿液中的可卡因

亚洲邮购新娘

与佛罗里达州的州际互惠

佛罗里达州酒后驾驶法例

纽约到佛罗里达州的引渡

从朗逸邮购新娘

酒后驾驶是否会被遣返

在新奥尔良法语区的烹饪工作

被指控酒后驾车,我会不会被从纽约遣回佛罗里达州

用户336865:

性感孕妇的裸体

裸体主义者

性感的脚

强奸儿童的故事

tamagotchi  town.  com

幼年性事

非法儿童色情

乱伦故事

10岁裸体照片

儿童裸体模特

非法动漫色情

游戏王

用户59920:

科罗拉多州拉普顿堡被剥皮的猫

科罗拉多州拉普顿堡被杀害的猫

琼贝妮特·拉姆齐(JonBenet  Ramsey)尸检照片

拉姆齐家中犯罪现场的狭窄空间和行李袋照片

性感泳衣

被掐死是什么样子

脖子被掐后的照片

被掐死的受害者的照片

编织针

拉姆齐今天的样子

新泽西公园警察

躺在棺材里的拉姆齐

电影中的勒索信,上面写了什么

电影勒索信

童军结绳

马尼拉绳及其用途

警察用来装证据的棕色纸袋

用来绑住人的绳子

尸体运往科罗拉多州的博尔德

用户1515830:

印度红茶的热量

香蕉的热量

乱伦的后果

怎样告诉家人你是乱伦的受害者

陶瓷大谷仓(Pottery  Barn)

窗帘

外科手术治疗抑郁

奥克兰突袭者队(Okland  Raiders)床上用品

企图自杀过是否还能领养小孩

什么样的人不能领养小孩

我恨男人

提高女性欲望的药物

科罗拉多州丹佛市招聘信息

科罗拉多州丹佛市教师招聘

腹部除皱手术要肿多久

俄亥俄州的离婚法律

免费的远程键盘记录器

用酸奶油烤通心粉和奶酪

如何处理愤怒

丹佛市教育系统招聘

婚姻辅导技巧

抗精神病的药物  [73]

你在搜索引擎中留下的信息会成为评价你的依据,不论这评价结果正确与否。如果你搜索过抗抑郁药物的副作用,可能就会留下对你工作或升学不利的信息;如果你搜索的是有关离婚律师、绿卡或性传染疾病等词条,同样也可能会在某些方面给自己埋下隐患。

你在互联网上的第二个自己很可能是被扭曲了的。那些在美国在线上搜索过“遣返”的人,其实可能只是在为写小说而构造悬疑情节,而非掩盖犯罪;那个搜索过乱伦相关信息的女子,也有可能只是为了帮助朋友,不见得本人就有那样一段困扰的过去。

美国在线公开这些所谓匿名的搜索记录时,《纽约时报》的记者们很容易就能将一位叫塞尔玛·阿诺德(Thelma  Arnold)的女性与搜索者4417749对上号,因为她还搜索了其他姓阿诺德的人,以及有关乔治亚州利尔伯恩的信息。  [74]  在《纽约时报》详述了她对60岁单身男人、她的三条狗以及朋友所患疾病的搜索之后,塞尔玛说:“天呐,我的全部私人生活都在这儿了,我从来没想过会有人站在背后窥视我。”  [75]

但是,“你从用户搜索日志中看到的并不总是事情真正的样子”,任职于以色列里雄莱锡安一所法律院校的奥默·特尼(Omer  Tene)提醒人们。任何能看到塞尔玛·阿诺德搜索日志的人都能发现“手发抖”、“尼古丁对身体的影响”、“口干”、“两级的”、“亚特兰大单身舞会”等搜索记录。然而事实上,这些都是塞尔玛为别人进行的搜索,并不能准确反映她自己的生活和健康状况。  [76]

你的数字身份所表现出来的特征比真实的你更能决定你的际遇。你所看到的那些行为定向广告并不能将更多机会展现给你,相反,实际上可能恰恰侵害了你的某些利益。你的信用卡额度可能会降低,但不是因为你的信用记录不好,而是由于你的种族、性别、邮政编码、你所访问的网站类别等信息。“网络分隔”的结果之一是,数据整合商采集的信息常被公开售卖(通过Spokeo等网站),被售出去的信息到头来可能会成为你求职、申请贷款、领养小孩或是刑事案件中捍卫自身权利的绊脚石。

随着行为定向广告越来越多地影响着人们的在线和离线生活,程式化的人物塑造就会在不知不觉中形成。行为分析最后没有反映事实,而成了对事实的否定。邮政编码显示为“贫穷地区”的年轻人在接收到职业学校的广告的狂轰滥炸后,和同龄人相比放弃上大学的倾向会更明显。每天被动阅读有关烹饪和社会名流类的文章而不了解股市行情的女性,将来可能就不会理财。行为定向广告在划出新的红线标示,拒绝给人们提供工具来逃离社会期望他们扮演的角色。我们的数字身份决定着我们的未来以及社会的未来。

有些社交网络用户觉得,同免费利用Facebook及其他网站相比,贡献一点个人信息不算什么,但还是有人不愿意遭受这第二重身份带来的歧视,想要通过技术和法律手段来确保对自身信息的控制。另一些人则认为,如果有人要想用他的信息来卖钱,这个人必须是他自己。然而,没有一部社交网络宪法来认可这些个人选择,只能任凭社交网络和数据整合商们兴风作浪。

脱离各种第三方拼凑捏造出来的第二重身份,是我们把自己从这种注定的命运中解救出来的当务之急。我们必须获得自己来塑造另一个自己的机会,树立自己独一无二的、完全个人的自我形象。社交网络宪法会帮助我们做到这一点,它将把权力交还给人们,为个体重新寻找自我及把握自己的命运开辟更多的机会。

表2-1 网络跟踪表



注:

1.即使拦截语音流在技术上可行,被压缩的数据仍然可能会被加密。

2.是的,尽管可收集的数据仅限于抓取器所处Facebook账号里好友的数据。

3.访问私人论坛需持有账号。

4.去除标记之前,Facebook账号里抓取器可以看见该图像,也能获取该图像的链接信息。

感谢辛西娅·孙(Cynthia  Su