Cambridge Analytica:互联网大数据新科技下的竟选辅助器

2021-04-30 14:04

美国电视剧《纸牌屋》第四季中,安德伍德美国总统在第二个任期中遭遇共和党侯选人威廉·康威 (William Conway) 的强悍挑戰。

康威风流倜傥、家庭圆满,出生国防名门,深得选举人钟爱。但真真正正使他获得人心的杀手锏,并不是个人魅力,只是他与百度搜索引擎 “Pollyhop” 中间的暧昧。

在 Pollyhop 的协助下,康威的竟选精英团队发掘选举人数据信息,对她们的日常个人行为开展剖析,清晰地知道选举人们喜欢什么、要想哪些、要听哪些,从而开展竟选广告宣传精准推送。康威的正脸品牌形象无所不在,每一个现行政策每一句话都说到选举人心窝子里,选举人积极取出了选举票。

而近几天现实世界中暴发的重大新闻,让《纸牌屋》的这一段故事情节变成了一个具有创新性的政冶寓意故事。

2016 年英国总统选举期内,就会有那样一家和 Pollyhop 相近的企业。它选用独家代理的心理状态统计模型剖析客户个人行为,协助特朗普竞选精英团队订制从政治信仰到竟选宣传口号的一切,并精准推送数据广告宣传,一定水平上扭曲了川普的槽糕品牌形象,协助他获得了总统大选。

这个企业来源于美国,名字叫做 Cambridge Analytica。

以上的一切都没问题,但难题出在了这个企业读取数据的方法上。

上周五,英国的《纽约时报》和美国的《卫报》俩家权威媒体另外引发热议,曝出了 Cambridge Analytica(下称 CA)违反规定盗取数据信息的丑事。俩家新闻媒体根据CA內部信号源得到的直接证据说明,该企业违背了 Facebook 开发者平台协议书,获得了累计超出 5000 万多名 Facebook 客户(在其中绝大多数为英国真正选举人)的数据信息。

虽然相比泄漏了 30 亿帐户材料的yahoo,5000 万确实算不上多,但充分考虑在CA事情中客户的名字、性別、家庭住址、生活状态、政冶认为、社交媒体关联等信息内容均被获得,充足对一个客户开展详细肖像,这一事情足够位居英国史上最牛规模性数据泄漏排行榜。

当一家企业有着了超出 5000 万只真正本人的数据信息,和剖析这种数据信息的工作能力,它的能量足够颠复一个社会发展——只需它想要。

以往,全球仅有一家企业有着这一工作能力:Facebook。而如今,多了一家企业:CA。

Facebook沒有这一意向,而CA有。

事情曝出后,Facebook 迅速逐渐强制股票止损,官方网声称早已在自己的开发者平台上关掉了CA和CA总公司“发展战略通信试验室” (Strategic Communications Lab, 下称 SCL) 俩家企业的插口,并在全服务平台上停封这俩家组织 的账户。

SCL 官方网站表明,这个运营已超出 25 年的企业专业朝向“政府部门和国防顾客”,向后面一种出示“数据信息、剖析和对策”等服务咨询;而其分公司 CA,在 2013 年宣布单独并专业承担竟选业务流程。据该企业 CEO 亚力山大·湖人 (Alexander Nix) 称,CA 在单独的第二年就早已参加了高达 44 场英国各个竟选。

在国外,CA 关键服务项目共和党竞选人,皆以其关键公司股东为共和党较大 献金来源于之一的约翰逊·墨瑟 (Robert Mercer)。

2015 年,墨瑟一度适用议员泰德·克鲁兹 (Ted Cruz) 竞选总统,因此CA逐渐为克鲁兹服务项目。之后,墨瑟被英国民粹派和单边主义领军人史提夫·班农 (Steve Bannon) 说动,继而适用借助民粹派线路出类拔萃的政界新手川普。第二年,CA 添加了川普的竟选木板,用心理状态统计模型輔助竟选中的尺寸事项。

2017 年,班农人物传记《恶魔的交易》(Devil‘s Bargain) 一书面形式市,提及班农在近些年逐渐钦佩互联网技术的能量,并寻找借由互联网技术及数据信息的能量完成政冶理想的方式。书里对CA拥有许多叙述,也让这个企业因而获得更普遍的关心。民意调查和竟选人员广泛认为,CA 为川普的胜选出示了非决定性,但仍十分关键的协助。

班农获得了他要想的,将这个“数据信息、剖析和对策”咨询管理公司变成了单边主义政治家上台的踏脚石。他一度在CA的股东会有着一个名额。该企业前关键职工克里斯托佛·怀利 (Christopher Wylie) 接纳《纽约时报》访谈时点评CA的管理人员及服务项目目标:

CA CEO 亚历山大·尼克斯 (Alexander Nix) 他的公司只用了数年,在政客中的受欢迎程度就超越了有数十年经验的民调专家CA CEO 亚力山大·湖人 (Alexander Nix) 他的企业仅用了多年,在政治家中的火爆水平就超过了有数十年工作经验的民意调查权威专家

该企业应用心理状态统计模型协助竟选精英团队剖析选举人喜好并并不是什么秘密。其官方网站确立表明:“大家出示从预测分析选举人个人行为,到指定消息推送广告宣传等一系列服务项目”,也有更粗俗的:“大家会给出的数据,协助客户获得选举票,获得竟选”。

CA 可以义正辞严地讲出那样的话,是由于 “控制选举人” 自身便是美国竞选政冶的一堂必修课程。电视机时期以前,侯选人都需要亲自出马在每个州站口拉选票 (stumping) 体察民情,竞选人参加的演说和议会大厦大会 (townhall)的繁华水平不逊于日本偶像握手会。

市政厅会议议会大厦大会

到电视机时期,除开再次到美国各州演讲,选战也提升了互砸视频广告一项。广告投放的目地要不是平稳自身的拥护者,拉拢观点贴近的选举人,要不是严厉打击竟选敌人——理论上而言,这全是肆无忌惮地控制选举人。

从 2012 年逐渐,选战又提升了选举人数据信息一项。数据信息一度被觉得是选战取胜的重要,靠剖析选举人数据信息获得总统大选的最知名事例当属老布什斯塔姆·美国奥巴马。

在2008年总统大选中,他第一次尝试从数据统计分析中求助。美国奥巴马的竟选精英团队在重要州每周开展五千到一万次短民意调查,一千次长民意调查,她们归还每一个选举人 1)在网络投票日当日外出网络投票 2)适用美国奥巴马的概率都各自打过分。2012 年,美国奥巴马谋取续任,也是在选举人数据信息这条道路上走到底。而在共和党那里,美国奥巴马 2008 年的敌人麦凯恩,其精英团队只开展过一次积极民意调查。

即然爬取选举人信息内容并开展民声控制是这般普遍的政冶方式,那新闻媒体为什么要斥责 CA(及其川普)呢?

这也要从CA把握的恐怖的客户信息量谈起。

在此之前,一直有川普靠高級优化算法获得胜利的传闻,但权威专家觉得,这类叫法并不可靠。由于离了数据信息的支撑点,再奇妙的统计分析方法也是空中阁楼,更有意义的结果务必根据一定量级的数据信息才可以得到。充分考虑实际标准,要想得到充足上下总统大选結果的信息量,基本上是不太可能的。

殊不知实际通常比电视连续剧更有戏剧化。假如你然后看CA的官方网站,会发觉那样一段话:“大家对超出2亿三千万英国选举人开展了每个人达到五千个数据信息点的数据收集,根据这种数据信息,我们可以为客户挑选出目标消费群体,然后更改她们的念头,更改她们的行動。”

2.3 亿便是一个很丰厚,也很恐怖的数据了——英国申请注册选举人数一共也就 2.3 亿,2016 年在总统大选中投票人约 1.3 亿。而此次曝光CA把握的客户信息达到 5000 万,基本上是 2016 年总投票数的一半。

读到这儿你很有可能会疑虑:为何坐享 2.1 亿英国客户的 Facebook 不自身去做竟选业务流程,反倒让CA抢去?

美国的法律沒有对当地公司参加大选开展限定,因而 Facebook 能够出示竟选广告宣传做为一个时兴的社交媒体,Facebook 早已变成当之无愧的微信公众号,协助大选中的一方都代表着做为服务平台有失公正。因此 Facebook 即便 有着很多选举人数据信息也不会参于助选,展现别人推广的广告宣传是它能够做,也可以赚到钱的服务项目。

但在实际中,Facebook 因在 2016 总统大选中释放了过多乌克兰网络黑客和互联网主题活动组织 推广的广告宣传,早已饱受诟病,由于美国选举法律法规确立表明,国外组织 不可参与一切等级的当地大选。殊不知英国公司CA却并沒有遭受应该有的斥责,直至近期违反规定盗取数据信息丑事曝出,查证其干涉美国选举的响声才繁华了起來。

很有可能大家一直接纳了CA掩藏的英国真实身份,又或者是这个在 2014 年就服务项目了 44 场美国竞选的企业,早已从政治家那边获得了庇佑。

Facebook 公布的官方网申明表述了客户信息失窃的前因后果:

2014 年,牛津大学的两位社会心理学学者亚力山大·科根 (Aleksandr Kogan) 和约瑟夫·钱斯勒 (Joseph Chancellor) 创立了一家名字叫做“全世界科研” (GSR) 的小公司,并开发设计了一个心理学测试作用的 App,内嵌了 Facebook 的登陆和开发者平台 Facebook Connect ,容许客户用自身的社交媒体账户登录。

GSR 的隐私条款以社会心理学科学研究为目地,索取客户受权,搜集客户信息,在其中包含客户所在城市、关注点赞的內容、开启的连接这些,并爬取已受权客户的朋友信息内容。但凡发生在客户时间轴上的朋友关注点赞和评价,App 都能一并搜集。

事实上,科根是CA雇来的旗号。他根据 App 获取的 27 万客户数据信息,所有出示给了 CA,而CA为他的新项目出示了折合 80 万美金的经费预算。

2016 年,美国洛杉矶的一位在传播学专家教授彼得·卡罗尔 (David Carroll) 要想从社交网络上清除自身的私人信息,干了课程后却察觉自己的信息内容被一家远在美国的企业收集了。这个企业恰好是 CA。

依据美国相关法律法规,他有权利要回自身的信息内容。在回朔的信息内容里,卡罗尔却发觉这个企业很有可能比他老婆还懂他。

其出示的汇报中写到,卡罗尔“不大可能适用共和党”,在“枪械难题认知度”上得三分,在“国防安全难题认知度”上得七分,在“传统式使用价值和社会道德品行”上了了九分。这一份汇报强调卡罗尔最关注的或是美债,这一项他得了十分100分。他在 Twitter 上发布了这一份汇报,说,“自己为自己评分也莫过于此,很有可能还没有它打的准。”

这个企业恰好是 根据 27 万肉食鸡出示的数据信息, 搭建了一个彻底为竟选服务项目的选举人心理状态统计模型。根据这一实体模型,该企业迅速抓取和解决了大量 Facebook 客户的数据信息。据《卫报》报导,截止 2015 半年度,CA有着的 Facebook 客户数据信息早已做到“上百万”。

CA 为卡罗尔制做的汇报

在争得摆动票时,这类精准的选举人剖析通常可以具有关键性的功效。理论上,特朗普竞选精英团队会向卡罗尔及其和他观点相仿的选举人消息推送 “川普实行关税壁垒现行政策”、“造就就业问题”、“处理英国中产阶层困境” 等话题讨论的广告宣传,亦或消息推送“希拉里深陷邮件门丑事”、“疑与多位男士有一腿”的信息内容。

  可想而知,道德情操得分极高、关注国家债务的卡罗尔教授会把票投给谁了。尽管他“不太可能支持共和党”,这些推送也足够断绝他对特朗普的政治敌人可能存在的信任或幻想。

  在整个事件中,Facebook 又扮演了怎样的角色呢?

  时间拨回 2015 年。CA 收购了科根和钱斯勒的 GSR 公司。科根继续在剑桥大学工作,钱斯勒却在这段短暂的工作结束后,被 Facebook 招募到了硅谷总部,职位为“量化社会心理学家”(quantitative social psychologist)。

  硅谷公司招人,就算不盘到祖宗十八代,也至少会把候选人的上家和前份工作内容问清楚。也就是说,Facebook 最早在 2015,甚至 2014 年就理应知道CA如何获取 Facebook 最隐私的用户数据,以及怎样将它们用于政治用途用户画像的。

  Facebook 在 2015 年就理应封闭CA的接口,彻查此事,并负起一家上市公司应负起的责任:告知公众他们的用户信息可能被用于未经授权的用途。

  然而 Facebook 没有这样做。

  至于 Facebook 是否有意借CA之手,为未来可能更需要操纵美国选举做了一次 beta testing,那就不得而知了。

  经过一个周末的发酵,CA、Facebook 都被推上了舆论的风口浪尖。

  CA 的各种糗事被不断曝光,被挖出跟有俄国政府背书的石油公司 Lukoil 共享统计模型和数据抓取方法;CEO 尼克斯和公司高管出现在了一则“钓鱼采访”的视频里,向扮演成客户的调查记者大吹自己和公司如何蒙骗立法机构,在各国操纵选举,甚至开黄腔抖出了曾在欧洲国家选举中雇佣色情工作者勒索政客的事情。

  在事件中成为关键爆料人之一的CA前员工怀利,也吸引到了大量的关注。和漩涡中的尼克斯、科根等其他人不同,怀利在关键的时刻选择了站在揭露真相,而不是掩盖真相的一边。这让曾经作为整个谎言机器关键螺丝,无论如何都无法洗刷罪恶的他,像是第二个爱德华·斯诺登 (Edward Snowden)。

  Facebook 则被谴责没有在三四年前就向监管机构和个人通报,长期忽视用户信息安全。当地时间周二,英国议会直属的信息专员办公室(类似于中国工信部)已经向法院申请搜查令,对CA办公室和其数字资产进行直接调查,并已经通知 Facebook 立即停止内部审计,以免其摧毁证据。

  如果CA遭遇英美两国信息安全法的审判,Facebook 恐已唇亡齿寒。

  Facebook 发了声明及时和CA切断关系止损,但公众并不买账。美国时间周一中午,Facebook 股票价格一度暴跌 6.8%,市值蒸发 367 亿美元。其创始人兼 CEO 马克·扎克伯格今年一直在卖股票,而卖出的单子遇上了好时候:财经媒体 MarketWatch 估计,他在周一 FB 股价自由落体之前卖出的股票让他少赔了 4000 万美元左右——足够用做总统竞选了。

  特朗普则一直在风口浪尖上。他在性丑闻和“通俄门”事件中沾的一身污水还没洗干净,现在又被牵扯上CA助选事件。已经掌握了大量人证和物证的 FBI 特别检查官罗伯特·穆勒 (Robert Mueller) 上周末应该挺忙的。

  最后,不妨看看《纸牌屋》里的威廉·康威是如何应对危机的:

  康威与搜索引擎的合作终于引起了媒体的重视,如果放任不管,恐怕下一步就将迎来司法部的调查。虽然挖掘用户数据属于灰色地带,法律没有明确监管,但如果司法部指控网站非法盈利,那么这笔赔偿金谁都无法负担。

  威廉尝试用政治手腕解决问题,但没有成功。他不得不正面回应此事。他以朋友的身份与 Pollyhop 创始人一同露面,告诉大家自己所做的一切都是为了更好的了解民意,最后他与大家分享了自己漂亮妻子和可爱儿女的照片视频,不仅提高了自己的人气,还带动了 Pollyhop 的流量。

郑重声明:本文Cambridge Analytica:互联网大数据新科技下的竟选辅助器版权归原作者所有,转载文章仅为传播更多信息之目的,不作为商业用取,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。