拥有30亿人脸资料库的AI公司被骇!拥有资料量超越美国联邦政府,客户包含美国移民局、司法部、FBI

上周四,人工智慧初创公司 Clearview AI 被骇,平台上超过2000家客户数据暴露在骇客的野心下,其中不乏美国移民局、司法部、FBI等重要执法机构。Clearview AI 的资料库中涵盖了约30亿张人脸数据,可以仅靠一张脸部照片,就检索出全网所有的相关图片,包括照片的地址链接。

2 月 27 日 Clearview AI 向美国福克斯新闻网证实,公司所有的客户列表、帐户数量以及客户进行的相关搜索数据遭遇了未经授权的入侵。隔了一天,Clearview AI 律师 Tor Ekeland 表示,公司的系统跟网路并没有受到破坏,目前已修复了相关漏洞,并保证类似事件不会再次发生。根据 Clearview AI 声明,骇客入侵者获得了未经授权的客户访问列表,其客户包括美国执法机构。

目前,苹果已禁用 Clearview AI 的开发者帐户与其 iOS 应用程式,称其违反了企业开发者协议的条款。

根据 BuzzFeed 披露,Clearview AI 的脸部辨识客户包括了美国移民局、司法部、银行,FBI,ICE,梅西百货,沃尔玛、NBA、阿拉伯的主权财富基金等 2228 多家机构和公司;此外还有更多的私人公司正在透过 30 天免费试用来测试该技术。

这其中至少有 600 家美国执法机构使用了 Clearview AI 最新的脸部辨识系统,数据涵盖了 Facebook、Instagram、Twitter 和 YouTube 等社群媒体平台上抓取的超过 30 亿张照片,来建立自家的资料库资源。

Clearview AI 所拥有的数据量级已远远超过了美国联邦政府或者任何一家矽谷巨头的数据体量,即使像 FBI 这样的机构,其资料库也仅仅是收集了4.11 亿张照片。

图片来源:纽约时报

单从应用的层面来看,Clearview AI 所具有的能力与服务潜力非常巨大。如抗议游行、暴动中个别激进分子的身份辨识,寻找街上偶遇到的心仪对象等,不仅可以搜出他们的名字,甚至还能知道住所、工作单位和社群关系网路!

用在执法单位则有点恐怖,像是只需一张照片就能从 30 亿张图像中锁定你的姓名、联系方式和家庭住址,Clearview AI 基于自身的脸部辨识系统和资料库协助 FBI 在内的数百家美国执法机构用脸部辨识技术抓捕罪犯。

 

早有前科

2020 年刚刚过去两个月,这家创办了四年的公司就上了两次热搜。一次是 1 月份因侵犯隐私权引发争议,另一次就是此次数据被黑引发了极大的关注。

今年 1 月,Clearview AI 因随意抓取网上照片引发争议。据《纽约时报》当时的调查显示,Clearview AI 允许执法机构使用其辨识技术将未知面孔的照片与人们的线上图像进行匹配,进而搜寻潜在罪犯。随即,Twitter 向 Clearview AI 发出了一封勒令停止通知函。

仅靠一张脸部照片,Clearview AI就可以检索出全网所有的相关图片,包括照片的地址链接。但是,关于更细节的像是个人讯息,诸如姓名、联系方式和家庭住址,Clearview AI还没有向公众开放。

2 月 5 日,YouTube 向 Clearview AI 发出了一封勒令停止通知函,要求这家公司停止从其影片中收集人脸,并删除已经收集的数据。2 月 7,Facebook 向人脸辨识公司 Clearview AI 发出了一封勒令停止通知函,要求其停止从 Facebook 和 Instagram 上获取数据。

Clearview AI 的做法违反了数据科技公司的服务条款,在这些公司不知情的情况下获取了使用者数据,因此得罪了一干科技巨头。

两个月的时间里,Clearview AI 已收到来自微软、Google、YouTube、Venmo、LinkedIn 和 Twitter 的停止与禁止公函。还将面临 500 万美元的集体诉讼索赔。

600多家执法机构都在用,他们的技术有何特殊?

月初,Clearview AI 创办人兼首席执行长 Hoan Ton-That 在接受采访时并没有表现出太多对其技术的担忧。

他想以「最好的意图建立一家伟大的美国公司」,并表示不会将产品出售给伊朗、俄罗斯或中国。Hoan Ton-That 认为这项技术正在挽救孩子,解决犯罪问题

Clearview AI首席执行长Hoan Ton接受CBS采访,图源 | CBS影片截图

这位越南裔澳洲人三次创业、自学 AI,想建立一家「伟大的美国公司」。

2016 年,Hoan Ton-That 和 60 多岁、时任纽约市市长 Rudolph W.Giuliani 助手的 Richard Schwartz 合作,着手研究脸部辨识工具,这就是 Clearview AI 雏形。

2019 年,Clearview AI 开始向美国的执法机构推广其服务,借助 30 天免费试用鼓励警察购买。

高铁宣布清明连假期间全车次只售对号座车票、3/5 开放购票,网友:重点不是怕感染

随着新冠肺炎疫情持续升温,台湾高铁公司今天宣布,为因应政府政策,以及考量旅客健康安全,将于清明假期疏运期间(4/1-4/6)停售自由座车票,全车仅售对号座车票,并订于 3 月 5 日本周四凌晨 0 时开抢。 台湾高铁表示,针对清明假期疏运期间(4/1-4/6)期间将暂停定期票、回数票、悠游卡/一卡通联名卡之使用,以降低感染风险。另台湾高铁清明假期疏运自 3 月 5 日(四)凌晨零时起开放预售,提醒旅客特别注意、提早订位购票,并依照票面所载之车次及车厢座位搭乘,以免无法乘车。 针对这个提前部署,有些网友抱怨会「抢票抢到爆炸」「说得好像对号座就不会传染?」,不过,也有些网友认为重

2019 年 2 月,印第安纳州警察局对 Clearview AI 的应用工具进行测试,仅用 20 分钟就透过围观群众拍摄的影片找到了犯罪嫌疑人的社群网站,解决了这起打架斗殴事件

2019 年底,Clearview AI 爆火,被私家侦探广泛使用。纽泽西州克利夫顿的一名侦探甚至在邮件中敦促老板购买这款软体,因为它「能够在几秒钟内辨识出嫌疑人」。

Clearview 资料库的规模让执法部门使用的其他资料库相形见绌,据《纽约时报》,Clearview AI 的应用已被包括联邦调查局和美国国土安全局在内的 600 多家执法机构使用,包括加拿大皇家骑警在内的一些执法部门也在使用,该公司声称其技术在辨识个人身份方面的准确率达到 99.6%。

目前,Clearview AI 已经渗透到联邦政府的多个部门。美国司法部的多个部门在使用 Clearview AI 的产品,政府组织名单中包括美国特勤局的多个办公室(搜索次数约为 5600 个),禁毒署(约 2000 次搜寻);酒、烟、火器和炸药局(搜索超过 2100)和 FBI(至少 20 个不同的总部外办事处进行了 5700 次搜索)。目前,这些机构的发言人对此事要么拒绝置评,要么未回应置评请求。

执法部门认可、私家侦探力荐,成为「爆款」之后的 Clearview AI 也招致了数据黑色产业链的关注,这一过程花了不到半年的时间,轰然变天的速度出乎意料。

 

 越红越危险,大数据的黑色产业链

据了解,Clearview AI 所具有的能力与服务潜力非常巨大。如抗议游行、暴动中个别激进分子的身份辨识,人肉路上遇到的心仪对象等。一张照片不仅可以搜出他们的名字,甚至还能知道住所、工作单位和社群关系网路。

Clearview AI 拥有 30 亿人脸数据,一旦数据隐私泄露将带来无法估量的损失。事实上,层出不穷的数据泄露事件对个人、企业、社会的都是一种巨大的威胁。

在我国,仅 2017 年在黑市上被泄露的个人讯息就高达 65 亿条次,由数据泄露而衍生出来的黑灰色产业链年获利已超百亿元。买卖公民个人隐私数据为小贷公司的「套路贷」犯罪、暴力催收大开方便之门。

2018 年 3 月曝光的 Facebook 数据泄露事件中,有 5000 万使用者的个人资料,一直被用作向其精准投放政治广告的重要参考,而这些人占据着美国选民人数的四分之一。同年,万豪发布公告称旗下酒店喜达屋 5 亿房客讯息被泄露;社群平台陌陌的 3000 万使用者数据在暗网被销售;问答网站鼻祖 Quora 的 1 亿使用者数据被窃……

2019 年 2 月,国内专注于安防领域的人工智慧企业深网视界超过 250 万人的数据被非法获取,680 万条数据疑似泄露,包括身份证讯息、人脸辨识图像及图像拍摄地点等。

2019 年 5 月,一名自称 GnosticPlayers 的骇客声称窃取了澳洲网站 Canva 的 1.39 亿使用者数据,包括使用者姓名、使用者名、电子邮件地址、城市国家讯息。

2019 年 9 月,17 万条「人脸数据」在国内的网上被公开兜售,涵盖 2000 人的肖像,每个人约有 50 到 100 张照片,每张照片还搭配有一份数据文件,除了人脸位置的讯息外,还有人脸的 106 处关键点,如眼睛、耳朵、鼻子、嘴、眉毛等的轮廓讯息等。数据中还能提供人物性别、表情情绪、颜值、是否戴眼镜等讯息。

2019 年 12 月 4 日,一个包括 27 亿个电子邮件地址的 Elasticsearch 资料库泄露,其中 10 亿个密码都是以简单的明文储存。据悉,大多数被盗邮件域名来自中国邮件提供商,涵盖腾讯、新浪、搜狐和网易等。

动辄亿级,数据内容极其详细,此类触目惊心的数据隐私泄露事件一直在发生。

据统计,在所有的数据泄露事件中,科技行业因其讯息化、数位化程度最高,颗粒度更细、价值更大,发生的数据泄露事件最多,占比为 37%。其次分别是政府机构、金融和医疗机构。

对于任何规模的公司来说,网路安全都不是小事,受众多执法部门青睐的 AI 公司更是如此。

 

合法获取数据将成为行业大势

Clearview AI 此次数据的泄露,将数据风险和数据隐私的讨论再次推上风口浪尖。长期以来,数据面临着三种风险:骇客攻击、明文储存使得数据可以轻易被覆制、越权访问带来数据泄露问题

对于侵犯使用者隐私权,Clearview AI 声称拥有对公共讯息的美国宪法第一修正案权利,并将其做法与 Google.com 搜寻引擎进行参照比较,但这一说法并没有得到广泛「买帐」。

据路透社报导,加拿大当局正在对 Clearview AI 进行调查判断其是否违反使用者隐私法。在美国伊利诺伊州,Clearview AI 被诉讼指控侵犯了州居民的隐私权。纽泽西州这样的部分美国地区甚至还颁布了州禁令,禁止执法机构使用 Clearview AI 的应用工具服务

技术用于执法、维护社会正常秩序自然是好的,但一旦被黑产盯上后果便不堪设想。涉及使用者隐私的问题需要企业自身强化数据管理、保护数据隐私,同时,法律法规的颁布施行也有利于遏制数据泄露的频频发生。

目前,我国「两高」司法已经对公民隐私数据问题有了解释:泄露使用者通信内容五百条即可入罪。等级保护法以及有公民隐私数据的企业必须过等保安检的规定也对公民数据隐私问题有了法律层面的保护。

数据有价值,管理、技术有漏洞,数据就会有泄露的可能。目前侵犯使用者隐私的行为受到越来越多的诟病,合法合规的获取数据也将成为行业大势,同时,日后更加完善的法律法规也有利于遏制数据泄露的频频发生。