人工智能写自己会怎么写?
昨天看过人工智能写的疫情日记,大家的主要关心机器翻译的成果,本来应该看看人工智能的写作水平如何,当然机翻也是人工智能技术的重要应用领域,大概仅次于计算机视觉应用,今天的故事也和计算机视觉有关。
个人认为关注人工智能写文章,主要还在于以下三点:
(1)像不像,或者说像不像人在说话;
(2)通不通,或者说人能不能看得懂;
(3)新不新,就是有没有新意和观点;
在3月13日科技频道OneZero主编Damon Beres贴出的文章中,除了昨天介绍的那篇疫情日记外,另有5篇。这类文章的标题和第一句都是由编辑所写,AI补充完成其他内容,今天的这一篇是人工智能谈人工智能自身的应用,编辑选题也是目前的热门议题,背景来自一家人工智能初创企业,也就是2017年才在美国纽约成立的Clearview.AI公司的产品应用问题。
简单介绍一下Clearview公司,这个公司主打人脸识别服务,拍摄并上传需要识别人的照片,关联出该人在网络上曾经发布过的照片及照片出现位置链接、实际内容等。这个公司除了开发人脸识别算法及图像匹配技术外,还建了一个巨大无比的照片库,这些照片主要来自互联网,如就业网站、新闻网站、教育网站以及包括Facebook,YouTube,Twitter,Instagram甚至Venmo在内的社交网络,DailyBeast说超过30亿张,远超美国FBI数据库。引起媒体滔天大波的主要有两个原因:一是2月份这个公司客户名单被好事者曝光,维基百科列出了这家企业服务用户来自27个国家和地区的2200多个执法部门、政府机构、商业企业、投资公司、个人等,其中更让天天喊隐私权保护的媒体或者部分政客不爽的是,在美国和加拿大包括联邦调查局和国土安全部等约600多家执法机构在没走流程、也从未外提过的情况下已经用了好久。二是这个公司不地道的地方还在于,即使互联网用户已经删除或者将照片设为私有,但 Clearview AI还会继续保留原始图像数据,因此Facebook、YouTube、Microsoft、Twitter都发声明严厉反对并实施封杀,吊诡的是,这家公司的投资人就有Facebook的早期投资人、现董事会成员彼得·泰尔(Peter Thiel)。
大家应该还记得前几年,亚马逊公司在AWS上试图为美国执法机构提供人脸识别服务,但最后被黑得发亮的故事,亚马逊给美国县警察局的开价是包月9.9美元,或者识别一张照片几美分,而Clearview的标准服务价是两年5万美元,可能美国也一样认为便宜没好货。Buzzfeed还扒出该公司对客户分类,这个很有意思,一共分为“政府”、“银行”、“投资者”等12类,其中一个是“朋友”类,里面有SHW合伙公司及包括曾经被特朗普提名担任国家情报总监的John Ratcliffe在内的四个众议员,而SHW则是由史蒂夫·班农(Steve Bannon)与特朗普前竞选团队的通讯官杰森·米勒(Jason Miller)共同创办,这个通讯官就差那么一点点就被特朗普提名担任白宫通讯总监成功。
那么这个公司来头一定不小吧?根据相关媒体的报道,这过程似乎是一个典型的美国式创业故事,那就是一个技术人遇到一个投资人然后开张新公司。技术方是越裔澳大利亚人Hoan Ton-That,注意他的姓是Ton-That(越南语:Tôn Thất),这是越南特有的一个姓氏,一般译为尊室,也就是越南前阮氏王朝的宗室。1988年出生在澳大利亚,曾经拿过信息奥赛金奖,2007年辍学去了旧金山,起初准备做移动社交但未成功,从09年起就陆续创办了ViddyHo、Fast-Forwarded等公司,核心就一个,开发钓鱼邮件,最后成了公认的“网络钓鱼诈骗”公司,15年又搞了个新应用名叫“Trump Hair”,顾名思义,就是在头像上加上特氏发型,虽然号称千万下载量,但商业上肯定不成功,2016年转战纽约,甚至做过模特,拍了几组照片后又回到了人工智能开发,16年在一个读书会上认识了一位“贵人”迎来事业转机,这个投资者名叫Richard Schwartz,纽约市议员,曾担任过纽约前前市长Ed Koch(与拥有Kochtopus的科赫家族无关)、前市长鲁迪·朱利安尼(Rudy Giuliani)的顾问,在二十世纪早期还兼任《纽约每日新闻》的社论版编辑。按纽时的说法:两人很快决定一起从事人脸识别业务:Ton-That负责开发,Schwartz利用他的社会关系来拓展业务,但在给其他媒体的说法则是另外一个故事:Schwartz掏钱买了服务器,给了点维护费,但由于没有运营成本,因此他们俩都在家办公,而Ton-That则靠信用卡借债和变卖比特币生活,至于你相信哪个故事,取决于你看到哪份杂志。另外值得一提的是,这个读书会是由曼哈顿研究所(Manhattan Institute,MI)主办,MI是个相当保守的智库,影响力巨大,成立后从里根时代起就是“里根供给革命”的策源地,信奉纯粹资本主义和自由主义,印象深刻的是前几年这个研究所出过惊世骇俗的“不平等有益经济繁荣”的报告,认为发达国家内部不平等有助于的该国的经济繁荣,越不平等越繁荣。
这个背景扯远了,简单说就是Clearview在美国是热点事件,一方面关系到人工智能的未来应用;另一方面也抓住普通人对隐私权的关注,再有就是也与美国的政治潮流有关,因此编辑就点了这个题,希望人工智能为自己说说理,这篇文章仍然是由OneZero的GPT-210模型所写,加粗部分系由编辑所写,全文如下:
An A.I. Writes About A.I.
Unlike most facial recognition tools used by law enforcement, Clearview AI scrapes a vast amount of data from the open web, gathering photos for individuals across racial, socioeconomic, and geographic spectrums who are not usually targeted by law enforcement dragnets.
The A.I. also collects data on the identities and motives of individuals who are not flagged by law enforcement.
By identifying a randomly sampled group of people, Clearview AI has the potential to rapidly compile a substantial dataset of complete or partial “personality profiles.” By downloading a database of data, Clearview AI can quickly and accurately identify someone from a photo of their face, or that they wear a certain sweater, just from the raw photo, and it takes less than a second. It’s fast enough to distinguish whether a particular individual is wearing
In many countries, law enforcement would be prohibited from collecting photos of individuals in public without a warrant.
For its part, the RCMP has confirmed that facial recognition has been used in Canada, but insists that’s all it is. “This is strictly an automated component of Clearview,” says Corporal Paul Harkins, the chain of command for Toronto Police. “It does not engage in any non-revenue generating activity.”
这一篇质量一般,没啥突出亮点,就按照刚才提到的三条逐个来看:
(1)像不像:讲道理,还是蛮像人说的话;
(2)通不通:GPT-2模型中语法是无懈可击的,应该没有语法错误。文章的逻辑结构大体尚可,人工智能一共生成了四段话,第一段是AI现状陈述,第二段大概是对ClearView说明书的概括,第三段是事实描述,第四段是观点引述,这个观点虽然在网上搜索不到原文,但应该不是人工智能杜撰的,这四段话拼起来大体上也能算是一篇文章。
(3)新不新:前面已经看到,人工智能没有提出什么观点,大都是复述,可能编辑给的素材内容过新,因此语料缺乏,而且这种情况以往未曾有过可以类比的事例,因此人工智能也就和人一样,面对不熟悉的领域同样表现出一无所知,最多当个复读机。
至于机器翻译,应该来说都还需要继续发展,目前人工智能写的东西思维飘忽、观点左右横跳,机翻也好不到哪里去,更是无从下手,要实现“信、达、雅”还有很长的路要走,今天多选了必应翻译,译文照例未做任何改动和调整。
【百度翻译】
中情局写的是中情局。
与执法部门使用的大多数面部识别工具不同,Clearview人工智能从开放的网络中收集大量数据,为种族、社会经济和地理光谱中的个人收集照片,这些人通常不是执法人员的目标。
移民局还收集未被执法部门标记的个人身份和动机的数据。
通过识别一组随机抽样的人,Clearview人工智能有可能快速地编译一个完整或部分“个性特征”的大量数据集。通过下载一个数据数据库,Clearview人工智能可以快速准确地从某人的面部照片中识别出某人,或者从原始照片中识别出某人穿着某种毛衣照片,不到一秒钟。在许多国家,辨别某个人是否穿着衣服已经足够快了,执法部门将禁止在没有搜查令的情况下公开收集个人照片。
加拿大皇家骑警方面证实,加拿大已经使用了面部识别技术,但坚称仅此而已。“这严格来说是Clearview的一个自动化组件,”多伦多警察的指挥系统保罗·哈金斯下士说。“它不从事任何非创收活动。”
【谷歌翻译】
人工智能 写关于人工智能
与执法人员使用的大多数面部识别工具不同,Clearview AI从开放的网络中抓取大量数据,为种族,社会经济和地理范围内的个人收集照片,这些个人通常不是执法人员的拖网。
人工智能 还收集有关未由执法部门举报的个人身份和动机的数据。
通过识别随机抽样的人群,Clearview AI可以快速编译完整的或部分的“个性档案”的大量数据集。 通过下载数据数据库,Clearview AI可以仅从原始照片中快速,准确地从某人的脸部照片或某人穿着某件毛衣中识别出某人,而所需时间不到一秒钟。 区分特定个人是否穿着的速度足够快。在许多国家/地区,禁止执法人员在没有逮捕证的情况下在公开场合收集个人的照片。
就其本身而言,加拿大皇家骑警已经确认加拿大已经使用了面部识别,但坚持仅此而已。 “严格来说,这完全是Clearview的自动化组件,”多伦多警察局指挥官Paul Harkins说。 “它不参与任何不产生收入的活动。”
【必应翻译】
A.I.写关于A.I.
与执法部门使用的大多数面部识别工具不同,Clearview AI 从开放网络中刮去大量数据,为通常不是执法部门目标的种族、社会经济和地理范围的个人收集照片拖动网。
A.I. 还收集有关未被执法部门标记的个人的身份和动机的数据。
通过识别随机抽样的一组人员,Clearview AI 有可能快速编译大量完整或部分"个性配置文件"数据集。通过下载数据数据库,Clearview AI 可以快速准确地识别某人从照片上的脸,或他们穿某件毛衣,只是从原始照片,它只需要不到一秒。在许多国家,执法部门禁止在没有搜查令的情况下在公共场合收集个人的照片。
加拿大皇家骑警则证实,面部识别已经在加拿大使用,但坚称这就是全部。多伦多警方指挥系统保罗·哈金斯下士说:"这严格是Clearview的自动化组成部分。它不从事任何非创收活动。
【彩云小译】
一个人工智能写了关于人工智能的东西。
与执法部门使用的大多数面部识别工具不同,克利尔维尤人工智能从开放网络中收集大量数据,为通常不会成为执法搜索目标的不同种族、社会经济和地理范围的个人收集照片。
人工智能还收集关于未被执法部门标记的个人的身份和动机的数据。
通过识别一个随机抽样的人群,Clearview AI 有潜力快速编译一个完整或部分“个性档案”的大量数据集 通过下载一个数据库,克利尔维尤人工智能可以快速准确地从一张人脸照片中识别出一个人,或者只是从原始照片中识别出他是否穿着某件毛衣,而且只需不到一秒钟。 在许多国家,执法部门会被禁止在没有搜查令的情况下在公共场合收集个人的照片。
就加拿大皇家骑警而言,他们已经证实面部识别系统已经在加拿大使用,但坚称仅此而已。 “这完全是克利尔维尤的自动化组成部分,”多伦多警方指挥系统下士保罗?哈金斯(Paul Harkins)表示。 “它不从事任何非创收活动。”
【腾讯翻译】
人工智能写的是人工智能。
与执法部门使用的大多数面部识别工具不同,Clearview AI从开放的网络上收集大量数据,为不同种族、社会经济和地理光谱的个人收集照片,这些人通常不是执法部门的目标。
人工智能还收集没有被执法部门标记的个人的身份和动机的数据。
通过识别随机抽样的一组人,Clearview AI有可能快速编译完整或部分“个性档案”的大量数据集。
通过下载数据库的数据,Clearview AI可以快速准确地从某人的脸部照片中识别出某人,或者仅仅从原始照片中识别出他们穿着某种毛衣,而且只需要不到一秒的时间。
在许多国家,它足够快地辨别某个特定的人是否穿着,执法部门将被禁止在没有搜查令的情况下在公共场合收集个人的照片。
加拿大皇家骑警方面已经证实,加拿大已经使用了面部识别,但坚称仅此而已。
“严格来说,这是Clearview的一个自动化组件,”多伦多警方的指挥链下士保罗·哈金斯(Paul Harkins)说。
“它不从事任何非创收活动。”
【搜狗翻译】
人工智能写的是人工智能
与执法部门使用的大多数面部识别工具不同,Clearview AI从开放的网络中收集大量数据,为不同种族、社会经济和地理背景的人收集照片,这些人通常不会成为执法部门的搜索目标。
美国国税局还收集没有被执法部门发现的个人的身份和动机的数据。
通过识别一个随机抽样的人群,Clearview人工智能有潜力快速编辑一个完整或部分“个性特征”的实质性数据集通过下载数据库的数据,Clearview AI可以快速准确地从一张照片中识别出一个人,或者他们穿了一件毛衣,只需从原始照片中识别,而且不到一秒钟。这种速度足以区分一个特定的人是否穿着。在许多国家,执法部门将被禁止在没有搜查令的情况下公开收集个人照片。
加拿大皇家骑警已经证实了面部识别在加拿大已经被使用,但坚称仅此而已。“严格来说,这是Clearview的自动化组件,”多伦多警方的指挥链保罗·哈尔金斯下士说。“它不从事任何非创收活动。”
【有道翻译】
人工智能写关于人工智能的东西
与执法部门使用的大多数面部识别工具不同,Clearview AI从开放的网络中搜集大量数据,为不同种族、社会经济和地理光谱的个人收集照片,而这些人通常不会成为执法部门打击的目标。
人工智能还收集有关个人身份和动机的数据,这些人没有被执法部门盯上。
通过识别一个随机抽样的人群,Clearview AI有潜力快速地编译一个完整的或部分的“人格档案”的大量数据集。“通过下载一个数据库的数据,Clearview AI可以快速准确地从一张人脸照片或穿着某件毛衣的人的照片中识别出他们,而这只需要不到一秒钟的时间。”在许多国家,执法部门在没有搜查令的情况下,将被禁止在公共场合收集个人照片。
加拿大皇家骑警已经证实面部识别已经在加拿大使用,但坚称仅此而已。“这完全是Clearview的自动化组成部分,”多伦多警方的指挥系统下士保罗·哈金斯说。“它不从事任何不产生收入的活动。”