欧洲科技巨头正在投资“主权AI”,以减少对美国的依赖
科技巨头正越来越多地投资于所谓的“主权”人工智能模型的开发,他们希望通过更多地关注当地基础设施来提高竞争力。
“数据主权”指的是人们的数据应该存储在他们所居住的国家或大陆的基础设施上。
IT网络巨头思科驻布鲁塞尔的欧盟公共政策负责人克里斯·高(Chris Gow)在接受媒体采访时表示:“主权人工智能是一个相对较新的术语,大约在去年才出现。”
目前,许多最大的大型语言模型(LLM),如OpenAI的ChatGPT和Anthropic的Claude,都使用位于美国的数据中心来存储数据,并通过云端处理请求。
这引起了欧洲政界人士和监管机构的担忧,他们认为对美国技术的依赖对欧洲大陆的竞争力有害——更令人担忧的是,对技术弹性(technological resilience)有害。
“AI主权”从何而来?
“数据和技术主权”的概念此前一直在欧洲的议程上。在某种程度上,这是企业对新法规做出反应的结果。
例如,欧盟的《通用数据保护条例》(General Data Protection Regulation)要求公司以安全、合规的方式处理用户数据,尊重用户的隐私权。欧盟备受瞩目的案件也引发了人们对欧洲公民数据能否安全跨境转移的质疑。
2020年,欧洲法院宣布一项欧盟-美国数据共享框架协议无效,理由是该协议没有提供欧盟内部《通用数据保护条例》(GDPR)所保证的同等水平的保护。去年,欧盟和美国达成了协议。数据隐私框架的形成是为了确保数据可以安全地在欧盟和美国之间流动
这些政治上的发展最终推动了云基础设施的本地化。许多在线服务的数据都要通过云基础设施存储和处理。
法国云计算公司OVHCloud全球营销和运营主管菲利波•萨内西(Filippo Sanesi)表示,他们看到了对其位于欧洲的基础设施的大量需求,因为他们“了解将数据保存在欧洲的价值,这些数据受欧洲法律的约束。”
萨内西在接受采访时表示:“随着数据主权的概念变得越来越成熟,人们也明白了它的含义,我们看到越来越多的公司认识到将数据保存在本地、置于特定监管和治理之下的重要性。” 他补充说:“我们有很多数据,这些数据在特定国家、特定法规下拥有主权。”
“现在,有了这些数据,就可以为人工智能制造产品和服务,而这些服务应该是有主权的,应该由当地人才为当地人或企业控制、部署和开发。”
据思科的高说,监管机构还没有进行推动人工智能主权的工作,至少目前还没有。他说,相反,它来自私营公司,这些公司正在欧洲开设更多的数据中心——包含大量计算设备,以启用基于云端的人工智能工具。
高表示,主权人工智能“更多的是由行业驱动,而不是来自政策制定者。”“还没有看到监管机构使用‘人工智能主权’这个术语。”
高说,各国正在推动人工智能主权的概念,因为他们认识到人工智能是“未来”和“大规模战略技术”。
各国政府正专注于推动国内科技公司和生态系统的发展,以及支持人工智能服务的至关重要的后端基础设施。
“人工智能工作负载使用的带宽是传统工作负载的20倍,”高说。他说,这也是为了让劳动力能力更强,因为企业需要熟练的工人才能成功。
然而,最重要的是数据。高说:“你看到的是,这方面有很多尝试,想用语言及本地化数据训练大语言模型。”
“反映价值观”
今年夏天,第一个专门用意大利语数据训练的大语言模型Italia 9B发布。
意大利项目的目标是将结果存储在指定的司法管辖区,并依赖该地区公民的数据。这样,那里的人工智能系统产生的结果就会更加基于当地的语言、文化和历史。
芯片制造巨头英伟达的EMEA企业销售主管大卫·霍根(David Hogan)在接受采访时表示:“主权人工智能涉及如何反映一个组织或者所在国家的价值观和语言的问题。”
霍根补充说:“核心挑战在于,目前大多数前沿模型主要是根据西方数据进行训练的。”
例如在丹麦,英伟达有很多业务,霍根说,官员们担心其人工智能系统提供的重要服务例如医疗保健和电信服务等不能“反映”丹麦当地的文化和价值观。
周三,丹麦发布了一份具有里程碑意义的白皮书,概述了公司如何根据即将出台的《欧盟人工智能法案》(EU AI Act)使用人工智能,这是世界上第一部主要的人工智能法律。该文件将作为其他欧盟国家遵循和采用的蓝图。
霍根说:“如果你所在的欧洲国家不使用主要国际语言,那么可能只有不到2%的数据是基于你的语言进行训练的,更不用说你的文化了。”
监管是如何推动思维转变的
这并不是说法规没有被证明是促使科技巨头更多地考虑在欧洲建立本地化人工智能基础设施的重要因素。
OVHCloud的萨内西表示,像欧盟《通用数据保护条例》这样的法规促进了很多人对在特定地区进行数据处理的兴趣。
人工智能主权的概念也得到了欧洲当地科技公司的认同。
本周早些时候,总部位于柏林的搜索引擎Ecosia和总部位于巴黎的同行Qwant宣布成立一家合资企业,从零开始开发欧洲搜索索引,旨在提供改进的法语和德语搜索结果。
与此同时,法国电信运营商Orange表示,它正在与一些基础人工智能模型公司讨论,为其客户建立一个基于智能手机的“主权人工智能”模型,更准确地反映他们自己的语言和文化。
Orange的首席技术官Bruno Zerbib告诉媒体:“建立我们自己的大语言模型是没有意义的。因此,目前有很多关于我们如何与现有供应商合作,使其更本地化、更安全的讨论。”
Zerbib补充说:“在很多应用场景中,(人工智能数据)可以在本地(在手机上)处理,而不是在云端处理。”Orange还没有为这些雄心勃勃的主权AI模型计划选择合作伙伴。
(编译自CNBC)
【短评】近年来,人们普遍认为人工智能(AI)是新一轮科技革命的核心驱动力。
目前,在人工智能领域,中美两国都投入了巨量资源,竞争激烈,进步难分伯仲。为了阻止中国AI的发展,美国对中国进口高端半导体生产设备和高端AI芯片实行严格控制,但是,各方都清楚,中国突破封锁只是时间问题。
由于英语是世界上使用最广泛的语言之一,美国在发展AI方面有先天优势。虽然欧美文化相近,但欧洲已经意识到发展人工智能过程中使用英语的潜在风险,他们担心自己的 “AI主权”受到损害。
他们认为,AI语言模型如果使用非本地语言训练,其人工智能系统产生的结果就不能反映当地的语言、文化、历史和价值观。
另外,大数据中心要建在自己的国家或地区,受到法律法规的保护,这是“数据主权”。
欧洲科技巨头正在投资“主权AI”,以减少对美国的依赖。
欧洲对“AI主权”的高度重视值得我们关注。