游戏AI三大难:样本大、成本高、灵活性差

500

  DeepMind“入侵”安卓游戏了

  继攻克围棋、《星际争霸》后,DeepMind开始瞄准手游了。

  5月初,DeepMind推出 AndroidEnv后,开始密集测试诸多手游。最新加入体验挑战的是安卓版《The Battle of Polytopia》,它由瑞典开发商Midjiwan 制作并发行,是一款回合制文明策略游戏。

  游戏故事背景设定在一个奇异而又平坦的“方块”星球。玩家可领导 12 个不同文明中的一个,扩张帝国、研究科技并成为整个星球的统治者来最终取得胜利。

  游戏拥有单人和多人模式,最多可支持 12 名玩家。

  目前,Midjiwan 正跟DeepMind合作,将《The Battle of Polytopia》集成到AndroidEnv中,成为后者一项常规任务。

  大爆炸,变革性体验要来了?

  “我们发现这款游戏是一个特别有趣的挑战,因为它有许多功能,如处理长期规划、不完善信息、多样化 UI 元素和非确定性。”DeepMind 评论说。

500

  针对本次合作,Midjiwan 总经理Christian Lövstedt则表示,DeepMind 是人工智能领域巨人般的存在,能拥有这样强大的合作伙伴,并成为平台一份子,我们感到非常自豪和兴奋。

  在Polytopia玩家群体中,不乏资深玩家。融入人工智能后,想必也会给玩家体验带来不一样的变化。

  AndroidEnv作为一个AI平台,允许AI代理在游戏中自定义任务,比如寻找公园的方向、预定航班甚至于获取最高分。

  AI代理主要依据屏幕上显示的图像做出决策,它能像人类一样通过触摸屏和手势进行操作。

  理论上,AI能够帮助开发者实现内容快速生成、自动生成剧情,乃至促进NPC智能化和多风化。

  以腾讯AI Lab为例。在竞技博弈AI方面,腾讯AI Lab推出了绝艺跟觉悟。前者主要涉及棋牌项目中的围棋和麻将,完成从完全信息博弈到非完全信息博弈的拓展。

  后者主要涉及到MOBA类手游《王者荣耀》及体育类的足球,分别在异构分布式multi-agent和更多智能体+长配合方面进行探索尝试。

  笔者获悉,《王者荣耀》项目组一直在尝试各种新玩法,但效果往往不尽如人意。意外的是,AI人机对战参与率极高,超过10%的玩家。

  这意味着,日活用户达到大几百万。官方披露的数据显示,AI觉悟挑战共吸引超过数千万玩家参与。

  此外,基于AI对于游戏理解的专业策略分析和声音文本的综合体现,腾讯也推出了王者荣耀虚拟主播。

  在美术资源方面,腾讯AI Lab涉及虚拟人和3D动作生成。据悉,内部团队正在着手尝试在动作生成方面得到更真实的游戏表现,使其适配各类动作、地形和突发情况。

  机遇与挑战并存

  看似变革性体验背后,其实需要耗费大量成本。

  一位兼具游戏跟AI背景的资深人士告诉笔者,AI的确可以有效提升游戏体验。掣肘在于,样本大、训练成本高。

  像《王者荣耀》这类大DAU,高流水竞技性产品,固然可以一试。对于中型体量产品而言,往往不太划算。

  一位创业游戏公司高层说,小样本模型效果不错的话,拿几千万尝试也不是没有可能。换言之,大样本模型,让企业望而却步。

  眼下业界常讨论AGI(通用人工智能),可产品灵活性仍是一大难题。

  DeepMind遇到成本、灵活性困境,无疑最具代表性。

500

  据估算,AlphaGo整体训练成本高达3500万美元,消耗能量足以支持12760个人类大脑在三天内不眠不休地工作。

  在备受关注的《星际争霸》项目上,DeepMind也遭遇了类似难题。

  2019年2月28日凌晨,DeepMind旗下游戏AI AlphaStar,以5比0大比分,击败了世界上最强大的职业星际争霸玩家之一。当时它被视为突破人类智力的最后阵地。

  通常情况下,训练AlphaStar需要使用Google v3 TPU,用以支撑数千个《星际争霸II》协同运行。

  AlphaStar共对战14天,每个代理使用16个TPU。在培训期间,每个智能体都经历了长达200年的实时游戏。

  粗略估算下来,训练成本达到数百万美元。抛开成本不谈,AlphaStar灵活性亦备受质疑。

  纽约大学心理学系教授Gary F. Marcus认为,上述方案限制重重。在单一地图上使用同一“种族”进行对战时,其成绩确实优于人类。

  不过一旦在其它地图使用不同“种族”时,表现就要差很多。要想切换操作风格,必须得从头开始重新训练AlphaStar。

  简言之,即系统缺乏足够的灵活性。这一特性会让DeepMind训练成本迅速放大。

  数据不会说谎。根据去年年底DeepMind向英国公司注册局备案提交的最新财务报告。

  报告显示,近三年DeepMind亏损额分别为4.77亿英镑(2019);4.702亿英镑 (2018);3.02亿英礡(2017)。

  营收方面,2019年DeepMind收入达2.66亿英镑;2018年达到1.03亿英镑;2017年营收为5442万英镑。

  综合近三年业绩表现,不难发现DeepMind营收确系稳步增长,亏损敞口逐步收小。不过需要指出的是,DeepMind大部分客户依赖于母公司Alphabet旗下关联公司。

  某种程度上,这也说明DeepMind商业化还有非常高的提升空间。AI龙头企业尚且如此,国内AI游戏厂商估计也大差不差。

  只有有效解决样本、成本、灵活性等问题,AI游戏才会真正大爆发。

全部专栏