连续三年站上GDC演讲台,魔方分享了哪些黑科技?

500

2025年的GDC上,《暗区突围》的F.A.C.U.L.AI队友给了我很深的印象。当时行业里的AI队友普遍还处在"仅限聊天"的水平上,F.A.C.U.L.却相当领先地实现了游戏内交互,准确识别对象和游戏中的物理世界,由此带来的沉浸感的提升,颇有"次世代"的感觉。

500

因此,对于今年GDC魔方工作室还会带来什么有意思的技术分享,我是比较期待的。结果魔方一口气带来了三个演讲议题,从动作和声音设计,图形性能优化等方面,全方位分享了他们的最新成果,这也是魔方第三年被GDC官方邀请参加主论坛,干货一如既往地多。

昨天我们讲了今年GDC上的中国游戏厂商如何向国外从业者分享高效的游戏制作管线。现场的情景有点儿三十年河东,三十年河西——5年前国内还在仰望国外的游戏制作管线,但随着国内大型项目的不断成熟,协调数百人高效开发游戏项目的经验反而开始向外输出。而现在AI工具的引入更是加速了这个趋势,这不仅能从腾讯在GDC上二十多场主题上可以看出来,从魔方的这三个演讲议题上更是可见一斑。

500

异人之下:

基于实时AI生成技术的功夫动作系统

动作格斗游戏能从AI获得什么加成?

魔方在两年前参加GDC时就给出过一个答案:更先进的AI对手。

这里容易有一个歧义,格斗游戏的AI对手是个古老的概念,从街机时代开始,只要是电脑控制的对手,玩家都可以统称为AI。但此AI非彼AI,它们之间的区别,比人类和AI之间的距离都要遥远。

传统格斗游戏的AI通常依赖人工脚本、有限状态机或行为树,本质上是条件触发式的反应逻辑——玩家起跳时升龙、近身时抓取。这些行为模式通过预设规则实现,难度提升往往通过加快反应速度或读玩家输入来实现,某种程度上是一种“作弊”式的设计。

而魔方在2024年GDC上展示的火影忍者手游AI对手,则是类似AlphaGo的思路——AI能够在多维度上进行实时博弈决策,考量技能和距离因素、预测动作和连段可能性,且在对抗过程中会动态调整策略,而非重复固定的套路。

500

由于这种AI在攻击范围和伤害数值上与玩家保持一致,AI不会提前获知玩家输入、不具备0帧反应能力、也不会出现无限连或无限防这类破坏平衡性的机制,这就使得AI更接近一个高质量的陪练角色,而非无太多实战意义的人机。

到了《异人之下》里,情况又发生了变化。此时AI的应用转移到了后方——开发管线中。

《异人之下》是一款3D格斗游戏,又融入了传统东方武术,如何在高速战斗中保持精准的动作和地道的架势,光靠传统的制作方式,有着很多的掣肘。

首先是容易动作转场不自然,比如角色从战斗切换到待机、从攻击切换到奔跑等,若是传统做法完善这些过渡动作,要么选择插值算法,但容易脚部滑步,要么选择动画师手动K,代价是成本高且覆盖率有限。

500

此外,对于脚部滑步的问题,传统方案是事后补救,玩家很容易就能看出脚在地面上"蹭"而不是"走"。同时传统方案还有一个动作游戏的老大难问题——武器穿模。

根据魔方工作室群AI团队负责人廖诗飏的分享,团队的做法是让AI实时生成过渡帧。具体来说,他们训练了一个两阶段Transformer模型:第一阶段生成关键帧,第二阶段用扩散模型补全中间帧。推理时用循环回归的方式,一帧一帧地输出。

这套系统让上述问题得以迎刃而解:能让脚自然地落在地面上,该抬脚时抬脚,解决滑步问题;AI可以预测什么样的轨迹会导致武器穿模,因此能提前规避;状态回归则让角色长距离移动后能够自然地回到待机姿态。

500

除了角色动作更自然了,整个开发管线中的动画工作量也可以降低75%之多。魔方用一系列数据展示了悬殊的对比:和过去繁琐昂贵的动作捕捉不同,新系统下最少只用7个GoPro即可完成高精度无标记点动捕,动作捕捉时间从30分钟缩短到5分钟,精修时间从1小时缩短到15分钟,素材库则从930条缩减到445条。

值得注意的,即便引入了即时AI推理,量化后的模型在移动端完成一次推理也只需要0.4毫秒,几乎不会给玩家增加任何可感知的延迟。

500

这种对格斗细节"较真",也让魔方成了现在国内格斗基因最“重”的制作组,不仅火影和异人横跨2D和3D格斗,也实实在在潜移默化地影响了一代玩家。

前段时间我在抖音上刷到过几次"火影忍者单挑免费吃包子"。具体是成都有个卖包子的摊主推出了一个规则,顾客可以在《火影忍者》手游中与摊主单挑,赢了就能免费吃一笼包子,输了就得购买一笼。一时间挑战者甚众,但由于摊主其实是PVP高手(段位约3200分),挑战者大多纷纷落败。

500

保守估计,那段时间挑战包子系列视频在抖音上有上千万播放,我在浏览评论区时也能明显感受到,《火影忍者》手游里的PVP格斗已经成了国内新一代玩家的KOF,不仅群众基础深厚,也衍生出了非常庞大的竞技文化与讨论氛围。

而这一切,在工作室决定十年如一日地完善细节时,或许便已经注定了。

洛克王国世界:

高性能全局光照方案的最佳实践

坦白说,在今年的GDC之前,我没想到一个困扰游戏行业多年的图像性能优化问题,会被《洛克王国:世界》背后的技术团队提出新解法。

简单来说,魔方的技术专家们试图解决这款大世界游戏开发中的一个重要痛点:光照烘焙。

500

这两年很多玩家已经有所察觉:游戏画面技术进入了一个尴尬期,时不时会有人翻出10年前的3A游戏,然后发现和现在的游戏相比也并不过时,性能需求却比现在少了好几倍。之所以对比这么悬殊,很大程度上是因为,现在越来越多的游戏依赖于光追和引擎现成的光照方案。

大家都知道光追效果好,但光追很吃显卡性能。在光追时代之前,游戏厂商用烘焙的方式处理光照效果,对性能要求不高,但非常耗费人力,因为相当于把每一张光影照片都手工画在了建模上。玩家倒霉就倒霉在,现在是个青黄不接的时代,想要通过光追实现较好的画面表现,所需的硬件设备依然比较昂贵,而主流厂商却已经不愿意在烘焙上投入很多精力。优化不够,纯靠超分和帧生成硬撑,各种优化问题已经引起了很多舆论反噬,出现了不少阴谋论的说法。

500

最近发售的《生化危机9》全开光追格蕾丝很美,但网上流传更多的却是硬件性能不够便没资格美丽的段子

虽然网上不少人都在怀念其实过去的画面又好看又省性能,但行业已经回不去了,已经没有多少厂商愿意继续精心烘焙光影。

究其原因,传统的本地烘焙模式不仅重,而且十分低效。魔方在分享中提到,在未改造系统前,许多项目组依赖商业引擎原生的本地预计算模式,单单离线计算一个建筑的光照就需要半小时起步。而对于成百上千个建筑的大世界游戏,跑完一整个光照流水线往往需要30多个小时——这意味着美术人员在三天内都无法看到完整的画面效果。

魔方团队通过将AI与计算机图形学结合,和腾讯游戏的MagicDawn团队一起打造的跨引擎光照解决方案,正试图解决这个问题。

500

MagicDawn方案简单来说,是帮助游戏开发商大大降低烘焙光照的成本。先利用云端的 RTX 显卡根据实时路径光追跑一遍正确的光影渲染,通过AI技术学习并压缩多套静态光照数据,再在引擎运行时进行高效的AI推理,实现高达1:30的压缩率,显著降低了包体体积和传输成本,从而在移动端和PC全平台上实现更好的高性价比的光影效果。

从核心提效数据来看,这种基于云端并发与 AI 渲染的架构实现了近百倍的突破。根据魔方给出的实测结果,目前 95% 的离线计算任务在 5 分钟内即可完成,大部分任务甚至在 3 分钟内就能结束。 这个方案也切实抓住了当前游戏画面技术的一个痛点,既然硬件发展已经放缓,那么用云服务和 AI 赋能开发管线,便是一种相当讨巧的解决办法。

500

目前 MagicDawn 已封装为美术可直接使用的管线工具,并应用在了魔方的《洛克王国世界》《暗区突围》和库洛的《鸣潮》中。

洛克王国世界:

为500多只精灵塑造全面的声音世界

如果说光照解决的是"看得舒服",那么声音解决的就是"听得进去"。

在大多数游戏项目中,为几十个角色制作配音已是相当繁重的工作。而《洛克王国:世界》面对的是一个截然不同的命题:500多种精灵,每一只都需要拥有连贯、立体、能够与环境互动的声音。这不是简单的"每个角色配一段音效"就能解决的问题,需要一整套标准化声音生态系统的支撑。

魔方工作室群音频策划负责人曾润航与POSTRED音频动画负责人Luka Lebanidze在分享中,讲解了团队如何在保证独特声音特性的同时,建立一套可扩展的设计架构。

演讲现场演示了一段专业严谨又妙趣横生的“配音”幕后工作视频

在确定每只精灵音色之前,精灵们会先获得一份标准化简报,明确它的特征、个性,并以此推敲其专属的声音纹理。团队利用“情感轮”工具来规划精灵在不同状态下的声音表现,例如在“喜、怒、哀”等核心情感上先制作Demo并建立反馈循环,以此来尽快锁定每只精灵的声学基因。

500

进入执行阶段后,每只精灵会被拆解为19种情绪的叫声和动作音效,并为每种状态提供至少3个音效变体,以消除玩家听觉上的重复感。

从上文的视频中你也能发现,很多声音的基础素材来自录音棚录制。这里有个热知识,其实声音也是有恐怖谷效应的——比如有些录音素材,会让人觉察到是由人类的喉咙在扭曲状态下发出的,这对精灵世界的代入感显然会有影响。因此,将人类的模仿音、真实动物录音、乐器采样乃至合成器进行多维度融合,才能创造出既具亲和力又具质感的精灵音效。

500

演讲现场用了一个具体的“声音配方”来说明了这系统的运作逻辑——要合成精灵波多希的声音,系统需要调用的声音素材来源如下:

器乐声占20%

人声占15%;

狮子咆哮占15%;

机械声占20%;

猪叫声占20%。

500

这些素材来自不同的录音批次,经过切片、变调、滤波处理后,混合成一个全新的愤怒声音。管线中也包含了“横向”与“纵向”的差异化处理:横向确保即使是同物种(例如不同属性的狐狸)也能拥有完全不同的声纹,具备鲜明的辨识度;纵向则对应精灵的进化路径,确保声音会随着精灵体型和力量的变化而改变。

最终,这个项目产出了50000多个独特声音。

500

其实从两场GDC演讲也能看出来,作为以精灵生态为核心的产品,《洛克王国:世界》致力于在音画两个核心体验上,共同构筑出鲜活生动的精灵世界。

结语

连续三年入选GDC主论坛,从魔方分享的议题中,能呈现出一条清晰的演进线:2024年讲强化学习格斗AI,2025年讲F.A.C.U.L.语音交互AI队友,今年则是动作生成、标准化音频和光照优化。一个显著的变化是:过去两年是"AI in Game"——玩家能直接感知到AI的存在;今年更多是"AI for Game"——AI隐藏在开发管线中,用来实现提效和流程简化。

从中也能看出魔方"技术服务内容"的底层逻辑——不是为了追新而追新,技术迭代是为了解决痛点或者满足实际需求。某种程度上,这也折射出中国游戏技术话语权的改变——从输出产品走向输出方法论甚至技术支持。这条路,才刚刚开始。

站务

全部专栏