连续三年站上GDC演讲台，魔方分享了哪些黑科技？

游戏研究社
游戏研究社官方账号

03-18 09:16

500

2025年的GDC上，《暗区突围》的F.A.C.U.L.AI队友给了我很深的印象。当时行业里的AI队友普遍还处在"仅限聊天"的水平上，F.A.C.U.L.却相当领先地实现了游戏内交互，准确识别对象和游戏中的物理世界，由此带来的沉浸感的提升，颇有"次世代"的感觉。

500

因此，对于今年GDC魔方工作室还会带来什么有意思的技术分享，我是比较期待的。结果魔方一口气带来了三个演讲议题，从动作和声音设计，图形性能优化等方面，全方位分享了他们的最新成果，这也是魔方第三年被GDC官方邀请参加主论坛，干货一如既往地多。

昨天我们讲了今年GDC上的中国游戏厂商如何向国外从业者分享高效的游戏制作管线。现场的情景有点儿三十年河东，三十年河西——5年前国内还在仰望国外的游戏制作管线，但随着国内大型项目的不断成熟，协调数百人高效开发游戏项目的经验反而开始向外输出。而现在AI工具的引入更是加速了这个趋势，这不仅能从腾讯在GDC上二十多场主题上可以看出来，从魔方的这三个演讲议题上更是可见一斑。

500

异人之下：

基于实时AI生成技术的功夫动作系统

动作格斗游戏能从AI获得什么加成？

魔方在两年前参加GDC时就给出过一个答案：更先进的AI对手。

这里容易有一个歧义，格斗游戏的AI对手是个古老的概念，从街机时代开始，只要是电脑控制的对手，玩家都可以统称为AI。但此AI非彼AI，它们之间的区别，比人类和AI之间的距离都要遥远。

传统格斗游戏的AI通常依赖人工脚本、有限状态机或行为树，本质上是条件触发式的反应逻辑——玩家起跳时升龙、近身时抓取。这些行为模式通过预设规则实现，难度提升往往通过加快反应速度或读玩家输入来实现，某种程度上是一种“作弊”式的设计。

而魔方在2024年GDC上展示的火影忍者手游AI对手，则是类似AlphaGo的思路——AI能够在多维度上进行实时博弈决策，考量技能和距离因素、预测动作和连段可能性，且在对抗过程中会动态调整策略，而非重复固定的套路。

500

由于这种AI在攻击范围和伤害数值上与玩家保持一致，AI不会提前获知玩家输入、不具备0帧反应能力、也不会出现无限连或无限防这类破坏平衡性的机制，这就使得AI更接近一个高质量的陪练角色，而非无太多实战意义的人机。

到了《异人之下》里，情况又发生了变化。此时AI的应用转移到了后方——开发管线中。

《异人之下》是一款3D格斗游戏，又融入了传统东方武术，如何在高速战斗中保持精准的动作和地道的架势，光靠传统的制作方式，有着很多的掣肘。

首先是容易动作转场不自然，比如角色从战斗切换到待机、从攻击切换到奔跑等，若是传统做法完善这些过渡动作，要么选择插值算法，但容易脚部滑步，要么选择动画师手动K，代价是成本高且覆盖率有限。

500

此外，对于脚部滑步的问题，传统方案是事后补救，玩家很容易就能看出脚在地面上"蹭"而不是"走"。同时传统方案还有一个动作游戏的老大难问题——武器穿模。

根据魔方工作室群AI团队负责人廖诗飏的分享，团队的做法是让AI实时生成过渡帧。具体来说，他们训练了一个两阶段Transformer模型：第一阶段生成关键帧，第二阶段用扩散模型补全中间帧。推理时用循环回归的方式，一帧一帧地输出。

这套系统让上述问题得以迎刃而解：能让脚自然地落在地面上，该抬脚时抬脚，解决滑步问题；AI可以预测什么样的轨迹会导致武器穿模，因此能提前规避；状态回归则让角色长距离移动后能够自然地回到待机姿态。

500

除了角色动作更自然了，整个开发管线中的动画工作量也可以降低75%之多。魔方用一系列数据展示了悬殊的对比：和过去繁琐昂贵的动作捕捉不同，新系统下最少只用7个GoPro即可完成高精度无标记点动捕，动作捕捉时间从30分钟缩短到5分钟，精修时间从1小时缩短到15分钟，素材库则从930条缩减到445条。

值得注意的，即便引入了即时AI推理，量化后的模型在移动端完成一次推理也只需要0.4毫秒，几乎不会给玩家增加任何可感知的延迟。

500

这种对格斗细节"较真"，也让魔方成了现在国内格斗基因最“重”的制作组，不仅火影和异人横跨2D和3D格斗，也实实在在潜移默化地影响了一代玩家。

前段时间我在抖音上刷到过几次"火影忍者单挑免费吃包子"。具体是成都有个卖包子的摊主推出了一个规则，顾客可以在《火影忍者》手游中与摊主单挑，赢了就能免费吃一笼包子，输了就得购买一笼。一时间挑战者甚众，但由于摊主其实是PVP高手（段位约3200分），挑战者大多纷纷落败。

500

保守估计，那段时间挑战包子系列视频在抖音上有上千万播放，我在浏览评论区时也能明显感受到，《火影忍者》手游里的PVP格斗已经成了国内新一代玩家的KOF，不仅群众基础深厚，也衍生出了非常庞大的竞技文化与讨论氛围。

而这一切，在工作室决定十年如一日地完善细节时，或许便已经注定了。

洛克王国世界：

高性能全局光照方案的最佳实践

坦白说，在今年的GDC之前，我没想到一个困扰游戏行业多年的图像性能优化问题，会被《洛克王国：世界》背后的技术团队提出新解法。

简单来说，魔方的技术专家们试图解决这款大世界游戏开发中的一个重要痛点：光照烘焙。

500

这两年很多玩家已经有所察觉：游戏画面技术进入了一个尴尬期，时不时会有人翻出10年前的3A游戏，然后发现和现在的游戏相比也并不过时，性能需求却比现在少了好几倍。之所以对比这么悬殊，很大程度上是因为，现在越来越多的游戏依赖于光追和引擎现成的光照方案。

大家都知道光追效果好，但光追很吃显卡性能。在光追时代之前，游戏厂商用烘焙的方式处理光照效果，对性能要求不高，但非常耗费人力，因为相当于把每一张光影照片都手工画在了建模上。玩家倒霉就倒霉在，现在是个青黄不接的时代，想要通过光追实现较好的画面表现，所需的硬件设备依然比较昂贵，而主流厂商却已经不愿意在烘焙上投入很多精力。优化不够，纯靠超分和帧生成硬撑，各种优化问题已经引起了很多舆论反噬，出现了不少阴谋论的说法。

500

最近发售的《生化危机9》全开光追格蕾丝很美，但网上流传更多的却是硬件性能不够便没资格美丽的段子

虽然网上不少人都在怀念其实过去的画面又好看又省性能，但行业已经回不去了，已经没有多少厂商愿意继续精心烘焙光影。

究其原因，传统的本地烘焙模式不仅重，而且十分低效。魔方在分享中提到，在未改造系统前，许多项目组依赖商业引擎原生的本地预计算模式，单单离线计算一个建筑的光照就需要半小时起步。而对于成百上千个建筑的大世界游戏，跑完一整个光照流水线往往需要30多个小时——这意味着美术人员在三天内都无法看到完整的画面效果。

魔方团队通过将AI与计算机图形学结合，和腾讯游戏的MagicDawn团队一起打造的跨引擎光照解决方案，正试图解决这个问题。

500

MagicDawn方案简单来说，是帮助游戏开发商大大降低烘焙光照的成本。先利用云端的 RTX 显卡根据实时路径光追跑一遍正确的光影渲染，通过AI技术学习并压缩多套静态光照数据，再在引擎运行时进行高效的AI推理，实现高达1:30的压缩率，显著降低了包体体积和传输成本，从而在移动端和PC全平台上实现更好的高性价比的光影效果。

从核心提效数据来看，这种基于云端并发与 AI 渲染的架构实现了近百倍的突破。根据魔方给出的实测结果，目前 95% 的离线计算任务在 5 分钟内即可完成，大部分任务甚至在 3 分钟内就能结束。这个方案也切实抓住了当前游戏画面技术的一个痛点，既然硬件发展已经放缓，那么用云服务和 AI 赋能开发管线，便是一种相当讨巧的解决办法。

500

目前 MagicDawn 已封装为美术可直接使用的管线工具，并应用在了魔方的《洛克王国世界》《暗区突围》和库洛的《鸣潮》中。

洛克王国世界：

为500多只精灵塑造全面的声音世界

如果说光照解决的是"看得舒服"，那么声音解决的就是"听得进去"。

在大多数游戏项目中，为几十个角色制作配音已是相当繁重的工作。而《洛克王国：世界》面对的是一个截然不同的命题：500多种精灵，每一只都需要拥有连贯、立体、能够与环境互动的声音。这不是简单的"每个角色配一段音效"就能解决的问题，需要一整套标准化声音生态系统的支撑。

魔方工作室群音频策划负责人曾润航与POSTRED音频动画负责人Luka Lebanidze在分享中，讲解了团队如何在保证独特声音特性的同时，建立一套可扩展的设计架构。

演讲现场演示了一段专业严谨又妙趣横生的“配音”幕后工作视频

在确定每只精灵音色之前，精灵们会先获得一份标准化简报，明确它的特征、个性，并以此推敲其专属的声音纹理。团队利用“情感轮”工具来规划精灵在不同状态下的声音表现，例如在“喜、怒、哀”等核心情感上先制作Demo并建立反馈循环，以此来尽快锁定每只精灵的声学基因。

500

进入执行阶段后，每只精灵会被拆解为19种情绪的叫声和动作音效，并为每种状态提供至少3个音效变体，以消除玩家听觉上的重复感。

从上文的视频中你也能发现，很多声音的基础素材来自录音棚录制。这里有个热知识，其实声音也是有恐怖谷效应的——比如有些录音素材，会让人觉察到是由人类的喉咙在扭曲状态下发出的，这对精灵世界的代入感显然会有影响。因此，将人类的模仿音、真实动物录音、乐器采样乃至合成器进行多维度融合，才能创造出既具亲和力又具质感的精灵音效。

500

演讲现场用了一个具体的“声音配方”来说明了这系统的运作逻辑——要合成精灵波多希的声音，系统需要调用的声音素材来源如下：

器乐声占20%

人声占15%；

狮子咆哮占15%；

机械声占20%；

猪叫声占20%。

500

这些素材来自不同的录音批次，经过切片、变调、滤波处理后，混合成一个全新的愤怒声音。管线中也包含了“横向”与“纵向”的差异化处理：横向确保即使是同物种（例如不同属性的狐狸）也能拥有完全不同的声纹，具备鲜明的辨识度；纵向则对应精灵的进化路径，确保声音会随着精灵体型和力量的变化而改变。

最终，这个项目产出了50000多个独特声音。

500

其实从两场GDC演讲也能看出来，作为以精灵生态为核心的产品，《洛克王国：世界》致力于在音画两个核心体验上，共同构筑出鲜活生动的精灵世界。

结语

连续三年入选GDC主论坛，从魔方分享的议题中，能呈现出一条清晰的演进线：2024年讲强化学习格斗AI，2025年讲F.A.C.U.L.语音交互AI队友，今年则是动作生成、标准化音频和光照优化。一个显著的变化是：过去两年是"AI in Game"——玩家能直接感知到AI的存在；今年更多是"AI for Game"——AI隐藏在开发管线中，用来实现提效和流程简化。

从中也能看出魔方"技术服务内容"的底层逻辑——不是为了追新而追新，技术迭代是为了解决痛点或者满足实际需求。某种程度上，这也折射出中国游戏技术话语权的改变——从输出产品走向输出方法论甚至技术支持。这条路，才刚刚开始。

ACG 举报

游戏研究社

3526篇文章 | 62253人关注

+关注

观察者网用户社区

作者文章查看全部>>

热门搜索

搜索历史

连续三年站上GDC演讲台，魔方分享了哪些黑科技？

游戏研究社
游戏研究社官方账号

游戏研究社

热点

站务

观察者网评论

2026年十大预测，这些期待是否会发生？

风闻社区小助手_小风

全场景数码消费指南：风闻「数码情报局」邀你当消费裁判！

最近更新的专栏

风闻最热

全部专栏

热门搜索

搜索历史

连续三年站上GDC演讲台，魔方分享了哪些黑科技？

游戏研究社 游戏研究社官方账号

热点

站务

最近更新的专栏

风闻最热

全部专栏

游戏研究社
游戏研究社官方账号