今年看了100个神级AI短片,我宣布这个90后最能“打”(独家专访)

4分钟一镜到底
就这个炫技爽!
文 | 子路
编辑 | 子路、小小树
AI短片进化速度快得惊人。
11月5日,腾讯视频首届AI短片创作大赛公开获奖结果,二等奖作品《聊斋志异:燕赤霞》(以下简称《燕赤霞》)引起许多观众注意,在超创同行内部也引发了不小的讨论。
截至发稿,全网播放量已破400万。
这部4分钟国风水墨AI动画短片故事并不复杂,讲述道士燕赤霞起初无差别灭妖,蒙受诅咒后意外捡到女婴小妖,在日常相处中逐渐丰盈道心、辨别善恶,从杀妖到护妖的转变过程。
但不同于常规用慢镜头玩新概念的AI视频,《燕赤霞》全程采用一镜到底,罕见使用了密集的打斗动作,基本保证了人物场景一致性、物理运动准确度,画面观感格外流畅。
这是AI能达到的水平?

△ 打斗画面超出预期
我们注意到,《燕赤霞》作者在9月19日发布了首部国风水墨AI动画短片《花木兰》,彼时就已经技惊四座,成为海螺AI官方推荐的二创标杆作品,作者本人也拿到了“最佳导演”奖。
与之相比,《燕赤霞》则在人物动作连贯性(脚部运动镜头等)、分镜复杂度等方面显著提升了一个台阶。
再到今天最新发布的同系列国风AI动画《猫将军》,帧率、画质、打斗动作稳定性方面相比前作又有明显进步,并且挑战了“猫头人身”口型绑定的全新难度。



△ 《花木兰》《燕赤霞》《猫将军》运动画面效果越来越好
短短一个半月,就实现了显著的技术迭代,这位超创及背后团队是如何做到的?
在真人CG画风占据主流的当下,他为什么选择了中式水墨画风?
对耕耘在一线的超创而言,当下AI大模型最主要的痛点是什么?
AI短片商业前景如何?
对此,我们独家专访了《花木兰》《燕赤霞》《猫将军》编导超创、光影几何工作室AIGC创意主理人“猫大人爱睡大觉”(以下简称猫大人)。

光影几何工作室AIGC创意主理人 猫大人
从他的分享中,我们可能发现了下个阶段AI大模型整体迭代的秘密。
01 自研集成AI工作流,效率迅速提升50%
如果不是追求一镜到底,《燕赤霞》的难度至少能降低60%。
猫大人是个90后男生,入局AI之前,他曾在顽态ONETIME担任视觉艺术总监,擅长3D建模、角色绑定动画等,快节奏打斗是他标志性的作品特色。
最关键的技术支持,是海螺AI于8月29日上线的首尾帧功能。只要首尾两张图加上提示词,就能生成补足元素、动作连贯流畅且跟随主体镜头的视频画面。

△ 海螺AI上线的首尾帧功能十分强大
仅仅半个月之前,猫大人还在为快节奏打斗AI短片的高难度“愁到头秃”。
他制作的国风武侠AI短片《江湖》也强调打斗画面,纯粹用首帧生成,但即便忙了一个月,成品依然会出现“双人击剑碰撞落空”等瑕疵。

△ 《江湖》打斗画面在8月中已属头部质感
首尾帧技术,可以说是近三个月AI视频大模型最关键的一次迭代。
大家知道AI生成视频手脚细节是最容易穿帮的,现在只要确定首尾帧,就能保留人物手部等细节内容变化的一致性,不会脱离角色长相。
新功能刚上线,猫大人就应用在了动画新作《花木兰》里,得以实现《木兰辞》“朔气传金柝,寒光照铁衣”的热血与恢弘。

△ AI动画版花木兰战斗画面燃爆了
《花木兰》反响颇佳,他就琢磨在下一部作品里挑战质感更好的一镜到底。
我们团队想做的内容,都是希望把AI的极限给探索出来。
“切镜头动画”我已经在游戏宣发AI短片《邪恶馈赠》里试过了,觉得挑战力度不大,那当然想试试影视人都觉得厉害的一镜到底。

△ 《邪恶馈赠》切镜头效果
写剧本、设计生成燕赤霞角色形象、抽卡、打磨分镜、剪辑……猫大人一个人用10天制作完成动画部分。
随后邀请已在《花木兰》中达成合作的民乐团“离谱琴社”原创音乐、专业CV老师进行配音、最终后期混音母带,耗时约两周,生成完整版《燕赤霞》,进一步夯实光影几何工作室国风AI动画赛道的独特性。

△ 《燕赤霞》角色形象设计/受访者供图
他对《燕赤霞》效率仍不满意,猫大人透露,今年4月起,光影几何工作室的编程团队就着力开发工具,相当于一个游戏插件,将市面上所有生成式AI大模型集成在同一个节点式工作流里,可以大幅提高工作效率。
举个例子,正常主创想做一个AI短片,首先要在A平台注册、登陆、充值才能抽卡,如果生成图片不满意,又要打开B平台注册、登陆、充值、调整提示词……
再加上后续视频生成,每个AI模型各有优势,做打斗要去A、做空镜最好是B、口型绑定又要去C……那反复调试就是一个非常繁琐的过程。
我们内部的工具打通了与各个模型的合作,可以直接用一张图作为一个节点,同开所有AI大模型,每个分镜都能打一个组来排列每个跟进的镜头,甚至可以一个网页同时跑200个视频。
这样不管是改图还是打磨分镜,都能直接博采众长,快速生成符合需求的高品质AI视频。


△ 光影几何内部集成AI工作流/受访者供图
该工具于近期测试完成,已经应用在猫大人新作《猫将军》里。
同样是国风水墨AI短片,同样一人成军完成动画部分,《燕赤霞》用了10天,那么应用全新集成AI工具的《猫将军》用了多久呢?
5天。
50%的直接效率提升,成片质感不减反增,打斗动作稳定性、画质、帧率等都得到了明显进阶。
就像几年前民间编程大佬基于Stable Diffusion开源设计的ComfyUI文生图、文生动图工作流,再由B站秋葉大神整合成可以自动调用插件的绘世启动器,甚至可以帮助新手从零开始入门AI绘画。
据猫大人介绍,市面上还没有其他团队开发出这种集成AI工作流工具。
但显然,“百家争鸣”之后,“万法归一”或将成为绝对的主流。
设想一下,如果市面上所有AI视频内容效率提升速度再加快一倍,将会迭代出多少可能性?很难不让人热血沸腾。
02 冲冠一怒,做与众不同的AI国漫宇宙
一连三部作品,猫大人和光影几何团队已经成了国风水墨AI动画赛道的领军人物。
最初入局AI,他也尝试过真人写实、CG游戏、仙侠动漫等多种画风,比如7月份专门为爱奇艺比赛“共生”主题制作的短片《温度》,尝试探讨智能机器人与养老问题。
决定深度投入国风水墨AI动画赛道,当然有考虑到2D水墨画风实现难度较低、对故事的承载效果更好,还可以有效避免真人肖像权、版权等潜在问题。
最关键的契机,则是一个“冲冠一怒”的故事。
9月17日,迪士尼、康卡斯特旗下环球影业与华纳兄弟探索在加州联邦地方法院共同起诉,指控中国人工智能公司MiniMax旗下的海螺AI服务严重侵犯版权。

△ 迪士尼等公司指控海螺AI服务严重侵犯版权
随后,相关AI平台对版权问题更加敏感。当时猫大人团队正在尝试制作《花木兰》AI短片,竟然会被网友问到“花木兰是中国的吗”这种问题,让他觉得荒谬且愤怒。
我感觉这已经是一种文化入侵,所以我们憋了一口气,一定要把中国的传统文化融入到最先进的AI影视内容中,做出更好的作品。

△ 作品中融入主创心声
所以除了使用最新首尾帧技术尽可能呈现激烈打斗效果之外,光影几何还用超额预算邀请“离谱琴社”的民乐老师原创音乐,融入琵琶、二胡、唢呐、鼓等中国传统民乐乐器,营造最适配的中国风氛围感。
算一笔经济账大家就知道了,我们团队AI视频对外报价一分钟一万到一万五,乐团报价一分钟两万,最后《花木兰》整体费用达到六位数。
如果只是做一个普通作品,我们这种小团队其实没有必要去承担这个成本。

△ “离谱琴社”民乐老师/受访者供图
大概拥有同样热爱的人群总是相似的,合作下来,民乐团老师比较认同他们的理念,决定和光影几何工作室组成一个固定团队,以成本价共同探索国风AI动画内容的上限。
团队内容布局卷轴初展,除了刚刚发布、改编自中国古代传说的《猫将军》,新作《后羿射日》已经在开发中。

△ 《后羿射日》抽卡效果/受访者供图
这部短片设定在新石器时代,融入祭祀、舞蹈等非遗元素。
表现手法也不仅仅局限在“水墨”一种,他们更倾向于在国风大前提下多维延伸触角,比如后续作品尝试游戏CG风格等,或许能做一个与众不同的“AI国漫宇宙”。

△ 国风角色+机械姬质感/受访者供图
编剧能力算是短板,我们目前以二创改编故事为主。
猫大人更倾向于从中国传统文化、经典影视作品中取材,一方面坚持团队初心,另一方面从商业角度考虑,二创已经具备观众认知基础和粉丝受众,推广难度更小,更有利于降低甲方风险。

△ 《燕赤霞》台词致敬徐克经典电影《倩女幽魂》
商业化,是每个AI视频团队都必须面临的问题。
除了承接甲方商单之外,猫大人介绍,《燕赤霞》已经接到了腾讯视频、B站等视频平台递来的橄榄枝,计划开发成60-90分钟的网络电影,其他作品也有计划开发成动画短剧。
加上集成AI工具流显著提高的内容效率,AI影视的可延展性被进一步拔高。
03 分辨率、混音是AI“硬伤”,影视人最好尽快入局AI
可惜做不了院线电影,AI视频分辨率被现有技术限制得太死了。
故事创意、画风、物理运动连贯性、任务场景一致性……关于AI的一切都在飞速迭代。
在猫大人看来,生成式AI视频大模型现在最大的硬伤,一个是分辨率,另一个是很多圈内人可能都没注意到的,混音。
分辨率是世界级难题,目前全球AI视频大模型分辨率都在1K左右,只能停留在小屏圈层。
他经常催促海螺官方技术人员快点解决这个问题:
把人家都催烦了。

△ 用IMAX格式观看斗法大场面也许会十分震撼
在现有分辨率下,混音问题其实对成片质感影响更大。
猫大人表示,很多不懂混音的AIGC制作人还没意识到,如果追求AI短片的高品质,就必须采用真人配音+后配音乐+混音母带。
AI直接生成配乐当然也可行,但观众能听出来,AI音乐缺乏力量感和情绪效果,乐器声太轻了,没有抑扬顿挫的感觉。
到混音阶段也会更困难,AI音乐存在EQ打架的问题,在同一个频率段上曲子会抢人声,导致声音浑浊或者失真。专业编曲就会知道要做避让。


△ 《猫将军》混音工作台/受访者供图
为什么他会特别注意混音问题?
人生际遇总在不经意间转弯,猫大人本科专业学的就是录音、混音,给本兮等歌手做过专辑;后续转行写了两三年网文;再度转行学习建模、角色绑定,才逐渐深入3D影视后期制作方面。
中间一度很迷茫,并不清楚自己的目标在哪里,就很机械地制作,努力生活呗。
通过AI我个人觉得找到了一个新的方向,尤其是做《花木兰》,好像此前所有的工作经验都在AI动画导演这个身份里融会贯通了,我能统筹把控每一个环节,达到最理想的效果。
一切都不一样了。

△ 《猫将军》抽卡效果/受访者供图
所以他非常建议泛影视人尽快入局AI,主动拥抱这一新工具,将其作为一种创作辅助手段,越早越好。
说到底使用AI是一种经验积累,比如抽卡提示词,你想要一个背对镜头的画面就不能有人物脸部描述、想要面部大特写就不能带一句手脚内容。
越早进入AI的逻辑,就越能得心应手地使用它。
2025年,AI视频完成了三步阶梯式跳跃。
从简单的ASMR超现实镜头(如“菜刀切地球”),到在已有影视作品的基础上二创整活儿玩梗的病毒视频(如“甄嬛掏出机关枪突突华妃”)。

△ 网友根据《甄嬛传》二创整活儿玩梗的病毒视频
再到这批已经具备故事深度、画面审美乃至声画结合,足以被称为“内容”的AI短片,更多长片已经在制作中。
AI浪潮已然势不可挡,也许现在这批“散兵游勇”式的AI超创,就会是下一个申奥、辛爽、郭帆、张艺谋。
光影与算法共舞,期待更多让内容更加精彩的“后浪”。



极客电影官方账号



