吴京打啵,紫薇吃瓜,国产大模型集体上桌了?

01:AI大抽象时代

AI视频已经发展到了让人眼前一黑的阶段了,只要你看过下面这段视频,你一定明白我在说什么。

AI短短几秒的改动,就把冷饭炒成了大粪

乍看前几秒,你或许以为是2023年初走红的昊京(本名“孙国帅”,曾担任过吴京的替身)又在炒冷饭了,但现在的你,想必在跪求一双没看过它的眼睛。

创作者用了既在意料之外,又不在情理之中的方式,污染了人民群众的眼睛,吴京看了都要报警的程度。

好消息,这是AI生成的,坏消息,类似的作品还有不少。

500

如果说,用AI视频技术让尘封已久的老照片活过来,是人文关怀极佳的一种应用方式,那近期互联网上井喷的逆天AI视频,就是打开了AI抽象时代的潘多拉魔盒。

再不阻止国产AI,它们就要逆天了!!!

当你打开短视频的推送,从发现小猫吃面时的疑惑,到发现熊猫吃饭时的震惊、老虎吃火锅时的无语、狮子跳舞时的无奈,不禁心想:“这手机爹又™给我干哪儿来了?”

500

“视频不能是P的,所以是真的”

这还只是开胃小菜,随着像快手旗下的“可灵Kling”,以及字节旗下的“即梦Dreamina”等国产大模型的入局,国产AI视频的创作动力算是彻底释放了。

过去只能截图加字做表情包的影视桥段,现在动动手指头就能实现天马行空的恶搞,还不用依仗PS和AE拼技术力。

所以你能看到戴墨镜、吃拉面、接电话、戴耳机的尔康。

500

尔康成了“百变星君”,但耳机穿模了

也能观赏到与紫薇相处愉快,生怕紫薇少吃一口饿死了的贴心容嬷嬷。

500

看得出来,吃到西瓜的时候,紫薇终于吃饱了

以往经典影视桥段中的一张截图就能根据指示词变幻起来。

无论是甄嬛传里吃雪糕的钮祜禄氏,还是啃着鸡腿忘了骂毒妇的皇上、举枪物理超度众生的唐长老、用智能手机摇人捉妖的齐天大圣,都让网友顿感中了赛博幻术。

500

随着网友脑洞的不断突破,连正常历史的时间线都能被AI篡改戏说。

被誉为“五学”的韩剧《第五共和国》,原本与正史符合的剧情——金载圭“除虫射日”(刺杀朴正熙),但被网友用AI制作成了“朴正熙反杀刺客金部长”,让经典“下克上”的传统被完全逆转。

500

高木正雄(朴正熙日语名)毕竟当过军官,会用枪反杀很正常吧

随着更多AI抽象作品的出现,网友们的创造潜力彻底被释放。

AI或许是最强大的生产力工具,但是在构思邪门内容这条赛道上,它永远代替不了人类。

何况现在已经过了抛砖引玉的阶段,直接实现了“人传人”。

继昊京打啵之后,各种双人场景都难逃AI之手。

500

《杀破狼》中的正牌吴京已在AI的撺掇下与甄子丹热吻上了

我们仍未知道,那天华强和瓜摊老板到底发生了什么事。

500

也无法解释花无缺和小鱼儿之间,到底是友情还是爱情。‘

500

不出意外,李云龙Kiss楚云飞的画面很快就能看到,或许过不了几日,微信群聊中就能出现各种同性/异性好友深情热吻的恶搞视频了。

有位B站up主“咪克菌” 1:1 还原了央视七套经典节目《致富经》,给我国乡村振兴的未来发展方向提供了新思路......

看看眼前这些活灵活现的恐龙,不仅长得可爱,经济效益也高,通过大棚养殖恐龙,不少农民走向了脱贫致富的道路......

500

500

相比起恐龙养殖,异形的驯化之路更具挑战,但在我国农民的持续攻坚下(仅仅损失了几十位村民),驯化异形的壮举最终还是实现了。

500

500

在AI镜头加持下,原本凶猛的异形、恐龙,一下子变得平易近人,大大提高了广大养殖户对于这些新物种的接受程度,为它们后续大范围进入养殖场铺平了道路,很好地把AI前沿技术和农牧业生产的实际应用结合了起来......

如果说以上AI恶搞都算是正常范畴内的抽象发挥,那像“天宫仙女版奥特曼”这种内容则能让你彻底拜服在碳基生物创造力下,云南毒蘑菇对于人类大脑的影响,毕竟还是太大了。

500

“笑口常开”

那么在这场狂欢背后,国产大模型究竟是如何发力的?

02:风水轮流转

自AI技术迈入公众视野开始,国内整个AI圈子长期都有一种“没有功劳也有苦劳”的尴尬感。

即使陆续推出了国产的“通用大语言模型”、“文生图大语言模型”等对标产品,但在舆论与用户感知当中,国产AI就是一直被OpenAI碾压,很多时候都被充当“人工智障”对待。

500

知名贱嘴"人工智障",A.K.A赛博出生(畜生)——评论罗伯特

尤其是当年“文心一言”刚上线时还不稳定,靠一张“鱼香肉丝”的AI生图对决同期的Midjourney和DALL·E,让其形象在网友心中变得惨烈无比。

500

AI比网友还邪门的一集

而这波视频生成AI的出现,完全逆转了这一切。

倒反天罡了,现在轮到国外网友们求一个咱们的大模型账号了。

500

没手机号登录,直接求人帮忙生成

过去咱们没海外信用卡买不了ChatGPT会员的窘迫,如今在老外苦求中国手机号码的情景下反向重演了。

自今年6月份开始,以快手可灵“Kling”为代表的国产AI视频大模型陆续上线,但一开始并没有引起国内用户的广泛关注。

反倒是经过海外科技媒体与业内人士的多方测评后“出口转内销”,才将这些惊艳的生成视频传回国内,彻底掀起了排队测试潮。

500

业内人士评价:“中国拥有了巨大优势,懂的都懂”

虽说OpenAI在年初就用Sora的演示片段惊艳了全球,连央视台长都不禁惊呼“我们怎么办?”,但至今它还处于封闭内测状态,只有极少部分艺术家和业内人士能受邀使用。

毕竟对真实物理世界的理解与模拟,以及对超高精度画面细节的刻画需要耗费庞大的算力与资源,若是Sora按照这种生成标准一下子开放了,估计老黄的显卡都来不及生产。

500

光是皮肤纹理与墨镜反光的细节就能管中窥豹

诚然,Sora演示片可以说是至今仍然是AI生成视频的标杆,但大家毕竟用不上,远水解不了近渴,以至于有些按耐不住的网友都在怀疑OpenAI有没有在PPT画饼。

同时像Luma和Runway等现有大模型,大家用久了都审美疲劳,想体验下新货。

而“可灵”与“即梦”等国产AI视频大模型抓住了这个窗口期,一方面猛练模型效率,一方面亲民定位,降低使用限制。

500

“可灵”生成的AI必修课——威尔·史密斯吃意面

它们现阶段基础功能均免费,“可灵”不限制使用次数,每次可生成10秒视频,且最多可以扩展到长达2分钟的30帧1080p视频,在架构上,可灵采用的是跟 Sora 相同的 DiT (Diffusion Transformer)架构,用 Transformer 代替了传统扩散模型中基于卷积网络的 U-Net。

换句话说就是利用Transformer在处理和生成上的效率优势,在拟合能力和参数容量间找到一个均衡点,最终提升整体训练效率,抢跑了其他对手,率先交了卷。

500

Transformer模型,不仅保障了图像生成质量,还具有更好的扩展性与计算效率。

“即梦”因算力限制要稍显落后一点,在使用次数和生成时长上均有一定限制,但毕竟背靠的是字节,估计很快也会迎来大升级。

靠着这些技术投入,它们都极大地降低了中国人使用AI生成视频的门槛(像“可灵”即使在内测阶段需要排队,但开放力度已经算是半公测了),不用去外网也不用懂英文。

更重要的是,我们辛苦构思了视频做出来,肯定不能自己看,这两位直接是背靠快手和抖音两个短视频平台,AI视频生成彻底产品化,一步到位打通了创意=>生产=>分享=>传播的闭环。

500

快进到外公在群里问你:“这李云龙怎么也用上智能机了?”

这股风潮现在已经蔓延到了B站和视频号,说不定过不了多久,相亲相爱一家人群聊中都会出现了AI视频的身影,那时候才是长辈防骗的高风险期。

“文生视频”、“图生视频”、“视频续写”作为三大功能,其中高频使用的则是“图片生成视频”的功能,因其背靠短视频应用,娱乐场景更广,相比于基于纯文字生成,其前后更加连贯,画面也更加稳定。

前面提到的抽象AI视频大多数都是图生视频功能下的产物,部分以图生视频后拼接到原视频当中的形式呈现。

500

所以,这次创作井喷并非偶然,因为抖音快手洞悉了OpenAI在商业化上的短板(虽然Sam Altman短期不缺刀乐,但训练大模型是真烧钱),让国产大模型较早打通到短视频平台的天然流量池,真正满足了老百姓分享自己创意的需求,除了赚到了网络热度,还能反哺更多数据给AI。

况且本次国内大模型的实际效果不差,虽然比不过被称为“工业级”的Sora,但大致能和Luma、Runway等对手等量齐观。

相比于文字大模型,公众也对AI视频大模型宽容得多,毕竟两眼一黑的生成结果能被当做意外的笑料,所以这一轮基本没有铺天盖地的“人工智障”批评。

500

老人、地铁、吃手机

如果说抖音在试水AI上已经靠着豆包AI助手,以及宫崎骏电影滤镜,名侦探柯南滤镜等泛AI功能,逐步让用户拥抱新技术,掀起过多轮互联网话题,但这次是真没想到,居然被视作“土鳖”的快手抢先一步。

因为这波照样是快手擅长的“农村包围城市”,而在全球的“百模大战”中,咱们确实也需要自己的AI视频大模型。

03:不止于抽象

在AI时代里,一切变化都在瞬息间,后浪,前浪,难分你我。

在6月可灵风头正盛的时候,Luma发布最新的文生视频模型 Dream Machine,向所有用户免费开放使用,不仅增加了更为丰富的美学风格选项,还能快速生成5秒钟的电影级视觉画面;Runway则也发布了最新的Gen-3,自信宣称离“世界模型”又近了一步。

500

Runway Gen-3的官方演示画面

在这样的激烈竞争下,如今“可灵Kling”在海外的风头已经过去,但好在随着国内使用者的增多,更多作品与话题必将出现,一切才刚刚开始。

不过还是难言轻松,相比文字大模型,AI视频大模型需要耗费更多的算力资源,以及对模型的维度要求也更高,所以在技术上,国产大模型们仍需在打出产品化差异竞争的短暂红利期内迎头赶上。

这也不单单是关乎技术的竞争,文化上同样需要有适合中国人自己的AI视频大模型,起码要用足量的用中文互联网数据喂出来,不要粗暴地被全球各种数据污染了。

Luma、Runway等模型里的中国乃至亚洲素材不是太少,就是太刻板印象,很多时候中国人动着动着人种都变了,要么变欧美面孔,要么就成了南美人,毕竟国外大模型喂的数据都太杂了。

国外测评者就曾评价,相比国外的一众AI视频大模型,中国大模型开发者更理解本土文化,大模型生成的内容也更能满足本土用户的需求。

就像很多用户自己都发觉,可灵生成的视频当中,人物吃东西的动作就非常流畅稳定,不知道快手背后用了多少个吃播老铁的视频数据,论吃还得看中国人。

500

所以,我们确实需要立足于本国文化背景的大模型存在,这既能提升模型对于国内用户需求的准确响应度,更能推动中式AI艺术创作的发展。

近年来涌现出了一大批中国特色的热门AI作品,它们立足本国文化特色,借助AI实现了更多幻想中才有的场景,让人有一种脱离了现实,但又感觉就在身旁的熟悉感。

在这些作品中,我们能看见熟悉的乡土村庄中,村民们饲养起了西方经典科幻电影中的“异形”,用《致富经》的方式解构了“太空恐怖”,异形都变成了“老乡”。

500

“哥俩儿生异形啊(生意行啊)”      作者:咪克菌

这种奇异但毫无违和感的搭配,甚至体现在了村民用异形强酸唾液中和盐碱地的别样幽默当中。

500

往更灵更玄方向发展的创作也数不胜数,借鉴《山海经》中的“白泽”创造出了一种只可意会不可言传的中式幽寂感,“怪”却透露着宁静。(虽然AI粗暴地识别成白马了)

500

【新中式志怪】后室白泽    作者:海院业二

借鉴“怪核梦核”元素打造出的“新中式梦核”,营造出一种回忆中泛黄的熟悉感,看似灵异的画面,却是国人才会有共鸣的生活记忆元素,最终形成一种“温馨的疏离感”。

500

【新中式梦核】鱼葬-老家的习俗    作者:海院业二

更不要说众多把家里老照片拿出来AI加工,重温过去温情时刻的网友作品了。

500

500

500

无论是AI抽象视频,还是以AI为笔的奇思妙想,都展现出了国人在AI艺术创作上的输出能力,起码是中国特有的影像创作,终于不再是大模型官网上的视觉演示片了。

一时技术上追不上TOP1,但起码把技术搬下台来,让大家好好用用,AI终究是拿来当工具的,而不是用于看别人精彩的万花筒。

500

虽说以往抵制AI生成内容的反对声依然存在,但随着AI视频的普及,人们会越来越高频的使用这一工具,无论是提升生产力还是图一乐呵。

时代浪潮之下,开发者和创作者们都需要不断调整的自己的定位与角色,而这一轮井喷,也算是让国人更好地拥抱与使用AI技术。

仿生人能不能梦见电子羊,当下尚不可知,但AI猴哥已经放下金箍棒用上机关枪了。

500

最近更新的专栏

全部专栏