「Sora 2」发布,工具、玩具、还是行业杀手?
文 / 二风
来源 / 节点财经
这个十一,OpenAI又扔出了一个重磅炸弹“Sora 2”。
OpenAI在其官方声明中,将Sora 2定位为“最先进的视频和音频生成模型”——这一论断建立在几项此前模型都难以企及的关键能力之上。
首先是对物理世界的精确模拟,这也是Sora 2最核心的突破。OpenAI的演示生动地展示了这一点,当一个篮球投失时,它会遵循物理定律从篮筐上弹开,而不是像旧模型那样扭曲现实或将球“传送”进篮筐。这种能力表明,Sora 2不仅仅是在模仿像素的排列组合,它正在学习和构建一个初级的“世界模型”,理解现实世界的基本因果关系。
此外还包括同步音频生成,Sora 2将同步对话、音效和环境音直接整合进视频生成流程。此前的AI视频模型大多是“默片”,用户需要具备额外的音频编辑技能和工具才能完成一个完整的作品,这也构成了巨大的使用门槛。而Sora 2的出现,让产出的内容开箱即用,具备了即时在社交媒体传播的完整性。
另外是增强的可控性与连贯性,Sora 2能够遵循跨越多个镜头的复杂指令,同时保持角色、物体和世界状态的一致性。这种能力的提升,为AI生成更长、更复杂的叙事内容打开了大门。
面对这一切,OpenAI首席执行官奥尔特曼给出了他的诠释:“Sora 2首先是一款‘为乐趣而生’的消费级产品,其商业目标是创造收入,旨在为实现通用人工智能提供资金支持。”
《节点财经》也率先尝试了Sora 2,以奥尔特曼为视频主人公,制作了一支37秒的视频,可以看出包括人物嘴型的匹配、人物与背景以及光影效果的融合,以及环境背景声的自动生成,Sora 2都给出了较为成熟的视频生成体验。
01 视频领域的GPT-3.5时刻
Sora 2的技术源于其混合架构,它结合了扩散模型和Transformer骨干网络。可以通俗地理解为,扩散模型如同一个雕塑家,从一堆随机的“噪声”中逐步雕琢出清晰的图像帧;而Transformer则像一个大脑,通过其强大的注意力机制,理解视频中不同“区块”在空间和时间上的复杂关系。正是这种架构,使得Sora 2能够比竞争对手更灵活地处理不同风格、时长和分辨率的视频,实现了质的飞跃。
Sora 2的成功不仅在于技术,更在于其精心策划的产品与市场策略。
Sora 2 的iOS应用从设计之初就带有明确的社交媒体基因。其标志性的垂直滑动信息流,与TikTok和Instagram Reels的用户体验无限接近。而引爆这个社交飞轮的核心机制,是“Cameo”功能,用户只需录制一段短视频进行身份验证,即可生成一个数字化的个人形象,并将其植入任何AI生成的场景中。
《节点财经》认为,传统的AI工具将用户定位为“导演”,通过提示词指挥AI,而Cameo则巧妙地将用户变成了内容的“主角”,极大地满足了人们自我表达和个性化的深层欲望。更进一步,当用户授权朋友使用自己的Cameo时,便建立了一种基于共同创作的社交联系,形成了强大的网络效应。每一条带有用户Cameo的视频,都成为Sora 2最有效的病毒式广告,其代言人就是用户自己,这比任何分享按钮都更具传播力。
与此同时,“一换四”的邀请码制度则是一记强力的增长手段。它通过制造人为的稀缺性和排他性,瞬间点燃了市场的渴望,将早期用户转化为传播节点,驱动了指数级的用户增长。
这套组合拳的效果立竿见影,Sora应用上线不到24小时,便冲上苹果应用商店免费榜第三名。四天之内,更是登顶榜首,超越了自家的ChatGPT和谷歌的Gemini。根据分析公司Appfigures的数据,仅在美国和加拿大地区,该应用在头两天就获得了16.4万次下载。巨大的需求催生了二级市场,在eBay等平台上,Sora的邀请码被黄牛热炒,价格从10美元到45美元不等,这充分证明了其邀请制策略所制造的巨大市场热度。
在产品引发狂热的同时,OpenAI主动打出了一张“负责任”的牌。
公司公开宣称,其应用的设计哲学是“最大化创造,而非消费”,为了支撑这一叙事,产品中内置了多项“反成瘾”功能,例如优先展示来自用户社交网络的内容、在用户长时间浏览时“轻推”其进行创作,以及为青少年用户设置默认的滚动时长限制。
在社交媒体平台,尤其是短视频,正因其算法成瘾和对心理健康的负面影响而备受监管和舆论压力。因此,通过公开宣示“最大化创造”的理念并内置相关功能,OpenAI从一开始就在公关和政策层面将自己与传统社交巨头区分开来,试图塑造一个更负责任的创新者形象,这可能有助于在未来应对不可避免的监管审查,尽管其核心用户体验依然极具吸引力,甚至可能同样令人沉迷。
02 好莱坞和广告业的两极反应
电影产业的反应呈现出明显的分裂,一方面,对失业的恐惧是真实且迫切的。知名制片人泰勒·派瑞(Tyler Perry)在看到Sora的技术演示后,公开宣布暂停其耗资8亿美元的制片厂扩建计划,直言担心无法跟上这项技术的步伐。
但另一方面,许多创作者也看到了Sora 2作为强大工具的潜力。它被用于前期视觉预览、故事板制作和快速概念验证,从而极大地缩短了制作周期并降低了试错成本。OpenAI也积极向好莱坞的制片厂和人才机构进行游说,试图将Sora 2定位为一个赋能创作者的协作工具,而非替代品。
《节点财经》认为,这种颠覆对准了商业内容市场中体量庞大、对成本和效率更为敏感的中低端领域。从社交媒体广告、企业宣传片到产品演示,这些构成了视频制作行业的主体,Sora 2以极低的成本和时间,提供了“足够好”的质量,直接冲击了服务于这些需求的无数小型制作公司、自由职业者和创意机构的生存根基。
此外,广告业是Sora 2展现其颠覆性力量最直接的领域。全球最大的广告传播集团WPP的案例极具代表性,通过微软Azure平台上的Sora API,WPP能够快速地为客户“预演”广告,并大规模生成个性化内容。
有数据显示,借助Sora等AI工具,广告活动的制作周期可以从数周缩短至48小时以内,而成本不到传统制作的1%。内容创作的时间成本更是从几天甚至几周骤降至几分钟。
Sora 2的发布在资本市场也引发了即时反应,最显著的例子是,在其发布后的隔夜交易中,社交媒体巨头Meta的股价下跌了2.3%。市场的担忧在于,Sora 2强大的能力可能催生一个全新的社交媒体生态系统,直接对现有平台构成威胁。
这一事件被投资者视为对“AI/大语言模型正在吞噬软件”这一投资论点的强力确认。它预示着,AI原生应用将不再仅仅是现有软件的附属功能,而是会成为独立的、能够颠覆整个行业的平台。
《节点财经》分析,Sora应用的推出,标志着OpenAI的战略重心正从一个B2B的API供应商,转向成为一个直接面向消费者的B2C竞争者。这开启了一场围绕“AI原生社交信息流”的全新军备竞赛,谷歌将Veo集成进YouTube Shorts,Meta推出“Vibes”功能,都是这场竞赛升级的明确信号。
03 Sora所引发的版权混战
在Sora 2引发的所有争议中,版权问题无疑是最激烈、最核心的战场。OpenAI在此问题上的处理方式,展现了一场高风险、高回报的战略博弈。
Sora 2发布之初,OpenAI采取了一项极具挑衅性的版权政策:默认情况下,模型可以生成包含受版权保护角色的视频,除非版权所有者主动联系OpenAI并明确要求“选择退出”。这一策略彻底颠覆了传统的授权模式,将保护自身权益的责任完全推给了创作者。
作为一个拥有顶尖法务团队的成熟组织,OpenAI深知这一政策在法律上的巨大风险。然而,他们也清楚,一个充满了用户熟悉和喜爱的IP的世界,远比一个充斥着原创但陌生角色的世界更具吸引力。他们赌的是,利用这些知名IP的天然流量,可以在最短时间内为Sora应用带来病毒式的传播和海量用户,从而迅速建立市场主导地位。
赌博的结果立竿见影,Sora的信息流中瞬间充满了对任天堂、迪士尼、《南方公园》等知名IP的二次创作。从“拯救大兵皮卡丘”到马里奥主演的《星球大战》,这些极具传播力的视频迅速成为Sora应用下载量飙升的主要燃料。
然而,这也迅速引来了版权巨头的警惕。据路透社报道,迪士尼几乎在第一时间就选择了退出。
就在版权风暴即将全面爆发之际,OpenAI上演了一场令人瞠目的快速转向。在应用上线仅仅三天后,奥尔特曼便通过博客文章宣布,将Sora的版权政策从“选择退出”彻底转变为“选择加入”,并承诺给予版权所有者“更精细的控制权”。
更关键的是,奥尔特曼在同一篇文章中抛出了一个极具诱惑力的橄榄枝,为那些选择加入的版权方提供收入分成模式。
《节点财经》认为,这次闪电般的撤退和提议,与其说是一次迫于压力的道歉,不如说是一次战略重心的转移。它旨在同时解决三个核心问题:首先,通过转向“选择加入”,极大地降低了面临天价版权诉讼的直接法律风险。其次,通过提供收入分成,试图将潜在的诉讼对手转变为商业合作伙伴,从而合法地获得全球最受欢迎的IP内容库,这对于一个社交平台而言是无价的资产。最后,这也为Sora高昂的计算成本找到了一个潜在的商业化解决方案。
Sora 2的发布,已成为是一个明确的拐点,不可逆地改变了内容创作、知识产权和社交媒体的版图,它以一种无可辩驳的方式,验证了AI原生应用的颠覆性力量。
然而,它留下的问题比给出的答案更多,版权之战虽已进入商业谈判的新阶段,但关于AI训练数据合法性的根本性问题仍悬而未决,与谷歌、Meta等巨头的技术军备竞赛只会愈演愈烈,将视频生成的能力推向更强大、也可能更危险的境地。
最终,Sora 2最大的影响或许在于,它将一个抽象的、关于未来的AI讨论,变成了数百万用户可以亲手触摸和感知的现实,同时也让用户不得不与一个“眼见不再为实”的世界,以及背后所潜藏的巨大风险之间,寻找一个新的平衡。