Sora目前的技术路线无法正确模拟世界的物理规律
【本文由“guan_16507007311969”推荐,来自《最近做的跨领域采访,经济人士谈起现状担忧情绪都有点重,但科技人士却又相对乐观》评论区,标题为小编添加】
虽然Sora声称是“作为世界模拟的视频生成模型”,目前的技术路线无法正确模拟世界的物理规律。
首先用概率统计的相关性无法精确表达物理定律的因果性,自然语言的上下文相关无法达到偏微分方程的精密程度;
其次,虽然Transformer可以学习临近时空令牌间的连接概率,但是无法判断全局的合理性,整体的合理性需要更高层次的数学理论观点、或者更为隐蔽而深厚的自然科学和人文科学的背景,目前的Transformer无法真正悟出这些全局观点;
另外,Sora忽略了物理过程中最为关键的临界(灾变)态,一方面因为临界态样本的稀缺,另一方面因为扩散模型将稳恒态数据流形的边界模糊化,消弭了临界态的存在,生成的视频出现了不同稳恒态之间的跳跃。而基于几何方法的最优传输理论框架,可以精确检测到稳恒态数据流形的边界,从而强调了临界态事件的生成,避免了不同稳恒态之间的横跳,更加接近物理的真实。
目前,由Sora为代表的数据驱动世界模拟模型,和由第一性原理建立起来的物理定律和偏微分方程的世界模拟模型开始进入了酣战状态。这或许是人类历史的伟大转折点。希望年轻的读者们都能踊跃跻身到时代的洪流之中,用自己的聪明才智推动科技与社会的发展!
引自《Sora物理悖谬的几何解释》——老顾谈几何,顾险峰