我更愿意将这一次sora展示出来的,叫做一般性通用性AI改进的初显威力

【本文来自《哪个模型把我说的这些问题/难点解决了,哪个模型就是天才》评论区,标题为小编添加】

  • 暮洲
  • 技术上可能辨不出个所以然,毕竟是最新的技术,但从逻辑合理分析一下还是可以的。判断Sora到底到了什么程度,有个现成的应用或者检验方向——自动驾驶。现在openai缺乏杀手级应用,如果如你和楼主所说的Sora在对现实物理世界的信息理解、处理是颠覆性的,那应该能轻松取代甚至碾压特斯拉和谷歌在自动驾驶领域的地位,这俩在风口上时是什么估值什么热度,相信大家还没忘,后来是牛皮有点吹破了,现在openai发布了Sora以后估值飙升,也不过接近千亿美元,跟特斯拉、waymo巅峰差的远,但吹得好像比那会狠多了,相称吗?

比较起平白无故怎么证明自己爱不爱国,我还是更喜欢讨论技术啊,我之前回的另一个帖子的内容——

对下一步chatGPT的可能性,这一次sora已经有了试图通过视频分析世界的构成与关系的苗头,接下来通过海量视频训练出来的话,两条线——一是虚拟世界的构建更加合理,高效,增强现实这个方向可能有所突破,二是ai对现实世界的反向影响力,在军事上战场感知判断上会出现突破,在民用领域可能会有更多杀手级应用出现。

——

我当时脑子里想的民用领域的应用正是真.自动驾驶,即L5的无人驾驶,只不过因为这次sora表现出来的对现实世界的构成关系的分辨能力只是一个苗头,离真正它眼中不再只是平面图像而是三维现实世界的阶段还有一段距离,所以没有直接写出来。

之前看过一个评测华为智能驾驶的视频,里面各种丝滑表现让人印象深刻,好像出问题的是前方发现一个早餐摊位,结果它老老实实的在摊位后面排队,不是博主接手的话,它恐怕会一直等下去。因为它没法分辨摊位和行车的区别。

我相信用发现一个标记一个的方式也能解决,但这只是治标不治本,就算是开发者都不敢在这种情况下让它真正的无人驾驶的。如果有了sora背后对现实世界的构成分辨的基础的话,这就成了可能了。

我更愿意将这一次sora展示出来的叫做一般性通用性AI改进的初显威力,离你说的颠覆性程度还不至于,但如果没造假的话,它展现出来的前景已经很不错了。

站务

全部专栏