纯视觉有没有希望,和考虑激光雷达的情况,智能驾驶的未来是什么技术途径更好
再分析一次:
用不用激光雷达,两者有核心差异:目标距离信息的获取问题。路面各类物体距离信息的精度,是智能驾驶的核心依赖。
纯视觉一定基于目标识别标定后,通过双目交汇+点位匹配的方式解决距离定位问题,或者用典型目标尺寸数据比对方式来推算目标距离,前提都是需要目标识别信息的,而且距离获取精度低。
也就是这个距离信息获取是要吃算力的,一旦目标识别出问题,那么距离信息就得不到,距离信息得不到的后果是什么…撞车或撞别的什么,不都是车物距离控制有问题吗?获不获取精度足够数据足够的距离信息,是安全性决策的核心。
而激光雷达是设备级获取高精距离信息的器件,无需消耗算力就可以直接得到高精度的距离信息,这是极大的区别:不占据算力且精度高,且可以构建距离点云,这个对于紧急情况下决策很有用,它知道哪个地方有一个逃生“豁口”空间。判断有没有逃生空间这事,纯视觉方案不是说理论上做不到,现实是纯视觉基本做不到。
有人说规则模型没有视觉识别大模型好,也有问题——
规则(其实人家不光用规则)模型反而对算力挑战小,规则反而容易被穷尽,有人说规则模型不能穷尽所有情况,有漏洞,那是理论上的结论——离散化总没有连续性能代表所有可能性。但现实情况不需要毫无意义的无穷可能遍历,规则模型才是比深度学习模型更需要智慧去构建的领域,它不是简单的if-then一条条堆叠那么简单,经验和场景的归纳总结,知识图谱的巧妙构建,如何设计有效逻辑闭环,这很吃智商的。一旦做成,就是核心中的核心资产,扩展性会非常高,可靠性非常高,且逻辑高度与人的决策相符,本质上是高级专家系统,你说的场景恰恰规则模型做的很好。反而是大模型那类工具,会把信仰他的人练废了,大模型认为任何用它的人,只要数据够,就一定可以成为无所不能的软件。现在已经看到纯视觉大模型的瓶颈了,其实纯视觉也有后处理算法,但大模型的输出不确定性,给作为规则模型的输入,实在是太不靠谱了。