再议“激光雷达vs纯视觉”:为何很多智驾像是一个看得清的木讷保安? 理解世界的差距。很多人一直认为,激光雷达路线是高级的,而纯视觉则是廉价版的FSD。但实际上,FSD的纯视觉才是整套系统中最难、最高级且最底层彻底重构的部分。它之所以难,并不是因为省去了激光雷达,而是因为它将整车变成了一个会“看”、会“想”、会“动”的神经系统。
为什么国内不选择纯视觉?这并不是不想,而是根本做不了。首先,数据量不足。纯视觉不是装几个摄像头就能运行,需要海量的真实场景数据进行训练。特斯拉从2016年开始收集数据,FSD V13背后是全球几十亿公里的路况、错误、拐点和决策链条。相比之下,国内车企很少有这样的数据闭环。即使销量增加,也缺乏用户使用智驾的数据、标注团队以及端到端迭代的系统。国内车企多依赖封闭道路演示和规则模拟来做决策,这些方法无法培养出真正的智能系统。
其次,结构设计存在问题。特斯拉的纯视觉系统采用神经网络结构,从摄像头输入到车辆行动,中间不分模块,不分角色,形成一整个“思维系统”。而国内车企的做法更像是拼装工程:激光雷达、摄像头、毫米波雷达各自工作,再通过感知模块处理,传给决策模块,最后传给控制模块。这种多环节操作导致延迟、误差和丢包,无法实现高效的一体化智能系统。特斯拉的FSD则不需要通知其他模块,看到情况后可以直接行动,实现了端到端的一体化智能系统。
此外,激光雷达虽然能“看见”,但其数据处理过程复杂且耗时。高速行驶中,提前两三秒看到静止障碍物并不足以保证安全,关键在于看到后能否及时判断并执行。激光雷达的数据处理步骤繁琐,每一步都需要时间。而特斯拉的摄像头流直接将光子信号喂给神经网络,实现快速反应和决策,无需还原三维图或等待传感器拼图,真正做到“看到就是理解,理解就是行动”。
国内车企并非不知道神经网络和端到端系统的好处,但他们起步晚,高端芯片难以获取,同时硬件和算法都受限。为了追求市场表现,他们只能选择“模块化+规则工程”的路径,各供应商各自为政,缺乏整体协调。因此,FSD的强大之处在于其高度集成的闭环神经网络系统,能够实时理解世界并迅速做出反应。
特斯拉之所以能走纯视觉路线,是因为马斯克愿意投入大量资源和时间赌注未来的智能驾驶。而国内企业受制于资本周期、项目评审等因素,只能选择看起来最保险的道路。这种结构决定了他们只能做到“看见”,却难以实现“判断和反应”。要想追上特斯拉,必须推倒现有系统,从摄像头开始重新训练,敢于犯错和缓慢前进。然而,大多数公司连“敢错”这一步都难以迈出,这就造成了结构性断代。
技术的分水岭往往不在于谁跑得快,而在于谁选择了正确的未来之路。你以为装了雷达就能看得见世界,但特斯拉是在用神经网络理解这个世界。