最近看了小马智行楼天成的访谈文章,非常推荐大家去看。其中他提到的几个核心观点,是大幅刷新我的AI认知的,分享给大家。
楼的核心观点是
1)当前通过收集优质数据,数据驱动AI训练产出的端到端模型,只能做出L2.99999的智能驾驶。
这种方式只是拟合现有数据,并没有给出某些智能逻辑,所以模型的能力会被数据的表现所限制。
L2作为辅助驾驶,驾驶表现只要表现得跟人一样就行,所以用大量的数据训练,能够灌出L2级别的智能驾驶,但天花板也相对很明显。L4自动驾驶系统的表现,要好于正常人类认知的10倍,因此,大量平庸的数据其实没有益处。
2)L2和L4走的是两条相反的路,L2做的越好可能L4做的越差,L4做的越好可能L2做的越差。
你跟一个臭篓棋子学下棋,那你就是他的水平,不会更高了。如果类似臭篓棋子的数据越多,数据就会变成负担,垃圾数据越多,干扰越大。
更深一层来讲,这些数据已经教不了模型了。就像教小孩儿乒乓球,你水平都不如他那不是瞎教吗?所以要找教练。现在的做法是,训练一个很好的模型来训练端到端。而能训端到端模型的模型,本身就是一个很难的东西。
所以L4的路径是,训练一个世界模型,世界模型就像是一个教练,教端到端模型如何去自动驾驶。
从前我的认知,一直是优质数据训练AI模型,但是从楼的观点延展开来,我想到了alphaGo和alphaZero,alphaGo就是数据训练模型的典型代表,而alphaZero则是0数据起步,通过规则的摸索和试错得到的模型,在这个例子里,alphaGo是L2,alphaZero是L4,L2是模仿,而L4是掌握。从这个角度来说,alphaZero相比alphaGo是革命式的飞跃。
而L4和L2也存在路径上的本质不同。
标签:小马,AI,模型,L4,L2,智行楼,alphaZero,数据 From: https://blog.csdn.net/robel_hz/article/details/142816990