…… 直播结束后,特斯拉AI基础设施主管Tim Zaman进一步透露,即将上线的算力集群拥有200PB的热缓存,比训练大模型的系统多几个数量级。 也是一个让很多从业者觉得不可思议的地方,比如GitHub前CEO。 Tim Zaman表示尝试了很多云计算供应商,但没有一个足够好,聘请了存储系统架构师来开发AI专用的分布式文件系统。 最后,回到此次直播测试。 不少网友不吝惜自己的赞美之词,并希望能够早日试驾一把。 还有网友调侃: 看起来FSD已经准备好迎接挑战了,那么,不来试一把亚洲的终极boss之战吗? be like this (手动狗头): 值得一提的是,这把直播除了秀特斯拉新版FSD,也是𝕏直播功能的一场压力测试。 至于最终也没打上的“马扎大战”,似乎已经不那么重要了。 马斯克给自己打的圆场是“小扎在这片地区有8000多房产,要是真找到他了我就去挑战”。
险情结束,老马也直言: 后面剩余的25分钟路程都顺利结束,直播还展示了FSD的靠边停车功能等等。 而在整个直播过程中,马斯克反复强调得最多的一点就是: 无论是最开始遇到的红色立柱、减速带,还是后面遇到的骑行路人、环岛路口,FSD系统都不是靠任何一行控制代码来完成决策的。 相反,FSD只是看了非常多的视频,然后完成了训练,得到了一个神经网络。 (特斯拉Autopilot的决策从2020年开始由编程逻辑转为视频训练的神经网络,在FSD v12之前,v11版本控制堆栈中有超过30万行C++代码。) 像19分钟的那次闯红灯行为,马斯克就告诉观众,解决方案本质就是再多喂更多交通信号灯的视频,尤其是左转灯的,然后就会起作用。 当然,胡乱投入大量视频是不够的,来自优秀人类驾驶员的高质量数据才是训练特斯拉Autopilot实现FSD的关键。 除了不靠任何代码完成决策,马斯克还强调: FSD V12不用时刻联网就能完成一切。 当然,如果有干预行为发生,系统会将它记录下来并发回特斯拉进行分析。 由于决策全部在本地进行,特斯拉FSD用8个摄像头以每秒36帧的速度进行拍摄,但系统的计算速度其实可以更快,达到每秒50帧,只可惜相机的速度已经到头了。 不联网进行决策也意味着地图也不用随时更新,用马斯克的话来说: 另外值得注意的是,本次测试FSD V12的Model S安装的还是HW3。 在HW3上解决L5级自动驾驶之前,特斯拉可能不会在HW4车辆之上启用FSD。这意味着HW4的FSD访问权限可能推迟到2025年。 一万张英伟达H100周一上线 作为知名的时间管理大师,马斯克试驾途中还抽空语音连线了一个网络讨论会。 在这里他回答的问题和透露的重点内容有: 为什么改用端到端方案,优势在哪? 马斯克认为“人类就是这样运作的”,人类用眼睛和生物神经网络开车,自动驾驶用摄像机和数字神经网络开车是正确的通用解决方案。 虽然神经网络缺乏可解释性,相应的司机也经常说不清楚如何做的决策,只是凭经验。 乘客在做人类司机的出租车时,也无法准确知道司机在想什么。而特斯拉屏幕上显示的画面,就是自动驾驶系统在 “想什么”的一个近似。 高端GPU将继续短缺,世界进入强算力依赖阶段。 马斯克透露AI训练主要还是用的英伟达硬件,特斯拉Dojo超算作为辅助,今年花了约20亿美元在训练上面(大部分是硬件资产)。 AI训练需要把算力集中在一个地方,避免数据传输带宽的瓶颈,也会带来很大的电力负担。 马斯克在这里还开了一个玩笑:Transformer架构的神经网络需要越来越多的硬件Transformer。 比GPU更缺的是高速连接设备。 面对“拥有5000张H100是什么感觉?”的提问,马斯克表示:说少了。 包含1万张英伟达H100的新算力集群,正在24/7加急准备中,周一(也就是今天)上线。 而且不像很多公司声称“拥有”算力其实是租的云计算服务,特斯拉就是真的买了1万张GPU自己搭系统。 …… 直播结束后,特斯拉AI基础设施主管Tim Zaman进一步透露,即将上线的算力集群拥有200PB的热缓存,比训练大模型的系统多几个数量级。 也是一个让很多从业者觉得不可思议的地方,比如GitHub前CEO。 Tim Zaman表示尝试了很多云计算供应商,但没有一个足够好,聘请了存储系统架构师来开发AI专用的分布式文件系统。 最后,回到此次直播测试。 不少网友不吝惜自己的赞美之词,并希望能够早日试驾一把。
还有网友调侃: 看起来FSD已经准备好迎接挑战了,那么,不来试一把亚洲的终极boss之战吗?
be like this (手动狗头): 值得一提的是,这把直播除了秀特斯拉新版FSD,也是𝕏直播功能的一场压力测试。 至于最终也没打上的“马扎大战”,似乎已经不那么重要了。 马斯克给自己打的圆场是“小扎在这片地区有8000多房产,要是真找到他了我就去挑战”。
拭目以待吧。
老马这个训练的错误率挺高的,40分钟路就出现一次重大错误需要人干预,如果是全天开6小时你敢睡觉吗?肯定出车祸啊。
AlphaGo是用人类学到的围棋方式跟诀窍去教NN下棋。就是赢了柯洁跟李世乭的那个。
Deepmind后来另外写了一个。完全没有用人类下棋的方式做指示。纯粹跟NN说围棋的规则,让他自己跟自己下棋去学习。然后AlphaGO跟Zero下了100场。战绩是100-0. AlphaGO一场也没赢。柯洁在知道了这消息后也感叹的说了一声,在围棋的世界里,人类的认知是多馀的。
特斯拉在V12之前,一直是instruction+NN. 一直试著在给NN更多的指令让他去了解"人类"在遇到哪种路况时会如何处理。
后来发现这不是解决问题的终极办法。因为总是有无法预料的edge case。最后乾脆纯NN。让NN知道开车的规则。然后给他一堆data。让他自己去学习怎么开车。
这能达成的是真正的人工智能。Musk在里面有说,你可以跟车子说我要到前面的那座山上。然后就算完全没有地图资料的情况下,FSD可以自己摸索。慢慢的最后把你送到终点。 这是很惊人的。尤其是特斯拉已经说过他家的机器人是要用跟FSD同样的系统。假如把这个概念带到机器人上,这机器人是真的可以在各种情况下做事。因为他不是依靠著任何工程师给他pre-set的instruction. 然后任何不在preset里面的情况,电脑就不知道要做什么。 而是他只要有如何了解区域的概念,就能自己去学习一个房子里外的layout,或者是任何他所在的地点而去达成他该做的事情。
这就像以前探索美洲的探险者。他们完全不知道往西走有什么,也没有地图跟他们说西边是长的什么样子的,但他们就是走。人工智能可以做到这一点的话,真的很惊人。
不值得那么多钱。我就每次上了高速开AP,也能起到一定的降低人的劳累风险的作用。而AP是不要钱的。FSD只有真正能让人坐在车上睡觉时才值得那么多钱。