周末说时间展开说说为啥waymo比tesla在robotaxi上“不知高到哪里去”

Q
QuantFields
楼主 (文学城)

先说最显然易见的事实,tesla还在准备demo,而waymo以及在好几个城市对公众开放,正式运营很久了。

再说两个tesla信徒的常见理由,最后谈技术本身。

(1)tesla信徒的理由一:waymo成本太高,商业化不可行;而tesla成本更低,商业化更有前途

这是没有理解waymo成本到底高在哪里,为何降不下来。

阻碍真的是在激光雷达这些硬件吗?NONO,一个技术一旦普及,硬件成本会迅速下降。18年19年无人驾驶热潮,各种startup雨后春笋,那时激光雷达的价格以肉眼可见的价格迅速下降,成就了大陆的hesai公司。同时,还有各种新型的固态激光雷达涌现。激光雷达的技术哪怕不再进步,只要robotaxi真的落地,robotaxi车开始量产,激光雷达这些硬件成本就会迅速下降。

成本降不下去的真正原因,在我看来,还是拿不掉远程接管团队。需要维持一支远程接管团队,在车遇到困难,卡住时,随时远程接管。

这就说到了tesla马上的robtoaxi发布会,如果有demo的话,根据FSD现在的错误率,大概率会有人在远程死死的盯着,随时随地准备接管,哈哈

(2)tesla信徒的理由二:tesla的错误率即使比waymo高一些,但只要比人开车低,就可以了。所以,waymo可靠性上高出来的哪部分不重要。

可惜现有法律监管可不支持这种说法。哪怕robotaxi的统计上的错误率比人低,只要出现一次致命失误就凉凉。这其实是robotaxi,哪怕是waymo,无法落地的真正原因。

Cruise就是一个很好的例子,被动的卷入一场事故,导致整个公司黄了。当然,其中有部分原因是公司隐瞒不报。反过来说,公司之所以选择隐瞒不报,也是知道事故的严重后果了。也算是无论如何都逃不掉吧。

最后,说技术。

tesla做法,离robotaxi的安全性差的太远了,具体原因在我之前的21年的视频里就解释过了:

https://www.youtube.com/watch?v=4mi9wfThDgc

当然,最近又了end2end的FSD,给了信徒的信仰充值了。可惜当前FSD的end2end依然遵循的是传统套路(相对于最近的大语言模型LLM而言)。传统套路就是perception,后面接prediction,然后是planning,最后是control。perception是最早用神经网络的。prediction和planning都是传统rule-based。后来,prediction可以并到perception里用神经网络直接出temporal的车的轨迹,planning有了所谓ML planner。每个模块都变成神经网络了,然后所有神经网络接到一起,就可以end2end训练了。但实质上还是传统的那个套路。

同理,没有什么技术障碍说waymo的planning不可以用ML planner,waymo不可以end2end 训练。或许waymo已经用上了,哈哈。

最后,即使是tesla目前的这种辅助驾驶技术,最近两三年的大语言模型LLM的发展,也给了其他公司赶上甚至弯道超车的机会。大家,我想也包括Tesla,都在研发基于vision-language model的新一代的真正的end2end的solution,让我们拭目以待,exciting!

最后的最后,即使退一万步说,tesla真的做出robotaxi了,robotaxi也不会tesla的护城河。因为技术一旦成熟,就会扩散开来,然后被赶上,甚至像电车本身制造那样被超越。Openai就是一个很好的例子,最早chatgpt技惊四座,现在的大模型遍地开花。

l
lionhill
Waymo硬件成本多少年了,一直居高不下,自己不生产车就是硬伤. 全车雷达成本不可能降下来,这就是安全的代价
l
lionhill
不看好waymo的business model,一年夸损5亿以上安全又有何用死胡同
Q
QuantFields
文章里讲了啊,这是信徒的常用理由之一。这是看了标题就直接回复吗。
l
lionhill
哈哈!从来理性分析那来什么信徒,钱又不是用来打水漂的
灵山问禅
不造车为什么是硬伤?华为模式在中国很成功啊
l
lionhill
我相信软硬结合才能做出更好产品
Q
QuantFields
嗯嗯,所以waymo选择自己造激光雷达
l
lionhill
激光雷达成本和整车比只占极小一部分
B
BrightLine
我不同意。特斯拉才有可能成功。原因如下:

一、Waymo在运行,但没出圈

Waymo确实在凤凰城和旧金山部分区域跑了几年,但它只能在“地理围栏 + 高精地图 + 网络连通 +人类远程接管”条件下运行。说白了就是在沙盒里跑得稳,一出围栏就瘫痪。纽约、洛杉矶这些交通复杂的大城市至今不敢进。

反观Tesla的FSD,全国各地用户都能跑,乡村小路、繁忙城市都可以开。连中国乡下都可以开。没有道路分割线也无所谓。

Waymo是实验品,Tesla是正在产品化的AI系统。

二、为什么Lidar路线走不通?Tesla干脆彻底取消Lidar

原帖说“Lidar成本降下来就能用了”,这看起来有道理,其实是误判了AI发展方向。Tesla 早期也用过Lidar(Model S上测试),最后彻底放弃,是有以下几个原因:

1. Lidar是死数据,不理解语义。Lidar只能给你一个“点云深度图”,不能告诉你“这是小孩还是柱子,是推着婴儿车还是站在广告牌下”。你再加摄像头,那就是多系统融合,冗余度高,问题更多。

2. 深度信息是可以从视觉中推出来的,就像人眼一样。Tesla 自研 Occupancy Network 可以从视频中准确重建深度场景,不比Lidar差。

3. 最大的问题是成本结构:Lidar 本身虽然能降价,但它依然是物理设备,不可批量压缩成本;而 Vision + AI 模型训练,一次投入,多车复用,边际成本无限趋近于零。

所以,Lidar 是“工程师的执念”,不是 AI 的未来。

三、远程接管才是 Waymo 成本的“深坑”,Tesla 正在挑战这个终极问题

原文说:“远程接管团队拿不掉,才是成本问题”,这点我赞同,但 Tesla 正在走完全不同的方向——把“接管”问题交给 AI 自己处理。

FSD 从2023年以来,已经能在多数情况下自动识别意图、处理突发情况,虽然还会犯错,但迭代非常快。而 Waymo 不敢交权,最终成了“半自动车 + 高薪监控员”的奇怪组合。我现在天天用FSD,可以看到它巨大的飞跃。

四、你说法律不允许自动驾驶比人好一点点就上线?对 Waymo 也一样。

原帖说:“哪怕比人强,也不能有一次致命事故”,你以为 Waymo 没事故?2024年Waymo两辆车在旧金山追尾 + 堵路事件,已经导致监管介入。而 Cruise 更是直接被一单事故干掉。

所以 Tesla 的风险不是特例,而是整个行业的共同挑战。

真正能跑通法律监管的,不是“0事故”,而是“比人强 + 有责任机制 + 产品更新透明”。

五、End-to-End Tesla真的落后?Waymo根本还没开始全局训练

作者说“Tesla所谓End-to-End其实还是模块化拼起来的,Waymo也能做”。但你搞错了重点。

Tesla现在用的是:

全栈自研神经网络(occupancy flow、neural planner)

超算 Dojo 大规模训练

全球数百万车主真实数据闭环训练

OTA 推送统一版本,实时迭代

Waymo再先进,也要靠“工程师标注 + 人工调参 + 小规模测试”来走传统路线。它可能能做 end-to-end,但它的数据量、部署体系远远无法支撑那种训练密度。

六、你说Tesla做成也没护城河?这和现实完全相反

Tesla 的护城河不是模型,而是:

硬件闭环:自产芯片、摄像头、算力;自己造车,自己集成;

数据闭环:每天几千万英里的真实世界驾驶数据,Waymo根本拿不到;

部署闭环:全国推送,真实反馈,用户自己做beta tester;

品牌和资本:有Elon撑腰,有全球粉丝,有现金流支持亏损运营。

Waymo只能在Alphabet内部烧钱;Tesla靠卖车已经养活研发了。

Waymo确实早,但它是“专家系统+地图+接管员”的产品。Tesla是“神经网络+视频数据+用户共创”的AI范式。你不能说电脑刚发明出来运行很慢,就否定了后来芯片革命;也不能说诺基亚先出手机,iPhone就是笑话。

所以我完全不同意那句“Waymo不知比Tesla高到哪里去了”。相反,Tesla正走在一条无人能跟的AI路线,而Waymo卡在地图、规则和接管上无法前进。

l
lionhill
都是自己的钱各人用钱投票,谷歌现任CEO带领公司going nowhere
灵山问禅
微软的成功,英特尔的失败不是反例?
l
lionhill
我不需要说服你,各人用钱投票
Q
QuantFields
我挑几条最显而易见的回复吧,主要没有那么多时间一一打字回复。

一,waymo出事waymo负责,FSD出事用户负责。所以,waymo只在几个地方跑,和FSD到处跑,能有可比性吗?可比的也是waymo已经在好几个城市公开运行了,而Tesla还在准备Austin的demo哈哈。

二1. 自己去waymo发布的公开数据集里下载一些lidar点云看看,就知道点云到底能不能告诉你“这是小孩还是柱子,是推着婴儿车还是站在广告牌下”。

二2,算法推算的距离永远没有激光测距准确,还耗时。

三,tesla的robotaxi的demo如果按期发布,远程监督员肯定紧张的不敢眨眼,死死的盯着,哈哈

四,现行法律就是“0事故”。所以robotaxi无法落地。

五,找个waymo员工私下聊聊你就知道了。我正文说的很具体了,FSD用的end2end又不是啥黑科技。

六,正文最后讲技术的部分已经说清楚了。

另外,你的回复里有太多的名词罗列,看着像是AI生成的。

三心三意
争来争去没用,都是主观臆断。 6-12个月内就见分晓了。特斯拉如果搞不成功那就清仓买狗狗嘛:)
三心三意
投资赚钱的机会有的是
Q
QuantFields
我自认为,正文里对FSD的技术讲解算的上是言简意赅且言之有物 :)
P
Pilot007
Well said!
任静锅-
眼光放远些,这次Robotaxi launch能走多远并不是 make or break time for TSLA
任静锅-
赞与时共进! 相比原先“为啥从原理上分析tsla做不出FSD/ Robotaxi”有进步
d
dancingpig
你和亮线的分析就不是一个level的,他一看就是理工,确切说CS出身的。
d
dancingpig
我亲戚朋友同学里在Tesla和Waymo工作的人不少,我的观点还是,即使特斯拉没成,也轮不到Waymo
Q
QuantFields
原先原理上的分析对FSD依然有效。这篇文章就是说为什么。

除非,FSD真的开始使用最近两年的新的vision-languange model。

Q
QuantFields
哈哈 你就没从我文章里看出来我是autonomous driving的从业人员 :)

本来不想说的,因为辩论里最差劲的之一就是诉诸于权威或者身份。

亮线是做CS的,但肯定不是吃automous driving这碗饭的,不然也不会说出lidar点云不理解语义,看不出来“这是小孩还是柱子,是推着婴儿车还是站在广告牌下”这样的话。

大禹知比山
我站这里。依靠激光雷达和精准地图的自动驾驶只能称之为半自动,没有未来。
水云闲一
是这样
米奇的厨房
很明显,你所在的公司不是特斯拉,所以你心里有bias
Q
QuantFields
不是有bias,就是看不惯一堆人爆吹tesla的robotaxi。另外,我认识的人都不会去tesla,因为

老马太push

本来想说业内从业人员,但严谨起见,只能说我认识的人。也许我格局不够大,认识的都是没有“追求”的人,哈哈。

Q
QuantFields
但也要感谢tesla赏饭吃,因为行业内早先做L4的公司都黄了,纷纷转型做电车的辅助驾驶,还能接住一些人
l
lionhill
你以为从业人员就有准确判断,你只是熟悉你所做的一小块,企业的成功大方向重要得多
米奇的厨房
他个性不好和他的FSD有什么关系啊?你明明是看不惯老马,我可以理解,但是因为你看不惯他就看不惯FSD就不对了
眼里有光
但股东们都希望看见自己投资的公司有个有执行力,有效率的老板

不怕他push,就怕他忙别的没时间push正事儿

Q
QuantFields
No, 正相反,很欣赏老马,有视频为证,也看得上FSD。看不惯的是有人非说FSD能做robotaxi

看看我21年讲tesla视频的结尾引用的刘慈欣的话,对老马是真心的欣赏:

https://www.youtube.com/watch?v=4mi9wfThDgc

说老马push,是不想当他的员工,论坛上应该没几个人想给他工作吧,哈哈。

涨保田
保险如何普及,肯定是tsla保险公司,之前的一个小事故打过交道,简直就是笑话,这样保险公司破产是肯定的,何况要全部托底给自动驾驶
i
invest_2024dec
兩條技術路線都各有擅長,Waymo挑戰在於scaling,Tesla的在於LLM是否可以perform as human

不見得兩者互相排斥,正如你所說,如果LLM行得通,Waymo可以調整技術路線。反之亦然。

當然首先行通的有先發優勢。

或者還需要更進一步的創新來實現可行的方案。

d
dancingpig
我们讨论的是同一个FSD组吗?300多号人好几年就这样,一个萝卜一个坑,走一个招一个,每一个Musk都要面试

接几个还可能,接一些消化不了

n
notjames
曾经在固体雷达公司打过工,如果大量生产,成本可以降到200美元一个
d
dancingpig
点云是可以,但难度高。waymo到新城市的时候也要人肉盯一阵的。美国的法律不是0事故,比人低就可以。我现在知道的只有德国

要求0事故。FSD用的end2end不是黑科技,但对算力和数据要求极高,这是国内做自动驾驶头疼的地方,当然这也说明NVDA的芯片还有得卖了。

Q
QuantFields
现在的FSD还不是基于LLM的,下一代或许是。
Q
QuantFields
显然不是啊。我意思是因为还有tesla开创的辅助驾驶的市场需求,很多之前做L4的公司转做辅助驾驶,才不至于立即倒闭。
i
invest_2024dec
You are right, I should say if end-to-end neural network can

Performe as human.

此恶要吾持久
已经降到1000软妹币了,比亚迪声称其自研激光雷达的成本可做到 900软妹币,大约100美刀多一点吧