- +1
特斯拉已不是智駕行業(yè)“標(biāo)準(zhǔn)答案”
文/周雄飛
時(shí)隔兩年多,特斯拉再次“開(kāi)麥”。
與此前不同,這次特斯拉對(duì)于自家智能輔助駕駛算法進(jìn)展的分享,并不是在AI Day的舞臺(tái)上,而是在近日舉辦的計(jì)算機(jī)視覺(jué)頂會(huì)ICCV(International Conference on Computer Vision)期間。
特斯拉自動(dòng)駕駛副總裁阿肖克·埃魯斯瓦米(Ashok Elluswamy)作為嘉賓,在大會(huì)上發(fā)表了主題演講。
有可能為了接上2023年6月他們提出端到端架構(gòu)之后的“閉麥”,阿肖克從“特斯拉為何會(huì)選擇端到端?”開(kāi)始分享,但經(jīng)過(guò)多年實(shí)踐,他們也發(fā)現(xiàn)僅通過(guò)端到端想要做好智能輔助駕駛,存在一些挑戰(zhàn)。

圖源Tesla AI
首先就是端到端系統(tǒng)需要解決從極高維到極低維的映射問(wèn)題,這種映射往往是多對(duì)一,因此要保證輸出的正確性,訓(xùn)練難度可想而知。阿肖克的言外之意,或許是在強(qiáng)調(diào)端到端模型的“黑箱”問(wèn)題。
基于特斯拉龐大的用戶(hù)規(guī)模,每日可為他們產(chǎn)生相當(dāng)于500年駕駛時(shí)長(zhǎng)的數(shù)據(jù),但其中多數(shù)是沒(méi)有太多價(jià)值的常規(guī)場(chǎng)景數(shù)據(jù),對(duì)于算法的長(zhǎng)遠(yuǎn)泛化沒(méi)有太大幫助。
為了解決這兩個(gè)問(wèn)題,特斯拉在架構(gòu)和算法層面做了一些優(yōu)化和調(diào)整,比如在輸出決策控制指令前,還會(huì)輸出OCC占用網(wǎng)絡(luò)和3D高斯特征等視覺(jué)信息,以及思維鏈COT自然語(yǔ)言信息。
與此同時(shí),基于龐大的真實(shí)數(shù)據(jù)基礎(chǔ),特斯拉還建立了名為“神經(jīng)世界模擬器”的閉環(huán)仿真系統(tǒng)。通過(guò)這套系統(tǒng),不僅可以訓(xùn)練算法,并且還能驗(yàn)證算法的正確性,好比同時(shí)是“訓(xùn)練場(chǎng)”和“考試場(chǎng)地”。
看到這里,是不是聞到有股熟悉的味道,這不就是國(guó)內(nèi)車(chē)企們和自動(dòng)駕駛企業(yè)布局的VLA模型和世界模型。換句話(huà)說(shuō),特斯拉已從之前站在講臺(tái)上的“老師”,變成了與理想、小鵬、吉利、華為、地平線和Momenta一起探索智駕最終答案的“同學(xué)”。
或許正因這樣,小鵬汽車(chē)CEO何小鵬曾表示:“實(shí)際上,國(guó)內(nèi)任何一家有實(shí)力AI玩家,早就不care馬斯克在做什么了”。
不僅如此,曾負(fù)責(zé)特斯拉Autopilot和自動(dòng)駕駛項(xiàng)目的兩位前高管,在這段時(shí)間也對(duì)特斯拉自動(dòng)駕駛進(jìn)程表達(dá)了擔(dān)憂(yōu)。畢竟,根據(jù)特斯拉最新的財(cái)報(bào),訂閱FSD的比例只有約12%。
已不是智駕行業(yè)“標(biāo)準(zhǔn)答案”的特斯拉,未來(lái)將會(huì)駛向何方?
01、VLA vs 世界模型,特斯拉:我全都要
提出端到端架構(gòu)兩年后,特斯拉他們依然覺(jué)得該架構(gòu)很重要。
首先端到端架構(gòu)能減少?gòu)母兄斎攵说娇刂戚敵龆说男畔p失,就像面對(duì)雞、鵝等小動(dòng)物過(guò)馬路這個(gè)場(chǎng)景,傳統(tǒng)模塊化模型就會(huì)在信息傳輸過(guò)程中丟失一部分信息,導(dǎo)致輸出端形成信息瓶頸無(wú)法做出正確行動(dòng)。
但端到端架構(gòu),就可以確保決策和控制端依然能基于豐富的信息,再加上神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)驅(qū)動(dòng)從大量人類(lèi)駕駛行為中學(xué)習(xí)到“經(jīng)驗(yàn)”,從而做出正確、安全和有效的駕駛行為。
正因這樣,整個(gè)端到端架構(gòu)的信息密度是巨大的。可以簡(jiǎn)單算一筆賬:輸入端在30秒內(nèi)以36Hz頻率采集的7路500萬(wàn)像素?cái)z像頭視頻、長(zhǎng)達(dá)數(shù)英里的導(dǎo)航地圖、100Hz的車(chē)速與IMU信息,甚至還有大量的音頻信息,整體信息維度相當(dāng)于20億token。
對(duì)于特斯拉來(lái)說(shuō),輸出端僅是方向和加減速的控制信息,約等于2個(gè)token,這就意味著端到端需要解決的是從極高維信息到極低維信息、多對(duì)一的映射問(wèn)題,就好比要從一團(tuán)亂麻中找到最終指引向出口的那唯一一根正確線頭。

端到端模型,圖源SEA
翻譯一下,阿肖克所說(shuō)的正是行業(yè)中老生常談的——端到端由于存在信息維度壓縮和深度神經(jīng)網(wǎng)絡(luò)非線性等特性,導(dǎo)致“黑箱”和不可解釋性問(wèn)題不可避免。
另外,在訓(xùn)練數(shù)據(jù)上,特斯拉同樣遇到了瓶頸。按照阿肖克介紹,基于龐大的用戶(hù)群體,特斯拉每天可接收相當(dāng)于500年駕駛時(shí)長(zhǎng)的數(shù)據(jù),這個(gè)數(shù)據(jù)量放到行業(yè)中看確實(shí)令人艷羨,但其中大多數(shù)數(shù)據(jù)卻都屬于簡(jiǎn)單和常規(guī)場(chǎng)景。
換句話(huà)說(shuō),特斯拉正像中國(guó)玩家們一樣,缺少真實(shí)的高質(zhì)量數(shù)據(jù)來(lái)“喂養(yǎng)”算法。畢竟訓(xùn)練所需的高質(zhì)量難例數(shù)據(jù)可遇不可求,地平線CEO余凱由此才會(huì)說(shuō)出那句“在AI時(shí)代,99%的人類(lèi)數(shù)據(jù)是不值得學(xué)習(xí)的”。
特斯拉這次技術(shù)分享的重頭戲,正是他們對(duì)于以上問(wèn)題提出的解法。
針對(duì)特斯拉最新的端到端架構(gòu),阿肖克表示“并不是徹頭徹尾的‘黑箱’系統(tǒng)”。從他的介紹看,現(xiàn)在的端到端架構(gòu)在輸出決策規(guī)劃信號(hào)之前,還輸出了很多中間結(jié)果,包括OCC占用網(wǎng)絡(luò)和3D高斯特征為主的場(chǎng)景重建視覺(jué)信息,來(lái)展現(xiàn)對(duì)于環(huán)境的感知細(xì)節(jié)。
除此之外,特斯拉還引入了思維鏈COT(Chain-of-Thought),訓(xùn)練算法用自然語(yǔ)言來(lái)解釋自己的行為,并給出下一步的行動(dòng)軌跡。這些中間結(jié)果,不僅可用于SR界面的渲染呈現(xiàn),同時(shí)也能用于研發(fā)校驗(yàn)和調(diào)優(yōu),來(lái)保證模型輸出的正確性。

特斯拉具備可解釋輸出模型,圖源Tesla AI
理想車(chē)主們對(duì)于以上描述應(yīng)該非常熟悉,因?yàn)槭撬麄冊(cè)谇芭牌聊簧辖?jīng)常看到的路徑規(guī)劃和思維過(guò)程的畫(huà)面。這就是VLA模型中的“L”(Language)部分,再加上V(Vision)的2D、3D信息,以及MoE、Diffusion模型和A(Action)的部分,就組成了VLA模型。
目前,除了理想之外,小鵬、元戎啟行和千里科技(千里浩瀚9H方案)等品牌,也都采用了VLA架構(gòu)來(lái)打造自身的智駕系統(tǒng)或者方案,讓自身的智駕功能不僅適于與用戶(hù)交互,同時(shí)也能讓智駕行為更像人。
對(duì)于特斯拉來(lái)說(shuō),目標(biāo)是一致的,但他們同時(shí)還在致力于打造一個(gè)算法評(píng)價(jià)模型。
以阿肖克的介紹來(lái)看,他們已經(jīng)基于龐大的真實(shí)用戶(hù)數(shù)據(jù),在云端打造了一個(gè)“神經(jīng)世界模擬器”(neural world simulator)。
它的用途有三個(gè),利用閉環(huán)仿真驗(yàn)證端到端指令的正確性、利用場(chǎng)景編輯生成能力生成對(duì)抗樣本檢驗(yàn)?zāi)P湍芰屠媚M器在閉環(huán)仿真系統(tǒng)中獲取人駕真值。
翻譯一下,就是基于真實(shí)用戶(hù)駕駛視頻數(shù)據(jù),一邊來(lái)生成在現(xiàn)實(shí)世界難獲取的難例(Corner cases)數(shù)據(jù),從而在云端訓(xùn)練和迭代智駕算法模型;另一邊,把訓(xùn)練好的算法模型放到生成好的世界模型中進(jìn)行仿真權(quán)重評(píng)價(jià)測(cè)試,針對(duì)性通過(guò)強(qiáng)化學(xué)習(xí)來(lái)增強(qiáng)模型能力。
就像是特斯拉為FSD在云端打造了一個(gè)閉環(huán)的“駕校”和“考場(chǎng)場(chǎng)地”。相比于現(xiàn)實(shí)世界中高質(zhì)量數(shù)據(jù)的難獲得,在神經(jīng)世界模擬器中就可以讓算法訓(xùn)練和評(píng)價(jià)實(shí)現(xiàn)窮盡。

特斯拉閉環(huán)模擬神經(jīng)網(wǎng)絡(luò)模型,圖源Tesla AI
實(shí)際上,像這樣的云端世界模型,并不是特斯拉首創(chuàng),而是像理想、小鵬、零跑、華為乾崑和商湯絕影等國(guó)內(nèi)玩家已經(jīng)早已布局。
這其中,以華為乾崑為代表的玩家們,在打造云端世界模型的同時(shí),還在車(chē)端部署了世界模型,就像華為乾崑的車(chē)端世界行為模型WA,是基于視覺(jué)、聽(tīng)覺(jué)和觸覺(jué)等感知數(shù)據(jù),經(jīng)過(guò)Token化后訓(xùn)練出的原生基模型。
由此,在國(guó)內(nèi)智駕行業(yè)中就有了端到端、VLA和世界模型的三種技術(shù)路線之爭(zhēng),但從以上分析來(lái)看,特斯拉的最新智駕方案有可能把端到端、VLA模型和世界模型三者都涵蓋了。
特斯拉他們會(huì)這樣選擇,并不是只為了“集百家之長(zhǎng)”這樣簡(jiǎn)單,因?yàn)樵陲w說(shuō)智行看來(lái),端到端、VLA和世界模型并不是簡(jiǎn)單的非此即彼競(jìng)爭(zhēng)關(guān)系,而是端到端為基礎(chǔ)、VLA和世界模型是升級(jí)的動(dòng)態(tài)融合演進(jìn)關(guān)系。
例如上述主流玩家們無(wú)論在車(chē)端部署端到端還是VLA模型,亦或者是世界模型,都需要在云端建立一個(gè)參數(shù)量更大的世界模型進(jìn)行仿真生成訓(xùn)練和評(píng)價(jià),并且還有一些玩家車(chē)端的模型,就是云端世界模型通過(guò)修剪和蒸餾所得。由此,何小鵬、李想和余承東等大佬此前都對(duì)世界模型給予了肯定的評(píng)價(jià)。
除此之外,特斯拉布局VLA和世界模型的目的,還想去支持機(jī)器人業(yè)務(wù)的發(fā)展。
按照阿肖克表示,特斯拉閉環(huán)仿真引擎同樣可以遷移到機(jī)器人領(lǐng)域,而機(jī)器人Optimus和自動(dòng)駕駛FSD技術(shù)棧的統(tǒng)一,也為后續(xù)Cross Embodiment(跨實(shí)體具身)帶來(lái)的更泛化的具身AI發(fā)展帶來(lái)巨大的想象空間。

圖源特斯拉官微
相比之下,理想和小鵬兩家車(chē)企布局VLA和世界模型的時(shí)間更早,并且都已喊出了“要成為AI企業(yè)”的目標(biāo),他們應(yīng)該和特斯拉有著同樣的規(guī)劃。
只不過(guò),相比于之前舉辦AI Day的特斯拉,現(xiàn)在的特斯拉已經(jīng)掉下神壇,與理想、小鵬、華為乾崑和地平線等國(guó)內(nèi)玩家們站到了一起。
根據(jù)飛說(shuō)智行觀察,這次特斯拉分享技術(shù)進(jìn)展后,與之前AI Day后朋友圈刷屏的熱度相比冷清了許多,由此也能看出大家對(duì)于特斯拉在干什么,確實(shí)沒(méi)有之前那么關(guān)注了。
畢竟除了技術(shù)進(jìn)展之外,特斯拉在其他方面的成績(jī)也不夠亮眼。
02、謊言、質(zhì)疑和不愛(ài)用,特斯拉FSD未來(lái)駛向何處?
都2025年了,馬斯克依舊在為自動(dòng)駕駛“畫(huà)餅”。
在最近的第三季度財(cái)報(bào)會(huì)上,馬斯克表示特斯拉有望在今年年底前在8到10個(gè)新的州展開(kāi)Robotaxi運(yùn)營(yíng),其中就包括內(nèi)華達(dá)州、佛羅里達(dá)州和亞利桑那州等對(duì)自動(dòng)駕駛技術(shù)政策寬松的大州。
而在上個(gè)季度的財(cái)報(bào)會(huì)上,馬斯克曾表示,特斯拉會(huì)在今年底前讓Robotaxi覆蓋美國(guó)50%的人口,并預(yù)計(jì)到今年底,特斯拉車(chē)主將能通過(guò)軟件更新,使自己的車(chē)輛具備無(wú)需監(jiān)督的全自動(dòng)駕駛能力(L5)。
對(duì)于馬斯克這樣的“畫(huà)餅”,大家早已司空見(jiàn)慣,畢竟從2016年開(kāi)始,馬斯克就開(kāi)始鼓吹自家FSD可以盡早實(shí)現(xiàn)全自動(dòng)駕駛的目標(biāo),但每到兌現(xiàn)期限無(wú)一例外跳票。
正因這樣,曾負(fù)責(zé)特斯拉自動(dòng)駕駛業(yè)務(wù)的前高管們看不下去了。
特斯拉前人工智能主管安德烈·卡帕西(Andrej Karpathy)最近在一檔播客中表示特斯拉自動(dòng)駕駛的問(wèn)題遠(yuǎn)未得到解決,據(jù)了解他曾在2017-2022年領(lǐng)導(dǎo)特斯拉自動(dòng)駕駛項(xiàng)目。
在安德烈看來(lái),自動(dòng)駕駛的迭代好比是無(wú)限接近100%的過(guò)程,在此之前就是無(wú)數(shù)個(gè)9的積累過(guò)程,按照他對(duì)Electrek回憶道,他曾領(lǐng)導(dǎo)特斯拉自動(dòng)駕駛經(jīng)歷了兩到三個(gè)“9”的迭代,確實(shí)顯著減少了駕駛員接管的干預(yù),但此后這樣的進(jìn)步就不明顯了。

特斯拉無(wú)接管駕駛干預(yù)百分比,圖源Electrek
安德烈之前,斯特林·安德森被行業(yè)公認(rèn)為是特斯拉自動(dòng)駕駛項(xiàng)目的首任負(fù)責(zé)人,因?yàn)樗?015-2016年領(lǐng)導(dǎo)特斯拉Autopilot發(fā)展,目前他已是通用汽車(chē)全球產(chǎn)品部門(mén)的負(fù)責(zé)人。
在近期通用汽車(chē)的活動(dòng)中,斯特林對(duì)特斯拉自動(dòng)駕駛的發(fā)展同樣進(jìn)行了質(zhì)疑,“通用Super Cruise系統(tǒng)已實(shí)現(xiàn)約11億公里的無(wú)接管行駛,且沒(méi)有發(fā)生一起由于技術(shù)導(dǎo)致的事故。但特斯拉的自動(dòng)駕駛系統(tǒng),卻無(wú)法達(dá)到這樣的安全記錄。”
在此背景下,目前特斯拉在奧斯汀和舊金山運(yùn)營(yíng)的Robotaxi車(chē)輛均配備安全員,以便作為系統(tǒng)失效或錯(cuò)誤時(shí)的安全兜底。其中,奧斯汀區(qū)域的Robotaxi,安全員是坐在副駕位置;而在舊金山,安全員則是坐在主駕。
根據(jù)馬斯克的規(guī)劃,會(huì)在今年底前去掉奧斯汀大部分的安全員配置,未來(lái)幾個(gè)月內(nèi),預(yù)期至少在奧斯汀的部分區(qū)域?qū)崿F(xiàn)完全無(wú)安全駕駛員運(yùn)營(yíng)。為此,馬斯克給出的解釋是“這些人類(lèi)監(jiān)控員的存在并非因?yàn)楣炯夹g(shù)存在缺陷,而是出于對(duì)安全的‘高度謹(jǐn)慎’”。
不過(guò),先不說(shuō)與特斯拉同場(chǎng)競(jìng)技的Waymo已經(jīng)實(shí)現(xiàn)了無(wú)安全員的商業(yè)化運(yùn)營(yíng),小馬智行、文遠(yuǎn)知行和蘿卜快跑等中國(guó)玩家們,則是更早就實(shí)現(xiàn)了Robotaxi無(wú)安全員的常態(tài)化運(yùn)營(yíng)。
Robotaxi沒(méi)有按照馬斯克所期望的速度發(fā)展的同時(shí),特斯拉的智能輔助駕駛業(yè)務(wù)發(fā)展同樣受阻。
特斯拉第三季度財(cái)報(bào)會(huì)上,特斯拉首席財(cái)務(wù)官瓦伊巴夫?塔內(nèi)賈(Vaibhav Taneja)公開(kāi)承認(rèn),上一季度FSD相關(guān)的收入較2024年同期有所下滑,具體原因是“目前付費(fèi)使用FSD的客戶(hù)總量仍然很小,僅占現(xiàn)有車(chē)隊(duì)的約12%”。

特斯拉FSD,圖源特斯拉官微
今年特斯拉對(duì)于FSD在美國(guó)市場(chǎng)的售價(jià)雖然進(jìn)行了調(diào)價(jià),買(mǎi)斷價(jià)從之前的12000美元(約合85350元人民幣)降至8000美元(約合56900元人民幣),并推出了99美元的月度訂閱服務(wù)。
但結(jié)果是,不僅沒(méi)有促進(jìn)用戶(hù)們對(duì)于FSD的購(gòu)買(mǎi)和訂閱,反而FSD成為消費(fèi)者們不購(gòu)買(mǎi)特斯拉的主要原因。
根據(jù)Slingshot Strategies在今年8月發(fā)布的《2025年8月電動(dòng)汽車(chē)情報(bào)報(bào)告》,他們對(duì)8000多名美國(guó)消費(fèi)者進(jìn)行調(diào)研后發(fā)現(xiàn),有將近35%的受訪者認(rèn)為“FSD功能讓他們更不愿意購(gòu)買(mǎi)特斯拉”,因?yàn)樗麄儗?duì)FSD技術(shù)不成熟,責(zé)任界定模糊和純視覺(jué)方案可靠性不足等方面有所擔(dān)憂(yōu)。
這些消費(fèi)者的擔(dān)憂(yōu)并不是沒(méi)有道理。本月9日,美國(guó)國(guó)家公路交通安全管理局(NHTSA)宣布對(duì)約288萬(wàn)輛配備FSD的特斯拉汽車(chē)展開(kāi)調(diào)查,起因是收到58起交通安全違規(guī)及事故報(bào)告,涉及闖紅燈、逆行、車(chē)道識(shí)別錯(cuò)誤等問(wèn)題。
其中就包括當(dāng)特斯拉車(chē)輛開(kāi)啟FSD之后,在路口與其他車(chē)輛相撞以及誤駛向?qū)ο蜍?chē)道與別車(chē)相撞,導(dǎo)致多名人員受傷等多起事故。
03、后記
特斯拉對(duì)于全球自動(dòng)駕駛行業(yè)來(lái)說(shuō),有著重要的價(jià)值。
基于特斯拉前些年相繼提出BEV+Transformer、OCC占用網(wǎng)絡(luò)以及端到端模型,不可否認(rèn)在一定程度上給于中國(guó)玩家們很多啟發(fā),由此推動(dòng)了整個(gè)行業(yè)向前快速發(fā)展。
兩年前,或許因?yàn)椤皳?dān)心中國(guó)車(chē)企玩家們的模仿”傳言,馬斯克和特斯拉選擇了“閉麥”,AI Day就此停辦不再對(duì)外分享自動(dòng)駕駛相關(guān)技術(shù)進(jìn)展。
再到兩年后的今天,理想、小鵬、吉利、華為乾崑、地平線和Momenta等玩家雖然在技術(shù)路線上已有“三足鼎立”之勢(shì),但馬斯克應(yīng)該也看到了一個(gè)事實(shí):特斯拉已不是行業(yè)的“標(biāo)準(zhǔn)答案”,大家都在按照自己認(rèn)定的方向向自動(dòng)駕駛終局進(jìn)行探索。
畢竟,自動(dòng)駕駛行業(yè)從不缺少“神話(huà)”,而馬斯克和特斯拉現(xiàn)在則需要更腳踏實(shí)地。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




