
10月23日,在人工智能與自動駕駛領域的頂級盛會國際計算機視覺大會(ICCV)2025上,特斯拉自動駕駛副總裁Ashok Elluswamy帶來了題為“Tesla ICCV 2025 Foundational Model for FSD”的重磅演講。
這一演講不僅揭示了特斯拉完全自動駕駛(FSD)系統的最新基礎模型架構,還通過生動演示和數據分析,勾勒出從監督駕駛向完全無人駕駛轉型的藍圖。

從端到端模型的“半成品”到高置信度評估
演講伊始,Elluswamy直擊FSD的核心挑戰:如何從當前的L2輔助駕駛躍升至L4完全自主駕駛。他強調,評估(Evaluation,簡稱Eval)是關鍵分水嶺。“L4需要模擬環境中無數個‘9’的置信度,這遠非L2可比。”Elluswamy指出,特斯拉的基礎模型并非完全端到端(End-to-End,E2E),而是巧妙融合了神經網絡(NN)生成的路徑與額外信號進行實時修正。這種混合架構避免了純E2E模型的“黑箱”風險,同時提升了系統的魯棒性。
Elluswamy詳細演示了這一機制:模型首先通過視覺語言模型(Vision Language Model,VLM)生成自然語言描述,例如識別路況并預測行為路徑。隨后,系統注入多模態信號(如雷達數據或歷史軌跡)進行優化,確保輸出路徑更精確可靠。這一創新讓FSD在復雜場景中表現出色,例如“雞過馬路”與“鵝不過馬路”案例。前者考驗模型的即時響應,后者則驗證了行為預測的細膩度。評論區用戶紛紛表示,這種“非純E2E”設計更務實:“優質訓練數據加精煉模型,就能解決大部分問題,無需全盤端到端革命。”

奧斯汀Robotaxi:無人駕駛的“安全乘客”實驗
演講的高潮在于對Robotaxi運營的展望。Elluswamy透露,特斯拉已在奧斯汀啟動低速(低于40 mph)Robotaxi試點,用戶可通過App召喚車輛抵達指定點,而無需傳統安全駕駛員在駕駛座。這聽起來革命性十足,但Elluswamy補充道,車輛會配備“安全乘客”坐在前排乘客座,提供監督。
這一細節引發社區激烈辯論。Reddit用戶指出,這并非真正“空車抵達”,而是特斯拉在用詞游戲規避監管壓力:“安全乘客本質上還是安全駕駛員的變體,沒什么本質變化。” 有人回憶Uber 2016年在匹茲堡的類似實驗,最終因復雜場景而夭折。但Elluswamy樂觀表示,FSD的VLM能力將通過海量模擬數據實現“高9置信度”,預計2025年底在選定美國城市推出無監督FSD。

技術影響與行業回響
特斯拉的基礎模型標志著自動駕駛從“規則驅動”向“AI驅動”的徹底轉型。VLM的引入,不僅讓FSD能“讀懂”路況如人類般生成描述,還為Robotaxi生態注入語言交互潛力。未來,這可能擴展到多車隊協調,甚至火星殖民愿景中的自主導航。
然而,社區反應兩極分化。一方面,用戶贊嘆評估框架的嚴謹:“終于強調Eval了,這才是L4的護城河。” 另一方面,質疑聲不斷:安全聲明是否“煙霧彈”?特斯拉是否過度依賴馬斯克的敘事?正如一位評論者所言:“技術牛,但運營宣傳需更透明。”
總之,Elluswamy的演講如同一盞明燈,照亮FSD的進化路徑。在ICCV 2025的聚光燈下,特斯拉正以數據與AI重塑出行未來。但要實現無人駕駛的承諾,技術之外,信任與監管同樣不可或缺。讓我們期待2025年奧斯汀的Robotaxi街頭秀——那里,或許沒有方向盤,只有無限可能。








粵公網安備 44010602000157號
