星期四, 18 12 月, 2025
AI人工智慧謝銘元專訪阿財:特斯拉自動駕駛落伍?揭秘 FSD 純視覺與端到端 AI 真相

謝銘元專訪阿財:特斯拉自動駕駛落伍?揭秘 FSD 純視覺與端到端 AI 真相

破解特斯拉的自動駕駛迷局:從技術路徑之爭到機器人帝國的底層邏輯

如果說電動車是上半場的序曲,那麼自動駕駛(Autonomous Driving)無疑是下半場的決戰點。

然而,這幾年我們看到了一個有趣的現象:曾經作為自動駕駛先行者的特斯拉(Tesla),似乎陷入了「狼來了」的循環。伊隆·馬斯克(Elon Musk)年復一年地承諾「全自動駕駛即將實現」,卻又一次次地跳票。與此同時,配備激光雷達(LiDAR)的中國電動車新勢力,以及在特定區域運營順暢的 Waymo,似乎在體驗上給了消費者更直觀的衝擊。

市場上開始出現一種聲音:「特斯拉的技術是不是已經落伍了?」

帶著這個巨大的疑問,我邀請了長期深耕科技產業分析的阿財(阿財科技分享),進行了一場極高密度的對話。我們試圖剝離股價的波動,直接切入特斯拉自動駕駛的技術底層,去探討一個核心命題:這究竟是技術路線的錯誤,還是黎明前的最後黑暗?

這場對話讓我深刻意識到,我們或許都用錯誤的維度在衡量這場戰爭。

第一性原理的極致賭注:為何堅持「純視覺」?

在自動駕駛的技術流派中,最大的分歧點在於「感知」。

目前主流車廠與 Waymo 等 Robotaxi 業者,普遍採用的是「多傳感器融合」方案,也就是結合攝像頭、毫米波雷達與激光雷達(LiDAR)。這條路徑的邏輯很直觀:機器需要「冗餘(Redundancy)」。就像人類有兩隻眼睛,如果再加上蝙蝠的聽音辨位能力,安全性理應更高。激光雷達能精確描繪出周遭環境的 3D 點雲,讓車輛「絕對知道」前方有障礙物。

但馬斯克選擇了一條離經叛道、甚至被視為頑固的路:純視覺方案(Tesla Vision)。

阿財在對話中點出了一個極具洞察力的觀點:「這是一場『局部最優解』與『全局最優解』的博弈。」

激光雷達方案就像是給車輛裝上了「拐杖」。它能讓車輛在特定規則、特定區域內快速達到 99% 的可用性。但這也帶來了兩個致命傷:一是成本(雖然在下降,但仍是負擔),二是「地圖依賴」。依賴高精地圖與激光雷達的車,一旦進入地圖未覆蓋的區域,或者遇到極端天氣干擾雷達波,系統就會降級甚至失效。

特斯拉的邏輯則是回歸「第一性原理」:人類開車只靠「視覺(眼睛)」與「大腦(神經網絡)」。

如果人類可以只靠視覺在任何陌生道路上駕駛,那麼機器理應也能做到。特斯拉移除雷達,不僅是為了省錢,更是為了強迫神經網絡去學習真正的「理解」環境,而不是依賴雷達的「死記硬背」。

這是一條極其艱難的路。這意味著特斯拉必須解決視覺測距的準確性、光影變化的干擾等無數難題。這也是為什麼特斯拉的 FSD(Full Self-Driving)看起來進展緩慢的原因——因為他們在試圖解決一個通用的 AI 視覺問題,而不僅僅是解決開車問題。

延遲的真相:從「寫代碼」到「教 AI」的範式轉移

許多投資人對 FSD 的延期感到不耐。阿財從技術迭代的角度,為我們拆解了背後的真實原因。

過去的自動駕駛系統,包含了大量的「規則代碼(Heuristic Code)」。工程師們用 C++ 寫下無數條規則:如果看到紅燈,就停下;如果左邊有車,就減速。這就像是在教一個不懂變通的孩子,你必須把世界上所有可能發生的情況都寫成守則交給他。

但現實世界是充滿混沌的(Corner Cases)。你無法寫盡所有的規則。

特斯拉之所以一直在推遲,是因為他們正在經歷一次痛苦但必要的「換血」——從 v11 到 v12 的端到端(End-to-End)神經網絡革命。

所謂「端到端」,是指將攝像頭捕捉到的原始圖像數據輸入模型,直接輸出車輛的控制指令(油門、煞車、轉向)。中間不再有人工編寫的規則代碼,取而代之的是神經網絡通過學習數百萬小時的優質人類駕駛影片,自己「領悟」出來的駕駛直覺。

阿財形容這就像是從「查字典翻譯」進化到了「母語直覺」。

這個過程極其痛苦,因為這意味著要拋棄過去幾年積累的數十萬行代碼,重新訓練 AI。這解釋了為什麼在某個階段,特斯拉的進度看起來停滯不前,甚至出現倒退。因為他們正在更換底層引擎。

一旦這個「端到端」的模型訓練完成並收斂,它的進化速度將是指數級的。因為它不再受限於工程師寫代碼的速度,而是取決於算力的大小和數據的質量。這正是特斯拉在 Dojo 超級電腦與 H100 芯片上瘋狂投入的原因。

算力即權力:數據飛輪的護城河

既然技術路徑明確,為什麼其他車廠難以複製?

這裡我們觸及了商業競爭的深水區。阿財指出,端到端模型的關鍵在於「高質量的邊緣案例數據」

Waymo 的車隊規模在千輛級別,而特斯拉在路上跑的車隊是百萬級別。當需要訓練 AI 處理「一個穿著小丑服的人騎著獨輪車逆向行駛」這種極端情況時,Waymo 可能一輩子都遇不到一次,但特斯拉的車隊每天可能在全球各地捕捉到數百次類似的異常數據。

這種「影子模式(Shadow Mode)」——即在用戶駕駛時,後台的 FSD 也在模擬駕駛,一旦兩者決策不一致,數據就會被標記並回傳——是特斯拉目前最難被跨越的護城河。

其他車廠即便買得起算力芯片,也拿不到如此龐大且真實的訓練數據。這也是為什麼我認為,未來的自動駕駛格局,可能會出現類似手機作業系統的「雙寡頭」或「一超多強」局面。特斯拉極有可能成為自動駕駛界的 iOS,而其他車廠則需要尋找他們的 Android 聯盟。

終極野心:不只是車,是具身智能(Embodied AI)

如果我們的視野僅停留在「汽車」上,或許就看低了特斯拉的市值天花板。

在對話的後半段,我們談到了特斯拉的人形機器人——Optimus。這看似是一個為了炒作股價的副業,但在技術邏輯上,它與 FSD 是完全同源的。

如果特斯拉解決了「純視覺 + 端到端神經網絡」的問題,這意味著什麼?這意味著他們創造了一個能通過視覺理解物理世界,並做出決策的通用 AI 大腦。

把這個大腦裝在四個輪子上,它就是 Model 3/Y;把這個大腦裝在兩條腿的軀幹裡,它就是 Optimus。

汽車其實就是「輪式機器人」。在工廠環境中,機器人面臨的環境複雜度其實遠低於開放道路。如果 FSD 能在孟買或紐約的混亂街頭安全行駛,那麼讓 Optimus 在工廠裡摺衣服、搬零件,在技術難度上其實是「降維打擊」。

這才是特斯拉真正的恐怖之處。他們不是在造車,而是在構建一個物理世界的通用人工智慧平台

一旦 Optimus 量產並投入使用,它顛覆的將不只是計程車行業,而是整個人類社會的勞動力結構。這也是為什麼馬斯克敢說,Optimus 的價值將遠超特斯拉汽車業務的總和。

投資視角:黎明前的信號

回到最初的問題:特斯拉的自動駕駛技術落伍了嗎?

我的結論是:如果你看的是現在的舒適度與接管率,它或許不是最完美的;但如果你看的是技術的泛化能力(Generalization)與未來的上限,它正處於拋離對手的前夜。

投資科技股最難的,就是在「非線性成長」的拐點前保持耐心。

目前的 FSD 就像是 GPT-2 到 GPT-3 之間的階段。它已經展現了驚人的潛力,但還會時不時說胡話。然而,隨著算力的堆疊和數據的餵養,那個類似 ChatGPT 的「頓悟時刻(Aha Moment)」終將到來。

對於投資人而言,現在的特斯拉正處於一個極其微妙的階段:硬體毛利因價格戰而承壓,軟體營收尚未爆發。但恰恰是這種青黃不接的時刻,往往孕育著巨大的預期差。

我們正在見證的,不僅僅是交通工具的革命,更是矽基生物嘗試理解並介入碳基世界的偉大嘗試。在這場馬拉松中,跑得最快的不一定是贏家,能定義路徑並堅持跑完全程的,才是最後的王者。

你是選擇相信眼前的波動,還是相信底層邏輯的必然?這或許是我們每一位投資人都需要深思的問題。

相關文章

LINE社群討論

熱門文章

目錄