秋鳳空間 | 蘇箐講自動駕駛:玩命卷,但能掙錢

秋鳳空間 | 蘇箐講自動駕駛:玩命卷,但能掙錢 -

作者 | 王秋鳳

如果將蘇箐12月8日在地平線生態大會上的講演,看做本年度“最重量級”技術講演,可能有爭議。從啟發性上來看,其信息含量還是相當出眾的。這麼評價似乎並不為過。

有人嘲笑蘇箐前半段講的非常悲觀,講到後來突然想起地平線副總裁兼首席架構師的角色,才開始“強行樂觀”。這種說法並不公平,誰規定演講只能有一個底色,一段劇情還講究起伏。即便通篇講的都是自動駕駛技術發展的現狀和預期,但技術及技術的商用化有不同的維度,分別給出不同預判很正常。

興盡悲來

蘇箐演講的核心觀點很清楚:從l2向l3發展的過程中,我們成就很大,但即將觸碰到“天花板”。

所謂成就,就是終於確定了“一段式”端到端,為唯一合理技術路徑。蘇箐對特斯拉fsd v12評價很高(這和他在華為對特斯拉的評價截然相反)。2024年這一版出來之後,特斯拉智駕是不是最強不重要,重要的是方向對了。所有的行為決策裡面,終於用數據驅動,全面取代了規則驅動。

秋鳳空間 | 蘇箐講自動駕駛:玩命卷,但能掙錢 -

此前深度學習只解決了感知的數據驅動,後半段行為決策(就是具體如何開車)仍是規則,這樣就有解決不完的長尾問題。就像好不容易洗乾淨一批臟衣服,下批送來的仍然是髒的要命,這簡直令人絕望。

這迫使大家都拿高精圖來“補”。因此我們能看到,從2018年~2023年,很多大公司,都拚命地在各大城市“掃街”(用導航車繪製高精圖)。余承東還抱怨,上海剛掃完一個月,路況又變了(雖然只是個別變化),以至於高精圖的成本根本控制不住。

“補”的到底是什麼?顯然是靜態的先驗信息,即所謂的“交通語義”——車道線、路肩、坡度、車道銜接、信號燈、交通標誌等,以降低寫規則的壓力。這就是為什麼,當時大家需要高精圖。

而一段式端到端+輕圖,地圖可以不必標太細緻,因此也就不用反覆掃。重要的是前半段感知和後半段行為,終於用一個方法串起來了。即transformer注意力機制下的標準算子,終於隨着參數規模而“湧現”(表現出智能)。

但是現在,可能即將觸碰到深度學習的天花板了。transformer可以持續迭代,做的更“類人”,蘇箐暗示不會超過人類駕駛,這意味着l5絕對沒戲。未來幾年做苦工,就是這部分訓推工作。支撐下一個突破的基本算子,一點影子都沒有。一個新理論的誕生,可能需要10、20年才能到工程實現這一步。既然新理論尚未誕生(有小的可能誕生了,但我們沒意識到其價值),那麼下一個突破就遙遙無期。這才是悲觀的最大理由。

如果蘇箐的說法成立,2024年的自動駕駛,可能是未來5~10年高點。有點“興盡悲來,識盈虛之有數”的味道。

秋鳳空間 | 蘇箐講自動駕駛:玩命卷,但能掙錢 -

樂觀在商業紅利上

既然如此,樂觀到底在何處呢?現在工程界已經將l2、l3、l4路徑收斂到一個端到端內核上。沿着這條路,有可能攀升到l4,儘管是有很多限制條件的l4(比如有限odd區域),但也改變了兜底負責的主體,從駕駛員轉為車企。

另一個樂觀之處在於,l2現在做的很類人了,會有一個紅利期。原來在高檔車上才能搭載的系統,現在可以放在10萬的車上,也挺好用。表面看上去是硬件成本攤薄(傳感器和soc降價),實際上是算法給後台支持做了減法。包括對減輕對地圖的依賴,訓練成本更低等。

這就是“智駕普惠”的底氣。有沒有可能在將來實現l3,甚至有限l4的低成本上車,當然有可能。蘇箐甚至預測乘用車和robotaxi雙模部署(一輛車上同時擁有l2和l4)。如果實現,對網約車市場將構成顛覆性改變。

秋鳳空間 | 蘇箐講自動駕駛:玩命卷,但能掙錢 -

l4攀登路徑不明

現在l3量產上路,加了很多限制條件。l4實現路徑如何?現在l4明顯存在瓶頸,高成本的配置(傳感器昂貴)和odd範圍有限(比如亦庄的robotaxi運營)。真正有商業價值的是大範圍的l4(比如超大城市全城範圍)。當前在每個小的odd內打磨l4,開發效率太低了。線性遞推的結果,就是成本高到天上。

蘇箐將希望寄托在“世界模型”上。雖然世界模型在l2上只能做短時間預測(2、3秒),主要用於防止aeb誤動作。但當前主流是基於編碼器架構進行軌跡採樣,更好的方向,恐怕仍然是因果推理模塊,這樣可以做更長時間的預測,比如5~10秒。這就很像人腦在開車時的思考方式。但類似模型非常不成熟,尚未看到工程化的跡象。

預測時間更長,就意味着必須進行多分支虛擬世界的推理(有點像奇異博士在《復聯4-終局之戰》里預測1000多萬個鋼鐵俠與滅霸戰鬥的不同結局),然後找出最優方案。這只是理論上的目標,如何評估每一條虛擬分支的價值(即某個駕駛方案的好與壞)?可能要用到價值判斷,這可能順便搞定端到端這個“黑盒子”的可解釋性,相當於一舉兩得。但工程上到底如何實現,眼下沒人知道。蘇箐雖以“l2到l4平滑過渡”來描述,但他主要指的是用同一條路徑就可以達致,但怎麼個“達致”法,要留給未來。

他隱約覺得,堆算力總有盡頭(中國的限制條件在商業效益,而美國則在於電力)。芯片定製化(多核集成npu、gpu等),則能減低功耗,提升效率,但效能達到什麼程度,才能解鎖長時間預測能力,又是一個未解的謎題。

秋鳳空間 | 蘇箐講自動駕駛:玩命卷,但能掙錢 -

結 語

如今,像地平線這種公司,已經從硬件(soc)製造,逐漸將手伸向算法,做成軟硬一體的整體封裝方案,供主機廠採購,由後者更多釋放到普及型車型上去。這個採購量如果帶起來,對整個汽車產業的智駕供應鏈都有影響。這也意味着芯片設計公司,從tier2升級為tier1。

顯然,自動駕駛方案公司(比如華為、momenta、元戎等)並不樂見,因為多了對手。而且這樣的對手成本更低,還不要產品定義權,應該是勁敵。

基於以上技術上的探討。未來幾年,全新方法突破不能指望,大家還是要在同一個工程理論上玩命卷完善體驗。這也喻示着中期自動駕駛產業競爭,檔次提不上去,但足夠慘烈。

–  e n d   

秋鳳空間

無肇因之始,無自限之垣

品茗聚友,坐而論道。

分享你的喜愛