理想智駕“零接管”背后,李想的AI哲學

“讓泛化的事情交給大模型,讓收斂的事情交給規(guī)則?!薄钕?/p>

理想智駕“零接管”背后,李想的AI哲學

文|劉俊宏

編|王一粟

2025剛開年,智能汽車今年競爭的主旋律便已經(jīng)定調。隨著武漢、北京等城市即將允許L3自動駕駛上路,卷了一年高階智駕落地的玩家們終于到了“決戰(zhàn)時刻”。

面對這場競爭,理想汽車(下簡稱“理想”)選擇率先出手。

1月16日,理想汽車全量推送了OTA7.0版本車機系統(tǒng),并將高階智駕升級到 AD Max V13.0版本。與特斯拉的“期貨”不同,理想已經(jīng)給車主們準備好了擁有800萬clips訓練數(shù)據(jù)、無限接近零接管、全場景端到端、車位到車位“絲滑無斷點”的智駕體驗。

值得注意的是,此次明確的智駕版本號,背后是理想要讓用戶更好感知智能駕駛變化的決心。事實上,自理想OTA 5.0切換BEV架構,上線城市NOA以來,理想內部就啟用了AD Max的獨立版本號進行管理。如今的V13.0版本,意味著過去一年理想共完成了12次AD Max重大更新。并且后續(xù)AD Max版本號也將按照產(chǎn)品的更新及優(yōu)化進行版本號迭代和維護。

政策的松口、無限接近“零接管”智駕的落地,意味著一個新的高階智能駕駛的時代已經(jīng)到來。

在智駕落地的壓力下,車企和智駕供應商們開始“著急”起來。其中,奧迪和廣汽全面抱上了華為的“大腿”;比亞迪宣稱要在智能化方面投入1000億;地平線新推出了智駕掉頭和園區(qū)漫游功能。

就在智能汽車玩家們狂卷智駕能力的節(jié)點上。理想汽車CEO李想?yún)s在2024年12月25日-27日連續(xù)的三天理想AI Talk中,再次強調理想汽車將成為一家全球領先的人工智能企業(yè)。

為何理想要在汽車智能化競爭最激烈的時刻認為AI比汽車更重要?背后或許是李想洞察到公司落地AI所取得的成果。

聚焦產(chǎn)品層面,理想在2024年實現(xiàn)了汽車智能化從追趕、持平到領先的追越。在智駕上,理想僅用了3個月便完成了無圖NOA到端到端+VLM智能駕駛的迭代。在技術的迭代下,消費者也形成了理想=智駕的認知。

統(tǒng)計數(shù)據(jù)顯示,截至2024年12月31日,理想NOA導航智能駕駛里程已占智駕里程的70%。同時,在理想產(chǎn)品最主要的30萬及以上的價格段內,AD Max(智駕頂配版)的交付量超過75%。

“增強我的能力、成為我的助手、成為我的硅基家人”。

隨著用戶對智駕逐漸依賴,李想也看到了一條AI連接物理世界和數(shù)字世界的道路。AI以汽車作為載體,為用戶提供越來越豐富的服務和價值?;蛟S在李想看來,未來Robotaxi提供的服務還是過于“冰冷”,有人情味的“車和家”才是更接近智能汽車產(chǎn)品的第一性。

為了實現(xiàn)AI能更懂人類的夢想,據(jù)理想汽車數(shù)據(jù)顯示,每年投入上百億元研發(fā),有近50%用于投入AI。在大模型這邊,李想也提出了公司要在未來幾年內把大語言模型的基座模型做到行業(yè)前三的要求。如此,在視頻(VLM)大模型的結合下,懂視覺和語言的AI,最終將徹底理解這個世界。

在2024年完成智駕趕超的理想,能實現(xiàn)李想宏大的AI理想嗎?

L3智駕,理想準備好了

“下半年如果我還看不到變化,理想智駕拿不到頭部位置的話,那你這個負責人就可以不用干了?!被貞浧?024年初李想對智駕落地的督促,理想汽車自動駕駛研發(fā)副總裁郎咸朋至今都倍感壓力。

在李想看來,理想汽車是否能順利落地高階智駕,已經(jīng)到了影響“生死存亡”的地步。

而在此之前的2023年,郎咸朋帶領的團隊和國內大多數(shù)的智駕公司一樣,一直在嘗試用規(guī)則的方式解決Corner case(邊界情況),就是出一個問題,寫一個代碼去解決。這導致理想汽車在2023年落地高階智駕的節(jié)奏整體偏慢。

2024年上半年,高階智駕已經(jīng)成為消費者選車考慮的重要因素。根據(jù)工業(yè)和信息化部披露的數(shù)據(jù)顯示,中國乘用車L2級輔助駕駛及以上新車滲透率達55.7%,其中具備領航輔助駕駛(NOA)功能的新車滲透率達到11%。

換句話說,是理想產(chǎn)品主打的30萬及以上的價格段內(在整體車市的銷量占比大概為15%左右),消費者已經(jīng)形成了標配高階智駕的共識。

事實上,理想智駕起步的目標非常高。早在2023年4月的上海車展,理想汽車就喊出了城市NOA落地100城的目標。但半年過后,這個目標就縮水為“在100城開通通勤NOA”。2024年初,李想帶隊前往美國體驗特斯拉FSD,隨后理想的智駕才開始轉向無圖NOA。

此時,各路智駕供應商們,開始向車企兜售無圖NOA解決方案。同時,由于AI大模型的催化,智駕技術領先的玩家們也都開始了初步“端到端”的探索。

“還是回歸產(chǎn)品和用戶體驗上,而不是追求指標的領先?!闭\如郎咸朋所說,在與李想達成智駕研發(fā)要用“端到端”技術和注重體驗的共識之后,2024年4月開始,理想的智駕能力“直線起飛”。

以OTA大版本為節(jié)點,在2024年5月,理想智駕主要還是聚焦在場景細節(jié)調優(yōu)。從7月的6.0版本更新無圖NOA開始,理想智駕開始更注重功能和體驗。

理想智駕“零接管”背后,李想的AI哲學

作為佐證,理想在2024年8月更新的車位隨心畫功能,智駕能夠理解用戶的停車意圖,想停哪里就停哪里。離車泊入功能也升級到了關門泊入,在用戶對理想智駕的信任下,用戶自動泊車再也不需要掏手機控制了。

10月,理想智駕更新至“端到端+VLM智能駕駛”后,理想的智駕能力再一次飛躍式提升。光錐智能在實際體驗之后,發(fā)現(xiàn)這個版本的智駕不僅能順利通過環(huán)島。而且在無保護右轉時,不會向其他廠商的智駕一樣,還需要“踩一腳剎車”。

理想智駕“零接管”背后,李想的AI哲學

理想智駕“零接管”背后,李想的AI哲學

參考理想用戶社區(qū)@仟仟爸爸的分享,理想智駕能夠輕松面對環(huán)島+突然加塞+變道繞行的復雜操作。用戶全程只是吐槽了一下加塞車輛,然后用“也行”,點評了一下變道操作。

理想智駕“零接管”背后,李想的AI哲學

如今,隨著已經(jīng)推送的AD Max V13.0更新,可以預見,理想智駕在復雜的中國道路可以實現(xiàn)“零接管”。這也是符合自動駕駛L3標準的表現(xiàn)。

消費者也開始逐漸信任智駕,并愿意為此買單:“買理想就買智駕版”,成了消費者的共識。

李想曾經(jīng)在采訪中對光錐智能透露,2024年上半年,理想曾經(jīng)有幾個月被問界的銷量壓制的很難受,但在智駕能力上升后,理想的銷售們都能挺起腰桿讓消費者“隨便對比”,而后,理想的銷量也隨之打了一個漂亮的翻身仗。

根據(jù)理想統(tǒng)計的數(shù)據(jù)顯示,截至2024年12月31日,NOA導航智能駕駛里程已占智駕里程的70%。這意味著,NOA已經(jīng)替代了原先大量輔助駕駛的使用,類似LCC(車道居中保持)等功能,正在“撤離”用戶心智。另一邊,在端到端全量推送一周內,理想注意到有3600位之前從未在城市使用NOA的車主開始每天使用該功能。并且,這些用戶每天的導航里程提升了兩倍,這意味著用戶已經(jīng)相當依賴智駕了。

在銷售端,理想智駕也已經(jīng)成了潛在客戶最重要的購車原因之一。據(jù)統(tǒng)計,截至12月31日,理想NOA試駕占比超72%。30萬以上車型AD Max交付量占比超75%,40萬以上車型AD Max交付量占比超84%。這樣的銷量構成,意味著消費者幾乎是因為理想智駕而選購理想汽車。

可以看到,在智駕經(jīng)歷不到一年的迭代中,理想不僅實現(xiàn)了智駕跨越式升級,還更新了品牌的消費者認知。如今的理想,已經(jīng)從此前“冰箱、彩電、沙發(fā)”的標簽,切換到了智駕(AI)實力派。

為何理想的AI進展能如此之快?

或許正如李想與郎咸朋在討論智駕方向時所言,?“要么做端到端,要么別做自動駕駛了”。在AI時代,選對路徑比一味的努力更重要。

對標“人”,理想智駕的第一性原理

在人類研究AI的60余年里,科學家們得到次數(shù)最多的教訓便是方向比努力更重要。

以AI大模型的基礎架構Transformer為例,雖然谷歌的科學家在8年前提出了Transformer,但谷歌在研究方向的猶豫,讓OpenAI率先完成了ChatGPT,顛覆了谷歌此前在NLP領域不少心血。

同樣的感慨,也發(fā)生在理想轉向“端到端”之后。

“比之前所有車的狀態(tài)都要好,剎車非常擬人舒適,這些問題在規(guī)則階段用很多代碼都沒辦法解決?!痹诓捎枚说蕉藘H僅15天之后,看到新技術架構對過去的顛覆,郎咸朋不禁驚嘆道。而實現(xiàn)這種差異的過程,理想智駕算法研發(fā)部門負責人賈鵬總結說:“一行規(guī)則都沒寫,全是系統(tǒng)按照給的數(shù)據(jù)訓練出來的?!?/p>

回顧理想的三次智駕技術變遷,從NPN(先驗信息)到無圖NOA,再到如今的端到端+VLM雙系統(tǒng)架構,每一代都在根本上顛覆了上一代的設計架構。

理想智駕“零接管”背后,李想的AI哲學

其中,無圖NOA為了替代NPN必須的先驗信息(一般是指高精地圖),智駕系統(tǒng)強化了感知和規(guī)劃模塊,將智駕從原本的“開卷答題”轉向到“閉卷作答”。端到端對無圖NOA的提升,主要在于端到端用AI學習取代了無圖NOA的人力編寫規(guī)則模塊,相當于原本智駕“背公式”轉向到“隨機應變”。

由此看到,設計更好的AI架構,智駕也更接近實現(xiàn)全自動駕駛。

理想?yún)⒖剂巳祟愡壿嬎季S中的下意識反應和深思熟慮,將整個智駕系統(tǒng)拆解成了“快慢”雙系統(tǒng)(對應系統(tǒng)一和系統(tǒng)二)。

理想智駕“零接管”背后,李想的AI哲學

其中,系統(tǒng)一是完全的端到端架構。智駕模仿人類面對正常路況的操作,這時候控制車輛“加減速”不需要思考太多。系統(tǒng)二則是在端到端的基礎上,理想“外接”了一個多模態(tài)大模型(VLM)。利用多模態(tài)大模型對圖片、文字等信息的理解能力,系統(tǒng)二能為系統(tǒng)一提供真實世界的認知。

為何理想的架構與市面上玩家都不同,既不是特斯拉用單個端到端模型“暴力破解”人類操作,也不是小鵬、華為、蔚來等分段式端到端的路線?

因為,這么設計能帶來更快的智駕迭代速度。

具體而言,是端到端部分負責快速學習投喂的clips(視頻片段)。通過對人類操作的模仿,智駕系統(tǒng)能快速學到與“老司機”近似的操作水平。

“我們起初投喂80萬clips的時候,還過不了環(huán)島。后來當數(shù)據(jù)量達到100萬clips時,他自己就能過環(huán)島了。我覺得是100萬clips里頭剛好有一些環(huán)島數(shù)據(jù)的原因。模型確實很神奇,你喂了什么數(shù)據(jù),他就能學會相應能力?!辟Z鵬解釋說。

另一邊,借助能理解真實世界信息的VLM,整個智駕系統(tǒng)還能方便投入到世界模型中參與“考試”,從而實現(xiàn)針對能力訓練和模擬智駕在Corner case中的表現(xiàn)?!拔覀冞€會根據(jù)所有的數(shù)據(jù)生成“模擬題”,針對模型容易出問題的部分,再生成一些內容訓練。”郎咸朋說。

理想富有創(chuàng)意的架構設計,一經(jīng)發(fā)布便斬獲行業(yè)內多個獎項。2024年,理想智能駕駛的DiVE(世界模型)及StreetGaussians(世界模型)發(fā)表在了ECCV 2024上,DriveVLM(雙系統(tǒng))發(fā)表在了CoRL 2024上,獲得行業(yè)的一致認可。

總之,面向2025年即將推廣的L3自動駕駛,坐擁110.9萬用戶、智駕總里程累計達29.3億公里、800萬clips投喂、8.1EFLOPS訓練算力,并且每年訓練算力的投入超過10億人民幣(以上數(shù)據(jù)截至2024年12月31日)的理想,已經(jīng)做好了十足的準備。

隨著理想對智駕的深入研究,其AI基礎能力也在快速升級。

其中,為了在芯片層繼續(xù)優(yōu)化智駕能力,理想即將流片自己專用的智駕SoC。原本用于座艙助手的理想同學,現(xiàn)在也登陸手機,對標ChatGPT、豆包等通用智能體。在汽車AI能理解人類之后,李想也開始考慮起人工智能的下一個形態(tài)——機器人。

汽車之外,理想要用AI做更多產(chǎn)品了。

李想的理想,打通硅基世界

理想汽車至今的成功,背后離不開李想頂級的產(chǎn)品能力。

細細復盤李想的每次創(chuàng)業(yè),都能看到他以“超級產(chǎn)品經(jīng)理”的姿態(tài),對每個行業(yè)的高舉高打。每次切入一個新賽道,李想都能看到行業(yè)最根本的發(fā)展主線。

理想智駕“零接管”背后,李想的AI哲學

例如,2005創(chuàng)立汽車之家時,李想看到了中國消費者巨大的汽車消費潛力,但缺乏了解渠道的困境。為了滿足消費者對汽車產(chǎn)品的好奇,汽車之家主打汽車評測,一舉打敗了主做車友會的愛卡汽車網(wǎng)。

2015年創(chuàng)立理想汽車時,李想看到的是中國汽車在電動化和智能化存在機遇,同時傳統(tǒng)汽車供應鏈早已成熟的情況。為了在最低限度打造一款智能汽車,李想盡可能采用成熟的技術和設計。避免了里程焦慮、空間不夠、不舒適等新能源汽車常見問題的理想ONE,開賣即爆款。

在AI大模型時代剛剛開始的2023年初,看到ChatGPT的橫空出世,李想在1月發(fā)布的全員信中提到,公司將在2030年成為全球領先的人工智能企業(yè)。隨后在李想的號召下,理想快速跟上了行業(yè)每一個AI落地的風口,AI從隱藏戰(zhàn)略變成了“陽謀”。

“AI意味著未來的全部?!闭\如李想在2024年12月的理想AI Talk上對AI的看法。隨著理想對AI的落地,李想也慢慢看到了AI應用更廣袤的視野。

在智艙領域,是理想為了追趕大語言模型的熱度,2023年一季度理想開始了Mind GPT項目,并在2023年6月的理想家庭科技日發(fā)布會上發(fā)布。2023年年底,Mind GPT隨著OTA 5.0上車,跟上了行業(yè)用大語言模型提升車機智能化的趨勢。如今,結合VLM對視覺世界的理解,理想“摸到”了AI融合的邊界。

“基座模型到一定時刻,一定會變成VLA(視覺語言行動模型,可以理解成真正能理解世界的智能)。因為語言模型,也要通過語言和認知去理解三維的世界?!闭缋钕胨f,隨著AI對世界愈發(fā)理解,語言、圖片、生成、硬件的邊界即將被打破。

“一個真正的大模型產(chǎn)品,一定是能夠去自主使用所有的設備,會擁有所有的服務,這才是真正的人工智能。”正如李想所言,AI產(chǎn)品的核心邏輯其實與智駕一模一樣。

都是從小范圍、標準化的場景出發(fā),到逐漸適應更多場景,為客戶提供更多樣的服務。最終打破硬件的壁壘,同一個AI能同時落地到全場景的智能硬件。換句話說,能聽懂指令并能自覺執(zhí)行任務的機器人,何嘗又不是一種帶著乘客“逛街”的自動駕駛呢?

“普通老百姓都能用了,它能獨立地、持續(xù)地、連續(xù)地完成任務,而不需要靠密集的提示詞?!崩钕胝f。

或許,在AI即將大范圍落地端側的2025年里,李想看到了AI終將打通硅基世界的未來。

本文來自投稿,不代表增長黑客立場,如若轉載,請注明出處:http://m.gptmaths.com/cgo/130141.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2025-01-21 09:46
下一篇 2025-01-21 18:14

增長黑客Growthhk.cn薦讀更多>>

發(fā)表回復

登錄后才能評論