国自产拍偷拍精品啪啪,久久久久人妻一区精品色

文｜劉俊宏

編｜王一粟

“DeepSeek一開源，我們就加速了 9 個月的時間”。

距離上一次AI Talk130天，作為車圈最高年薪的老板、理想汽車創(chuàng)始人、董事長兼CEO李想，再次發(fā)布了理想最新的智駕大模型——MindVLA（視覺-語言-動作）大模型。

這款大模型曾在今年3月的英偉達(dá)GTC上亮相過，相比兩個月前的“炫技”，這次李想講了不少VLA的技術(shù)細(xì)節(jié)和產(chǎn)品表現(xiàn)。

與理想上一代的端到端+VLM智駕對比，VLA不再是之前相互獨立的“雙系統(tǒng)”架構(gòu)，而是一個具有智駕能力的多模態(tài)大模型。得益于訓(xùn)練時添加的自動駕駛資料和人類文字語料，VLA終于實現(xiàn)了類似人類司機開車的表現(xiàn)。

“ VLA是一個司機大模型，像人類的司機一樣去工作的一個模型?！?/p>

正如李想所總結(jié)，根據(jù)本次公布的視頻顯示，基于VLA的輔助駕駛系統(tǒng)可以允許駕駛員用更靈活的方式完成人機共駕。一句話，智駕可以實現(xiàn)自動選路、掉頭、轉(zhuǎn)彎、停在指定停車場的位置等等。智駕的靈活度，顯著超出了當(dāng)前主流智駕廠商所能提供的體驗。

“它是最接近人類的，甚至有機會超過人類”，李想如此總結(jié)這VLA的能力和未來。同時，身處智駕安全性被市場懷疑的風(fēng)口浪尖，李想認(rèn)為VLA技術(shù)有機會為整個行業(yè)帶來轉(zhuǎn)機，“我覺得黎明馬上就要來了”。

在整個智能汽車時代，理想是一家特立獨行的玩家。

瞄準(zhǔn)智能汽車“終點”的玩家有很多。認(rèn)為汽車智能化的前提是充足的電動化，蔚來立志要把換電站建滿全國每一個角落；認(rèn)為汽車工業(yè)的終點是規(guī)模與成本，比亞迪極致掌控生產(chǎn)的每一個環(huán)節(jié)；認(rèn)為汽車智能化就是將智能鋪滿每一個角落，華為要當(dāng)中國智能汽車的“博世”。

一直奔波于用戶需求的理想，在不斷積累的AI技術(shù)中，慢慢也構(gòu)筑了自己的技術(shù)護(hù)城河。

VLA到底是什么？在研發(fā)VLA的過程中，都有哪些技術(shù)細(xì)節(jié)？中國智能汽車廠商將在智駕研發(fā)中收獲什么？從理想的VLA中，我們看到了李想對智能汽車的“終極計劃”。

“第十個包子”，一個大模型支撐起智駕

端到端剛不到一年，智駕的架構(gòu)又迭代了。

在理想這次AI Talk上，李想詳細(xì)講述了之前發(fā)布的VLA技術(shù)——用更大的模型來“裝下”整個世界。

相比之前“端到端+視覺”兩套模型的架構(gòu)，這次是一個模型全部解決，視覺-語言-動作的三合一架構(gòu)。

一個大模型支撐智駕，已經(jīng)成為智能汽車的最新趨勢。

4月中旬，小鵬汽車也在香港披露了最新的智駕技術(shù)路線，用一個超大模型底座，支撐起整個智駕，再通過蒸餾落地到智能汽車的端側(cè)。

顯然，這里有頭部技術(shù)大牛的英雄所見略同。

回顧理想智駕的技術(shù)變化，經(jīng)歷了從規(guī)則算法、端到端+VLM，直到VLA的“三級跳”?？梢郧逦乜闯?，AI是如何逐步解決智駕中的研發(fā)痛點。

在端到端時代，AI解決的是人力寫規(guī)則的痛點。由于端到端訓(xùn)練模式相當(dāng)于用AI來生成規(guī)則，節(jié)省了大量開發(fā)時間。所以，去年整個智能汽車市場一下子冒出不少宣稱能落地城市無圖NOA的玩家。

但端到端對人類的模仿，終究難以超過人類的駕駛水平，智駕要想進(jìn)一步升級，需要AI充當(dāng)能思考的“大腦”。理想在端到端+VLM中，用了“快慢雙系統(tǒng)”的架構(gòu)來讓智駕獲得深度思考能力。VLM是一個多模態(tài)大模型，能夠針對復(fù)雜場景進(jìn)行更智能地“理解”。在看懂世界之后，VLM能調(diào)整端到端的行為，從而實現(xiàn)模擬人類大腦的“簡單反射與復(fù)雜反射”。

但是“雙系統(tǒng)”的架構(gòu)畢竟還是不夠靈活，相互獨立的雙系統(tǒng)架構(gòu)難以聯(lián)合訓(xùn)練。再加上VLM性能受到車端算力和芯片通信效率限制。實際推理效率達(dá)不到5赫茲的表現(xiàn)，很難做到實時推理。

要想進(jìn)一步提升端到端+VLM架構(gòu)的能力，需要拿出一個更加整體的、能力足夠強的、有快速推理能力的智駕大模型。

“我們對Deepseek R1從上線到后面開源都做了相當(dāng)多的研究和擁抱。DeepSeek 的速度比想象中快，所以VLA到來的速度也比想象中快。”

誠如李想在訪談中所言。理想在參考Deepseek的調(diào)整預(yù)訓(xùn)練數(shù)據(jù)結(jié)構(gòu)+后訓(xùn)練+強化訓(xùn)練的“三板斧”后，也拿出了對標(biāo)人類智能的“司機大模型”——VLA。

“訓(xùn)練VLA的過程，特別像人去駕校學(xué)開車”，李想總結(jié)說。

在預(yù)訓(xùn)練階段，理想重新調(diào)整了VLA的訓(xùn)練預(yù)料，增加了3D和自動駕駛相關(guān)圖文數(shù)據(jù)，并適當(dāng)減少文史類數(shù)據(jù)的“投喂”。訓(xùn)練之后，VLA基本上能夠媲美云廠商的通用大模型了。

為了讓VLA提升輸出效率，理想重新調(diào)整了MoE混合專家架構(gòu)，并對推理過程做了稀疏化處理。這一步操作，相當(dāng)于VLA直接用AI整理好的資料來決策，大大縮短了推理耗時。

在后訓(xùn)練階段中，理想保留了“快慢思考”的思維模型。

VLA的“快思考”模式不再直接輸出操控指令，而是輸出Action token（執(zhí)行代碼）?！奥伎肌蹦Ｊ絼t是精簡了CoT（思維鏈），保證了模型的推理速度。面對復(fù)雜場景，“慢系統(tǒng)”還會模擬出汽車行駛軌跡，用類似人類“邊做邊想”的方式，在駕駛中不斷選擇最合適的路線。

最后的強化訓(xùn)練，說白了就是用人的標(biāo)準(zhǔn)來評價VLA的駕駛表現(xiàn)。大致就是設(shè)計一些指標(biāo)，車開得舒服了，就給VLA加分；開得不舒服了或者違章了，就扣一分。一套下來，VLA就能學(xué)會怎樣成為一個“真正的司機”。

“我覺得VLA（司機大模型），就是完全人類的運作方式了?！?/strong>

正如李想的總結(jié)，“（VLA）有l(wèi)anguage（語言），也有它的CoT（思維鏈），還有推理的能力，它能夠像人類一樣地，真正地去執(zhí)行這樣的行動”。對比自動駕駛早期規(guī)則和端到端時代的技術(shù)，李想認(rèn)為VLA的突破，甚至可以將前兩個時代類比為“昆蟲智能”和“哺乳動物智能”。

既然VLA這么強，是不是意味著其他智駕廠商也能快速跟進(jìn)。甚至沒有智駕研發(fā)經(jīng)驗的傳統(tǒng)車企也能跨過端到端，一步到位到VLA？

跳過端到端實現(xiàn) VLA 根本不可行，“沒有辦法直接吃第十個包子。雖然可能大家覺得第十個包子吃飽了，但前面每個包子其實都跳不過去”。

隨后李想頓了頓，又總結(jié)了AI技術(shù)積累的重要性，“如果大家不想做前面任何包子的積累，只想吃第十個包子，就像是練葵花寶典?！?/p>

兩年4級跳，理想的技術(shù)“開天眼了”？

從2023年底，理想推送需要先驗信息的全場景NOA，到如今發(fā)布VLA。理想到底是怎么實現(xiàn)智駕能力“兩年4級跳”的？

關(guān)于這個問題，光錐智能在今年的上海車展上幾乎問遍了每一個智駕供應(yīng)商，但很可惜沒人說得清。其中一些智駕供應(yīng)商工作人員還評價說，“就像是開天眼了一樣”。

對于事務(wù)做出一針見血、穿透本質(zhì)的判斷，再沿著正確的方向找到最短到達(dá)的路徑。或許，這是理想能最快突破50萬輛年銷量，并且在兩年內(nèi)智駕快速發(fā)展到第一梯隊的最重要的一個原因。

在幾次和李想及理想智駕團(tuán)隊深度溝通的過程中，光錐智能發(fā)現(xiàn)這種思維方式貫穿了許多理想解決問題時的方式。

“當(dāng)我們想去構(gòu)建能力的時候，DeepSeek給你展示了一個最佳實踐，第一步一定要先搞研究。就是任何的時候，當(dāng)我們想去改變能力和提升能力的時候，第一步一定是搞研究，研究完了才搞研發(fā)?！?/strong>

正如李想評價從Deepseek上學(xué)到的經(jīng)驗——理想在研發(fā)VLA的時候，很多關(guān)鍵技術(shù)節(jié)點的迭代都算得上是“相互支撐”和“不謀而合”。

作為佐證，李想在智駕團(tuán)隊在芯片上優(yōu)化FP8（8 位浮點數(shù)格式）的時候，跟謝炎（理想汽車CTO）達(dá)成意見一致要訓(xùn)練一個語言模型。但沒想到陳偉（理想汽車基座模型負(fù)責(zé)人）早就已經(jīng)這么想了?！瓣悅ケ任覀冞€堅決”，李想說。

為什么李想能夠發(fā)現(xiàn)軟件基礎(chǔ)相當(dāng)重要？因為在開發(fā)VLM的時候，積累了軟件底層開發(fā)能力。“本來Orin芯片是不支持跑語言模型的。但因為英偉達(dá)沒時間，所以我們自己寫了底層推理引擎”，李想回憶說。

如此一來，理想的汽車操作系統(tǒng)（星環(huán)OS）和基座大模型戰(zhàn)略也串聯(lián)了起來。

針對芯片底層推理引擎的開發(fā)，讓理想意識到了智駕芯片底層數(shù)據(jù)傳輸?shù)倪壿?。星環(huán)OS架構(gòu)的搭建方式，就是圍繞智駕到車控這條通道而建設(shè)的。理想目前開源的，也正是車控操作系統(tǒng)、智能駕駛操作系統(tǒng)、通信中間件、虛擬化平臺這四個組件。

另一邊，由于VLA算是一個通用多模態(tài)大模型，所以理想的整個汽車座艙也打通了語言與智駕之間的隔閡。

在演示中看到，在輔助駕駛狀態(tài)下，駕駛員說出駕駛指令，車輛就能立馬執(zhí)行。無論是說走人工還是前面左轉(zhuǎn)，汽車都能在保持正常輔助駕駛的前提下，執(zhí)行新路線。

對比目前主流其他智駕廠商，VLA當(dāng)前展現(xiàn)的能力稱得上是“遙遙領(lǐng)先”。當(dāng)其他智駕要駕駛員停車重新設(shè)置目標(biāo)點的時候，理想不僅能保持流暢行車狀態(tài)，而且還不需要司機說出具體的目的地。

“它變得更像人。其實沒什么驚奇的，你都知道它的原理了”。

正如李想所總結(jié)，“你跟司機怎么說話，那就怎么跟司機Agent說。短指令的話，VLA直接就能在車端處理了。長指令交給云端模型處理，然后再由VLA執(zhí)行?！?strong>當(dāng)智駕能看懂世界、理解語言，還能懂你意思，VLA就變成了司機Agent。車輛成為能與用戶溝通、理解用戶意圖的智能體。

如果說，去年發(fā)布端到端+VLM時候的理想，是想要炫耀端到端的能力。那么，如今的理想已經(jīng)通過AI基礎(chǔ)技術(shù)研發(fā)，構(gòu)建起了軟件能力的護(hù)城河。

但AI基礎(chǔ)研究的路線到底能通往哪里？李想不太能確定，“我覺得沒有辦法預(yù)測，我們前面沒有任何人走過這條路。DeepSeek沒走過，OpenAI、谷歌、Waymo也沒有走過這條路?！?/p>

“我們其實走的是一個無人區(qū)”。

理想和中國智能汽車，共闖無人區(qū)

其實在整個智能汽車時代，中國汽車行業(yè)的玩家都是在“無人區(qū)”中摸索著前進(jìn)。

到底什么樣的汽車才算是智能汽車？車企要如何競爭才能取得時代勝利？近五年間，我們見證過太多“答案”。

“理想的基因是為用戶創(chuàng)造價值?！?/strong>

正如李想在訪談中所言，今年即將迎來十歲生日的理想，走的是與行業(yè)其他玩家與眾不同的路子——在滿足用戶的需求中，在不斷地解決問題中成長。

例如在汽車電動化及相關(guān)配套設(shè)施還不完善的時期，理想先推出了增程式的車型滿足用戶需求。用“冰箱彩電沙發(fā)”定義了早期汽車智能的“模板”。而彼時的汽車行業(yè)還在糾結(jié)，增程式到底是不是落后技術(shù)，“冰箱彩電沙發(fā)”到底算不算是“花架子”。

站在2025年的上海車展上，“冰箱彩電沙發(fā)”早已成了每一輛新車的標(biāo)配。汽車行業(yè)也早就沒了關(guān)于增程技術(shù)落后的討論，反而是不少消費者“要求”純電汽車品牌也推出增程式版本。

“到了今天，還能看到至少有5個的企業(yè)是因為當(dāng)時理想L9的成功，在打造跟理想L9相同的產(chǎn)品?！崩钕胝f。

專注滿足用戶需求的結(jié)果，就是理想汽車在過去的五年中，合計賣出超過100萬輛車。李想今年年初的內(nèi)部信，定下了2025年要占據(jù)20%中國智能電動車市場份額的目標(biāo)。換算下來，銷量要達(dá)到160萬輛。

“我只能做最好的自己，在自己長板的延長線上來做，而延長線最終帶來了無人區(qū)?！?/strong>

誠如李想所說，理想的成就是不斷延長自身優(yōu)勢的結(jié)果。但如果我們用更大的尺度觀察中國汽車行業(yè)。中國智能汽車行業(yè)如今領(lǐng)先全球的盛況，其實也是各家車企不斷探索自身“長板”的結(jié)果。

二十年前，中國汽車想要實現(xiàn)技術(shù)突破非常困難。在全球汽車巨頭早已搭建好的利益關(guān)系網(wǎng)中，任何中國車企技術(shù)研發(fā)都要面臨國際技術(shù)專利的壁壘。想要拿下技術(shù)授權(quán)，想要在海外銷售自主品牌，就得仿照吉利收購沃爾沃。

在智能汽車時代，如今的中國汽車產(chǎn)業(yè)鏈已經(jīng)有不少玩家“不怎么在乎”國際巨頭的技術(shù)封鎖了。

例如在智駕上，中國已經(jīng)有不少廠商開始了對外輸出（小鵬、地平線、Momenta、華為等）。在汽車OS的設(shè)計上，不只是理想的星環(huán)OS，還有不少芯片廠商也參與了車機系統(tǒng)的設(shè)計，例如地平線的HSD界面、鴻蒙車機等。在國外汽車巨頭最自豪的底盤調(diào)教環(huán)節(jié)中，比亞迪、華為、蔚來等玩家在用智能底盤攻城略地。

要知道，過去中國汽車產(chǎn)業(yè)鏈用的幾乎都是國際巨頭們已經(jīng)“給好”的模板。

“我覺得DeepSeek的出現(xiàn)，對我們加速做VLA是巨大的幫助。”談到為什么決定開源星環(huán)OS，李想感慨萬分，“我們受到了那么大的幫助，所以在想我們能對社會做點什么貢獻(xiàn)”。

光錐智能大致看了下開源文件，readme文件（可以理解為是說明書）寫的比較詳細(xì)，理想真的想讓大家用起來。

當(dāng)前，汽車操作系統(tǒng)已經(jīng)被提升到智能汽車“新三大件”，理想的星環(huán)OS大概率不會像Deepseek一樣，被各大汽車廠商“拿來就用”。但對于汽車行業(yè)來說，有星環(huán)OS作為參考，一定是一件好事。

越開放、越上升，這樣的技術(shù)和產(chǎn)業(yè)的螺旋式升級，不只發(fā)生在智能汽車和AI產(chǎn)業(yè)鏈里，最終，將潤物細(xì)無聲般地滲透到中國經(jīng)濟(jì)的方方面面。

本文來自投稿，不代表增長黑客立場，如若轉(zhuǎn)載，請注明出處：http://m.gptmaths.com/cgo/134835.html

理想闖入智駕“無人區(qū)”

關(guān)于作者

光錐智能

發(fā)表回復(fù)

理想闖入智駕“無人區(qū)”

關(guān)于作者

光錐智能

增長黑客Growthhk.cn薦讀更多>>

【報告解讀】《2024-2025年中國新生代媽媽群體觸媒行為及營銷趨勢報告》（附下載）

朋友圈社交電商的裂變邏輯

電子煙：一個帶刺的新風(fēng)口

用戶規(guī)模觸頂，拼多多de下一個增長引擎

長視頻不惑2022，冷靜開發(fā)火熱市場

數(shù)字化浪潮下的新風(fēng)險：MSS安全托管成新藍(lán)海

發(fā)表回復(fù)