文|劉俊宏
編|王一粟
悶熱的場館里,興奮的議論聲,所有人生怕錯(cuò)過這場AI讓機(jī)器人進(jìn)化的盛宴。
8月21日,2024世界機(jī)器人大會(huì)(WRC)在北京開幕。在這場由169家企業(yè)攜600余款產(chǎn)品的展會(huì)中,具身智能以幾乎單獨(dú)“承包”一個(gè)場館的陣仗,27家公司的人形機(jī)器人和機(jī)器狗吸納了最多的觀眾。
在眾多機(jī)器人的演示中,光錐智能發(fā)現(xiàn)各家企業(yè)執(zhí)行復(fù)雜任務(wù)的能力明顯變強(qiáng),實(shí)用性也得到了很大的提升。
相比去年機(jī)器人更多演示跳舞、對(duì)話、走兩步的簡單任務(wù)能力,今年有偉景智能機(jī)器人摘水果、優(yōu)必選機(jī)器人檢修汽車、星辰智能機(jī)器人寫毛筆字、加速進(jìn)化的人形機(jī)器人足球比賽。宇數(shù)科技在表演了連續(xù)側(cè)身翻跳躍的機(jī)器狗外,還帶來了定價(jià)9.9萬元的人形機(jī)器人——G1。在眾多廠商機(jī)器人的能力演示和價(jià)格的發(fā)布中,人形機(jī)器人距離走向現(xiàn)實(shí)的時(shí)刻越來越近。
“大模型的發(fā)展,極大地促進(jìn)了人形機(jī)器人的進(jìn)步?!?/strong>
科大訊飛副總裁、研究院院長劉聰對(duì)光錐智能稱,不管是“大腦”感知和理解的能力,還是“小腦”的運(yùn)動(dòng)控制能力都大幅提升。
進(jìn)一步,逐際動(dòng)力聯(lián)合創(chuàng)始人兼COO張力認(rèn)為,AI的進(jìn)化讓機(jī)器人實(shí)現(xiàn)了跨越式的提升,“通用人工智能讓軟件、算法能夠幫助機(jī)器人去實(shí)現(xiàn)很多以前根本完成不了的事”,
隨著AI大模型的突破,今天的人形機(jī)器人開始向著自動(dòng)駕駛的方向發(fā)展。在借鑒了端到端大模型讓汽車一邊理解世界,一邊快速迭代的進(jìn)化中,機(jī)器人也展現(xiàn)出了能夠理解復(fù)雜指令和學(xué)習(xí)更流暢的動(dòng)作。同時(shí),在大模型訓(xùn)練需求下,人形機(jī)器人也來到了數(shù)據(jù)驅(qū)動(dòng)智能迭代的階段。而各家機(jī)器人廠商也在試圖從家用、工業(yè)、倉儲(chǔ)物流、零售等一系列場景中占得一席之地。希望以單一場景為中心取得數(shù)據(jù)和迭代的閉環(huán)后,打通不同領(lǐng)域,最終走向通用。
盡管在過去AI發(fā)展的十年中,機(jī)器人曾經(jīng)歷多次希望和幻滅。但通過本次機(jī)器人的明確進(jìn)化方向,星塵智能創(chuàng)始人來杰興奮地稱,“下一個(gè)十年,最值得做的就是人形機(jī)器人”。
機(jī)器人正在掀起一場資本、技術(shù)和產(chǎn)業(yè)的共同狂歡。
資本相信人形機(jī)器人
“這兩年看到最多的投資,除了大模型就是機(jī)器人”,劉聰對(duì)光錐智能稱。
雖然人形機(jī)器人行業(yè)尚處能力演示的階段,但投資者和創(chuàng)業(yè)者們都知道,不能錯(cuò)過這場風(fēng)口。
在回顧近一年來的投資趨勢后,我們發(fā)現(xiàn)人形機(jī)器人作為熱度最高的機(jī)器人終極形態(tài),技術(shù)和難度都最高的同時(shí),也在資本市場中占領(lǐng)了高地。
創(chuàng)業(yè)者層面,IT桔子數(shù)據(jù)顯示,2023年1月至今國內(nèi)共成立了29家人形機(jī)器人公司,其中有22家已經(jīng)獲得至少1輪融資。其中,由前華為天才少年“稚暉君”創(chuàng)立的智元機(jī)器人,在成立17個(gè)月就完成了七輪融資,投前估值已達(dá)70億元。
站在資本的角度,根據(jù)《中國電子報(bào)》的不完全統(tǒng)計(jì),2024年上半年全球人形機(jī)器人領(lǐng)域融資事件超過22起,融資金額超過70億元。對(duì)于人形機(jī)器人的投資熱情,不少投資機(jī)構(gòu)的布局堪稱“掃貨”。
藍(lán)馳創(chuàng)投合伙人曹巍表示,在機(jī)器人領(lǐng)域已經(jīng)投資了超過10家早期項(xiàng)目。經(jīng)緯創(chuàng)投更是手握宇樹科技、智元機(jī)器人、銀河通用、星塵智能,四家人形機(jī)器人公司的“明星天團(tuán)”。
“行業(yè)和資本都對(duì)機(jī)器人的未來很樂觀,畢竟這是個(gè)萬億的市場”。在大會(huì)現(xiàn)場,優(yōu)必選全球營銷總監(jiān)李卓對(duì)光錐智能稱。
于是,人形機(jī)器人在軟件、硬件、資本推動(dòng)、前沿應(yīng)用效果的共同作用下,成了AI時(shí)代最熱門的賽道。
以宇樹科技在2023年初才開始探索人形機(jī)器人的經(jīng)驗(yàn)為例。之前不做人形機(jī)器人的理由,王興興認(rèn)為,“全球人形機(jī)器人的控制技術(shù),大家都做的不是特別理想。性能上不去,達(dá)不到實(shí)用或者干活的階段,所以過去很多年都沒做人形機(jī)器人”。
如今,隨著機(jī)器人軟硬件技術(shù)升級(jí),人形機(jī)器人正逐漸從實(shí)驗(yàn)室走到實(shí)際的運(yùn)用場景中。今年7月,馬斯克稱特斯拉工廠已有兩臺(tái)Optimus機(jī)器人在進(jìn)行電池搬運(yùn)工作。在本次機(jī)器人大會(huì)現(xiàn)場,我們也看到了優(yōu)必選的人形機(jī)器能執(zhí)行簡單的汽車質(zhì)檢任務(wù)。
誠然,以人類熟練工的角度來衡量,機(jī)器人“員工”的效率還是太低。但若是與規(guī)模疊加,人形機(jī)器人24小時(shí)連軸工作的特性,還是吸引了汽車、物流、科研院所、AI科技等不同行業(yè)的嘗試意愿,共同催促著人形機(jī)器人的交付進(jìn)程。
“在2022年底,我們還沒做人形機(jī)器人,但已經(jīng)有一些客戶找我們想買人形機(jī)器人了”,王興興認(rèn)為宇樹科技的人形機(jī)器人進(jìn)展都是順勢而為的結(jié)果。
不過,獵豹移動(dòng)董事長兼CEO、獵戶星空董事長傅盛認(rèn)為機(jī)器人行業(yè)還有很多方面需要打磨,尤其是“兩條腿走路”的人形機(jī)器人要面臨物理學(xué)的限制,“雙足機(jī)器人的技術(shù)過于復(fù)雜,它必須依賴于機(jī)械結(jié)構(gòu)。機(jī)械結(jié)構(gòu)的迭代不會(huì)像自動(dòng)駕駛那么快,每年能進(jìn)步的幅度不多?!?/p>
但總之,行業(yè)內(nèi)的玩家們在人形機(jī)器人的預(yù)計(jì)成熟時(shí)間上,達(dá)成了基本的一致意見。李卓對(duì)光錐智能表示稱,“預(yù)計(jì)行業(yè)還有3-5年才能徹底成熟”。
在頭部創(chuàng)業(yè)者們看來,此時(shí)此刻的人形機(jī)器人恰如2019年,特斯拉剛推出FSD芯片、百度Apollo剛拿到多張測試牌照的自動(dòng)駕駛,一切都充滿了希望。
一切,都是因?yàn)槿诵螜C(jī)器人在本輪AI大模型的影響下,實(shí)現(xiàn)了根本性的改變。
AI進(jìn)化,機(jī)器人更像人
“一個(gè)是大語言模型,另一個(gè)是端到端算法?!?/strong>
光輪智能創(chuàng)始人兼CEO謝晨如此總結(jié)著本輪機(jī)器人進(jìn)化的最大原因。
在大會(huì)現(xiàn)場,無論是人形機(jī)器人、機(jī)器狗,甚至差異化設(shè)計(jì)的餐飲機(jī)器人都表現(xiàn)出了“更合理”的動(dòng)作表現(xiàn)。以一年周期為對(duì)比,今年大會(huì)上的機(jī)器人操作明顯流暢了許多。
較為明顯的例子,可以從機(jī)器人做冰淇淋這一簡單任務(wù)中看出。在去年的世界機(jī)器人大會(huì)上,機(jī)械臂的運(yùn)動(dòng)基本上是單調(diào)地執(zhí)行“轉(zhuǎn)圈”。而今年遨博智能的冰激淋機(jī)器人動(dòng)作明顯更加流暢,機(jī)械臂僅轉(zhuǎn)了一圈,就將冰淇淋接了出來。
不同的動(dòng)作流暢度,意味著機(jī)器人任務(wù)執(zhí)行的底層邏輯發(fā)生了改變。
“原先機(jī)器人操作設(shè)計(jì)是模塊化的,底層是學(xué)習(xí)加規(guī)則混合的方案?!毙呛D聯(lián)合創(chuàng)始人、清華大學(xué)交叉信息學(xué)院助理教授、MARS Lab主任趙行解釋稱,“這種模式有點(diǎn)像之前自動(dòng)駕駛的物體檢測-決策-規(guī)劃-控制的過程。例如做一個(gè)抓取策略,之前我們要對(duì)物體進(jìn)行檢測、狀態(tài)和姿態(tài)估計(jì)。但現(xiàn)實(shí)情況的物體大多沒什么姿態(tài)可言,就像一張紙鋪在桌子上,很難定義姿態(tài)和關(guān)鍵點(diǎn)?!?/p>
這與自動(dòng)駕駛的發(fā)展過程如出一轍。此前的機(jī)器人動(dòng)作規(guī)劃與自動(dòng)駕駛發(fā)展到“端到端”前,遇到得是同樣的問題——在特定場景的開發(fā)模式下,只能靠規(guī)則寫有限的動(dòng)作,無法適應(yīng)真實(shí)世界的無限場景。
機(jī)器人只能操作有限形狀和種類的物體,就像是自動(dòng)駕駛只能在封閉路段使用一樣“雞肋”。而有了“端到端”的機(jī)器學(xué)習(xí)之后,如同汽車能夠自己學(xué)習(xí)如何掉頭一樣,機(jī)器人也能學(xué)習(xí)如何抓取不同形狀、顏色、柔軟程度不同的物體。
參考自動(dòng)駕駛結(jié)合大模型的趨勢,機(jī)器人在結(jié)合了多模態(tài)大模型后,也開始能理解現(xiàn)實(shí)世界。在現(xiàn)場,銀河通用機(jī)器人展示的便是藥店值班的場景。機(jī)器人在拿取貨架上的藥品之余,看到有東西掉到地上還能自己撿起來。
AI大模型對(duì)于機(jī)器人能力提升的重要性,劉聰認(rèn)為主要體現(xiàn)在三個(gè)方面:
首先,大模型顯著提升了機(jī)器人解決復(fù)雜任務(wù)的能力,根據(jù)理解,把復(fù)雜任務(wù)拆解成一系列可執(zhí)行的任務(wù)。
接下來,在多模態(tài)大模型的能力下,機(jī)器人可以依托視覺、觸覺等在更復(fù)雜地場景里做事。
最后,體現(xiàn)在運(yùn)動(dòng)能力上,機(jī)器人可以根據(jù)AI合成的數(shù)據(jù)做模擬訓(xùn)練。如果沒有大模型,機(jī)器人實(shí)現(xiàn)的功能會(huì)相對(duì)受限。
由此也看出,數(shù)據(jù)是除了大模型技術(shù)外,制約機(jī)器人下一步進(jìn)化最關(guān)鍵的要素。
為了獲取足夠用于機(jī)器人訓(xùn)練的數(shù)據(jù),不少廠商通過真實(shí)數(shù)據(jù)和仿真數(shù)據(jù)結(jié)合的方式解決。在真實(shí)數(shù)據(jù)的獲取中,廠商一般通過真人動(dòng)作和機(jī)器人遙操作的方式,將任務(wù)過程中的數(shù)據(jù)“喂”給大模型。而仿真數(shù)據(jù)則是通過搭建一個(gè)盡量真實(shí)的場景,設(shè)定盡可能多的建模和現(xiàn)實(shí)參數(shù),讓虛擬化的機(jī)器人進(jìn)行訓(xùn)練。
不過,上述的兩種方式還是存在著各自的短板,當(dāng)前機(jī)器人行業(yè)還遠(yuǎn)未達(dá)到數(shù)據(jù)飛輪的啟動(dòng)時(shí)刻。一方面真實(shí)數(shù)據(jù)的成本極高,機(jī)器人當(dāng)前還達(dá)不到自動(dòng)駕駛般的普及度。在真實(shí)數(shù)據(jù)足夠多之前,廠商需要花長時(shí)間和配備數(shù)據(jù)標(biāo)準(zhǔn)團(tuán)隊(duì)來一點(diǎn)點(diǎn)積累。而對(duì)于仿真數(shù)據(jù)而言,最大的問題還是現(xiàn)實(shí)仿真不夠真實(shí)。機(jī)器人在模擬世界能成功,但導(dǎo)入到現(xiàn)實(shí)世界就會(huì)有一定的失敗率。
“現(xiàn)階段,對(duì)機(jī)器人行業(yè)最大的一個(gè)限制,還是AI不太夠。AI模型、AI的訓(xùn)練數(shù)據(jù)集、AI的場景的落地部署,都完全遠(yuǎn)遠(yuǎn)不夠?!蓖跖d興稱。
而隨著AI的發(fā)展,趙行預(yù)判,“隨著更高效的算法和算法的泛化能力提升,未來機(jī)器人學(xué)習(xí)一個(gè)技能的數(shù)據(jù)量將會(huì)從現(xiàn)在的幾千、幾萬,下降到一千甚至幾百幾十的數(shù)量級(jí)。”
參考自動(dòng)駕駛行業(yè)由量產(chǎn)帶來的數(shù)據(jù)飛輪,為了進(jìn)一步解決數(shù)據(jù)問題,不少機(jī)器人廠商正在探索從量產(chǎn)中“拿”數(shù)據(jù)了。
搶銷量,人形機(jī)器人站在量產(chǎn)前夜
價(jià)格,是人形機(jī)器人走向量產(chǎn)的一大制約因素。
據(jù)光錐智能在世界機(jī)器人大會(huì)上向各家了解,智元機(jī)器人合伙人兼營銷服副總裁姜青松稱,一臺(tái)1.7m高的人形機(jī)器人行業(yè)內(nèi)售價(jià)大概為60-70萬。
相比前幾年數(shù)百萬起的波士頓動(dòng)力,這些價(jià)格已經(jīng)是少數(shù)行業(yè)能接受的“嘗鮮價(jià)”,但離大規(guī)模普及還非常遙遠(yuǎn)。
王興興稱,“現(xiàn)在還沒有真正到商業(yè)閉環(huán)。一臺(tái)機(jī)器人達(dá)不到比人還低的成本,商業(yè)價(jià)值依舊不是正向的?!?/p>
這是因?yàn)椋瑥难邪l(fā)成本角度,由于人形機(jī)器人的不成熟,公司的研發(fā)過程會(huì)在技術(shù)布局、硬件選用、場景設(shè)計(jì)等環(huán)節(jié)中設(shè)置充分的冗余空間。這導(dǎo)致產(chǎn)品在前期研發(fā)成本的分?jǐn)傁?,“背”上了大量除必要硬件之外的“隱性成本”。
而在銷售環(huán)節(jié)結(jié)束之后,機(jī)器人公司還要繼續(xù)為應(yīng)用效果負(fù)責(zé)?!皬S商要為工業(yè)應(yīng)用試點(diǎn)客戶,配置專門的駐場團(tuán)隊(duì)來進(jìn)行后續(xù)研發(fā)和維護(hù)”,在大會(huì)現(xiàn)場,一位參展商這樣告訴光錐智能。
雖然當(dāng)前的客戶需求和產(chǎn)品都非常不標(biāo)準(zhǔn)化,但是光錐智能在大會(huì)現(xiàn)場發(fā)現(xiàn),不少廠商已經(jīng)嘗試在不同的需求下,制定了相應(yīng)的產(chǎn)品策略,試圖讓機(jī)器人的銷售更加順暢。
基本上,光錐智能了解到多家廠商的通用人形機(jī)器人售價(jià)集中在50-60萬元的區(qū)間,并搭配廉價(jià)的量產(chǎn)版本作為產(chǎn)品線補(bǔ)充。例如,四足機(jī)器人銷量最高的宇樹科技,其通用人形機(jī)器人H1售價(jià)就定在了50-60萬,最新的G1人形智能體也發(fā)布了量產(chǎn)版本,售價(jià)僅9.9萬人民幣起。
另一邊,眾擎機(jī)器人的人形機(jī)器人銷售更加極致,為了降低成本,在拿掉了機(jī)器人的“頭和雙臂”后,眾擎SA01干脆把“大雙足機(jī)器人”的價(jià)格干到了3.85萬。
這或許意味著,人形機(jī)器人的第一輪價(jià)格戰(zhàn)快要來了。
但更大規(guī)模的降價(jià),還得依靠量產(chǎn)。
日前,智元機(jī)器人預(yù)計(jì)今年的出貨量為200臺(tái),已經(jīng)是行業(yè)頭部水平。而上一個(gè)階段中,商用清潔機(jī)器人的單家出貨量也僅在一年千臺(tái)左右。
什么時(shí)候能突破一年萬臺(tái),甚至十幾萬臺(tái)的銷量,才是機(jī)器人真正的“iPhone時(shí)刻”。
為了達(dá)到量產(chǎn)目標(biāo),頭部人形機(jī)器人廠商已經(jīng)把第一個(gè)場景瞄向了工廠。
在全球范圍,除了特斯拉正在使用的自家機(jī)器人Optimus外,OpenAI 投資的Figure已經(jīng)與寶馬合作,計(jì)劃在美國南卡羅來納州落地Figure 01機(jī)器人。而美國機(jī)器人制造商Apptronik則與奔馳合作,Apollo機(jī)器人已經(jīng)在奔馳的流水線上搬箱子了。
在國內(nèi),當(dāng)前落地最快的還是人形機(jī)器人唯一一家上市公司優(yōu)必選。今年以來,優(yōu)必選的人形機(jī)器人已經(jīng)進(jìn)入蔚來汽車、東風(fēng)柳汽、吉利汽車、一汽等多家車企“打工”。隨著優(yōu)必選在經(jīng)典制造業(yè)場景的落地,人形機(jī)器人在質(zhì)檢、搬貨、分揀、擰螺絲、裝配等環(huán)節(jié),初步驗(yàn)證了行業(yè)應(yīng)用的可行性。
“目前機(jī)器人行業(yè)尚在早期,但隨著大模型的加持,技術(shù)和產(chǎn)品的從0到1,有望在三年內(nèi)一起突破?!敝x晨總結(jié)道。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.gptmaths.com/cgo/123022.html