文丨郝 鑫
去年一年,大模型行業(yè)一面在基礎(chǔ)技術(shù)上狂飆追趕GPT-4,一面也在沉下來,深入到各行各業(yè)的場景應(yīng)用中。
相關(guān)數(shù)據(jù)顯示,截至去年11月份,國內(nèi)參數(shù)在10億規(guī)模以上的大模型數(shù)量已有116個(gè),其中金融行業(yè)大模型數(shù)量最多,約有18個(gè)。除了大熱的金融行業(yè),交通、政務(wù)、制造業(yè)、醫(yī)療、法律,一場關(guān)于千行百業(yè)的智能化改造升級(jí)正在如火如荼上演之中。
回顧一年的大模型行業(yè)落地探索,問題挑戰(zhàn)不少,但也看到了新的變革力量。
1月16日,由光錐智能攜手Scale Partners勢乘資本、中關(guān)村會(huì)展與服務(wù)產(chǎn)業(yè)聯(lián)盟共同舉辦的“2024 AI 科技峰會(huì)”在北京成功舉辦。本次峰會(huì)以“更智能的世界”為主題,匯聚科技企業(yè)創(chuàng)始人、產(chǎn)業(yè)高管、行業(yè)資深投資人等,共話未來科技與產(chǎn)業(yè)加速融合的新思路。百度智能云產(chǎn)業(yè)發(fā)展部總經(jīng)理段永華受邀參會(huì),并發(fā)表了“大模型時(shí)代,數(shù)智化的行業(yè)機(jī)遇”的主題演講,分享其對大模型的基本觀點(diǎn)以及百度在政府、金融、交通等領(lǐng)域的落地進(jìn)展。
核心觀點(diǎn)如下:
1、2024年,大模型將進(jìn)入落地應(yīng)用階段,開啟從“可用”到“好用”的轉(zhuǎn)化過程。
2、要在時(shí)空維度來看待大模型,從三五十年的時(shí)間尺度來看,今天的大模型還處在起步期;從空間角度看,我們需要的應(yīng)該是一個(gè)大模型體系。
3、人工智能是通用能力,“智”能和“電”能、“核”能一樣,可以滲透至千行百業(yè),切入后端生產(chǎn)、前端管理和服務(wù)各個(gè)領(lǐng)域。
4、過去12年以來,城市管理領(lǐng)域沒有發(fā)生真正意義上的飛躍。原因在于數(shù)據(jù)管理和融合,以及對數(shù)據(jù)理解和學(xué)習(xí)沒有實(shí)現(xiàn)特別重大的技術(shù)突破。?
5、整個(gè)大模型應(yīng)用落地需要所有企業(yè)、所有行業(yè)一起結(jié)合自己的場景去做探索和實(shí)踐。大模型本質(zhì)只是基礎(chǔ)的能力,要把他們調(diào)度起來,和業(yè)務(wù)目的和業(yè)務(wù)任務(wù)結(jié)合起來,才能產(chǎn)生實(shí)實(shí)在在價(jià)值和作用。
以下為嘉賓演講實(shí)錄(略有增減):
剛開年立馬就看到一家廠商發(fā)布新的大模型,一年過去大模型還這么火,這是非常好的現(xiàn)象。說明每一家做基礎(chǔ)大模型廠商在努力迭代基礎(chǔ)能力,以及每一家做應(yīng)用廠商都在積極努力去做基于大模型應(yīng)用的拓展。
“生成式AI正在從第一幕向第二幕過渡”,這個(gè)觀點(diǎn)是去年11月份紅杉資本做出的判斷。去年一年,大模型更多是作為一個(gè)新事物出現(xiàn),大家覺得可用、挺好玩的,紛紛投入來嘗試,并且基于業(yè)務(wù)場景做一些探索。
到2024年我們對大模型的判斷是,進(jìn)入實(shí)實(shí)在在落地應(yīng)用的階段,開啟從“可用”到“好用”的轉(zhuǎn)化過程。
我個(gè)人對大模型觀點(diǎn)是什么呢?一定要在時(shí)空維度來看待大模型。
先說時(shí)間,從三五十年的時(shí)間尺度來看,今天的大模型還處在起步期,10年、20年再看今天大模型能力,肯定覺得它很幼稚。3個(gè)月前的大模型、今天大模型和3個(gè)月以后大模型也完全不一樣,因?yàn)槟芰ν耆煌恕:唵蝸碚f,3個(gè)月的時(shí)間就能完成從全科高中生到全科本科畢業(yè)生,甚至到全科碩士生的進(jìn)化。今年我們能不能達(dá)到全科博士生的能力?這是我們期待的事情。從多模態(tài)能力來說,我們非常期待在生活和工作場景里完全達(dá)到甚至超越高智商個(gè)體的人對事物的理解,不論是圖片還是視頻的識(shí)讀,還是人類更深層次的思考的理解,這些方面,我們期待基礎(chǔ)大模型快速進(jìn)化。
第二,從空間角度看大模型,從實(shí)際應(yīng)用環(huán)境來看,我們需要的不僅僅是一個(gè)大模型,它應(yīng)該是大模型體系。這應(yīng)該是一個(gè)什么樣的體系呢?我們有云端的基礎(chǔ)大模型、有邊緣大模型、有終端的大模型(手機(jī)端的大模型、電腦端的大模型、汽車端的大模型等),它是云邊端、大中小不同模型協(xié)同起來,和之前開發(fā)出來MIS、ERP,亦或是確定式的人工智能能力,來集成整合成為體系之后,來服務(wù)業(yè)務(wù)管理和生產(chǎn)需要。要從時(shí)空角度整體看大模型,它不是靜態(tài)的東西。
百度從訓(xùn)大模型、用大模型和做應(yīng)用三個(gè)層次全面支撐伙伴和客戶,過去半年多很多客戶在平臺(tái)上取得非常多的進(jìn)展。
做基礎(chǔ)大模型是非常艱難的事情,甚至對百度自身來說也是非常艱難的事情,因?yàn)檫@需要在很長時(shí)間尺度里咬著牙堅(jiān)持去投入。從百度來說,往前數(shù)堅(jiān)持超過十年的時(shí)間在人工智能領(lǐng)域投入,往后十年、二十年還需要矢志不渝地堅(jiān)持,才可能把基礎(chǔ)大模型做的非常好。我們更期待伙伴和客戶在大模型之上結(jié)合場景做應(yīng)用,真正在實(shí)際業(yè)務(wù)里面落地。
在更宏大的社會(huì)經(jīng)濟(jì)環(huán)境里,退后一步來看,最近有一個(gè)詞比較火叫“新質(zhì)生產(chǎn)力”,是去年9月份總書記提出來的,前一陣我看到黃奇帆市長對名詞有比較詳細(xì)的解讀。我們且不論更深層次的解讀,簡單說,人工智能尤其是生成式人工智能一定是“新質(zhì)生產(chǎn)力”的一部分,它和未來的可控核聚變、量子計(jì)算、智能化機(jī)器人,這些技術(shù)加起來將構(gòu)成下一輪經(jīng)濟(jì)重新迸發(fā)活力的基礎(chǔ)支撐體系和能力。人工智能是通用能力,“智”能,和“電”能、“核”能這些“能”是一樣的,智能在千行百業(yè)可以潤物細(xì)無聲滲透進(jìn)去,從后端生產(chǎn)、前端管理和服務(wù)各個(gè)領(lǐng)域,都可以發(fā)揮它的作用。
下面簡單談一下百度過去三四個(gè)月里,我們在政府、金融、交通等等領(lǐng)域的基本進(jìn)展。
我是做了20多年IT的人,從2006年開始做“數(shù)字城管”的項(xiàng)目,后來叫“一網(wǎng)通管”。當(dāng)年比較痛苦的事情是整個(gè)城市管理系統(tǒng)更多是基于地理信息的數(shù)據(jù)、基于城市管理(城市部件、城市事件)的等結(jié)構(gòu)化的數(shù)據(jù)來開展工作,這其中有大量文本數(shù)據(jù)、視頻數(shù)據(jù)是用不起來的。之后隨著阿里提出“城市大腦”的平臺(tái),以及進(jìn)一步和人工智能結(jié)合之后,城市管理有了一定的進(jìn)步,但事實(shí)上過去12年以來,城市管理領(lǐng)域沒有發(fā)生真正意義上的飛躍。原因在于數(shù)據(jù)管理和融合,以及對數(shù)據(jù)理解和學(xué)習(xí)沒有實(shí)現(xiàn)特別重大的技術(shù)突破。
到今天這個(gè)問題是有希望被解決掉的,我們真正意義上可以實(shí)現(xiàn)空間數(shù)據(jù)和非空間數(shù)據(jù)一體化,結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的一體化,實(shí)時(shí)監(jiān)測的現(xiàn)勢數(shù)據(jù)和庫里的歷史數(shù)據(jù)一體化的管理、理解、識(shí)別、調(diào)度,基于大模型的智慧化城市管理體系有希望在今天技術(shù)變革前提下發(fā)生。今天只是開始,我們已經(jīng)開始了一些有益的探索。未來真正能夠把所有數(shù)據(jù)打通,真正城市有了大腦,這個(gè)城市治理會(huì)很不一樣。
第二看一下金融領(lǐng)域,金融是信息化非常先進(jìn)的行業(yè)/領(lǐng)域,銀行、證券、保險(xiǎn)、金融從30年以前開始,一直基于信息化在構(gòu)建、在發(fā)展。今天大模型出來之后,更多是從兩個(gè)角度對它進(jìn)行一定的提效,主要體現(xiàn)在基于大模型協(xié)同辦公能力的提升,以及在智能投研、智能投顧、智能客服、智能業(yè)務(wù)辦理等業(yè)務(wù)場景里面,大模型可以實(shí)實(shí)在在發(fā)揮作用。
下一個(gè)板塊是工業(yè),在“新質(zhì)生產(chǎn)力”里黃奇帆市長說到新制造、新業(yè)務(wù)、新服務(wù),工業(yè)是新制造的代表,目前來看是大模型比較難于很快進(jìn)入并且發(fā)揮作用的領(lǐng)域。大模型有幾個(gè)最基本的能力,理解、生成、推理、記憶,生成更多用到金融和政務(wù)里的辦公輔助copilot,推理是形成調(diào)度管理能力。在工業(yè)領(lǐng)域,大模型的理解調(diào)度能力和實(shí)際業(yè)務(wù)結(jié)合、和歷史應(yīng)用結(jié)合,和歷史上開發(fā)出來確定式AI結(jié)合,可以形成一體化管理調(diào)度的體系。我們在實(shí)際的場景里已經(jīng)進(jìn)行了一些探索。
工業(yè)是比較復(fù)雜的場景,這涉及到大模型更深度的使用,同時(shí)對大模型的能力提出了更高的要求。本質(zhì)上說,如果不能做到很完善的多模態(tài)識(shí)別、理解,和基于識(shí)別理解結(jié)果與管理預(yù)案管理規(guī)則結(jié)合,做指揮調(diào)度的話,那可用性還是需要去提升的。
最后是汽車,汽車是比較典型的“端”的代表,有手機(jī)端、電腦端、有汽車端、XR端,這些端在未來不太長的時(shí)間里面會(huì)全面被大模型接入,基于云端大模型做調(diào)用,或者如果這些端本身具備比較好的GPU計(jì)算能力,像蘋果馬上要新出的VR設(shè)備(Vision pro),也可以在端側(cè)做空間計(jì)算、甚至做基于大模型的計(jì)算都有可能。在汽車端,空間本來就是比較大的,所以它的硬件設(shè)備相對比較好,基于汽車端本身的大模型也是未來主要的戰(zhàn)場/領(lǐng)域。
今天車輛智能駕駛系統(tǒng)相對比較簡單,我們最多是通過它來問問路,來實(shí)現(xiàn)一些導(dǎo)航,未來可以把行車相關(guān)的所有的東西,就是車內(nèi)設(shè)備情況、車外的道路情況和城市交通網(wǎng)的狀況等等,這些信息都綜合起來匯聚起來,形成深度智能化的能力。
百度做智能駕駛已經(jīng)十年了,過去十年已經(jīng)經(jīng)歷了三個(gè)階段,從最初基于車輛比較簡單的階段到后來基于地圖和車輛連接的,做知識(shí)圖譜的階段,以及今天基于大模型,實(shí)現(xiàn)車、路、云、圖全體系融合的階段。十年下來,我們已經(jīng)可以看到智能車在北京、上海、深圳、武漢、重慶五個(gè)城市實(shí)際做試運(yùn)行,叫蘿卜快跑,大家有興趣可以去試駕一下。雖然當(dāng)下也面臨城市基礎(chǔ)設(shè)施、法律法規(guī)的挑戰(zhàn),還需要進(jìn)一步成熟的過程,但它一定未來三五年會(huì)成為普遍現(xiàn)象。在此基礎(chǔ)上我們也做了交通大模型,全面滿足城市智慧交通管理的需要。
基于大模型的全面智能化的指揮調(diào)度,是我們期待的未來。雖然當(dāng)下基本能力已經(jīng)具備,但深入到每一個(gè)城市智能交通的建設(shè),都需要和每個(gè)城市實(shí)際業(yè)務(wù)情況、實(shí)際數(shù)據(jù)情況結(jié)合起來?;A(chǔ)大模型進(jìn)去要結(jié)合它的數(shù)據(jù)做專題訓(xùn)練,才可以具備剛剛提到的能力。
我們和吉利有全面的合作,會(huì)基于新能源技術(shù)、基于大模型來做全智能化汽車的輔助自動(dòng)駕駛系統(tǒng),這個(gè)體系下實(shí)現(xiàn)駕乘車、路、云、圖的協(xié)同,實(shí)現(xiàn)真正意義上的智能交通。
最后,我想說的是,整個(gè)大模型應(yīng)用落地需要所有企業(yè)、所有行業(yè)一起結(jié)合自己的場景去做探索和實(shí)踐。大模型本質(zhì)只是基礎(chǔ)的能力,這好比我們雇傭了一群聰明的全科博士生到單位,他們能做什么還得培訓(xùn),要把他們調(diào)度起來,和業(yè)務(wù)目的和業(yè)務(wù)任務(wù)結(jié)合起來,才能產(chǎn)生實(shí)實(shí)在在價(jià)值和作用。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://m.gptmaths.com/cgo/112607.html