WAIC上演大模型競技賽,“國家隊”百度進化到哪兒了?

拼技術也拼落地,大模型賽道“卷起來”了。

WAIC上演大模型競技賽,“國家隊”百度進化到哪兒了?

文/王慧瑩

編輯/陳鋒

今年5月,中國科學技術信息研究院發(fā)布了《中國人工智能大模型地圖研究報告》,這份報告顯示,截至5月28日,國內10億級參數(shù)規(guī)模以上基礎大模型,至少已經發(fā)布了79個。

這一“百模大戰(zhàn)”的盛況,在這兩天舉辦的2023世界人工智能大會(WAIC)上,得到了集中體現(xiàn)。

一方面,這屆WAIC,堪稱是大模型的主場。據(jù)連線Insight觀察,大會現(xiàn)場展出的大模型新品,超過了30余款。

另一方面,除了展出大模型之外,圍繞大模型相關的前沿算法、智能芯片等基礎設施,也成了另一個重頭戲。

比如百度展示了文心大模型3.5版本、文心一言、業(yè)內首個一站式企業(yè)級大模型平臺文心千帆,還重點展出了其全棧自研的AI大底座。

WAIC上演大模型競技賽,“國家隊”百度進化到哪兒了?

百度在展會現(xiàn)場展示AI大底座

從這屆WAIC來看,業(yè)內“做不做”大模型的討論已經告一段落了,新的焦點是,各家的大模型到底有哪些差異化?底層技術上到底怎么樣?以及接下來他們將怎么布局?

值得注意的一點是,大會上發(fā)布的《2022 全球人工智能創(chuàng)新指數(shù)報告》指出,當前全球人工智能處于加速發(fā)展期,其中有兩個趨勢較為關鍵:

數(shù)據(jù)和算力基礎設施建設持續(xù)推進;人工智能產業(yè)化進程明顯加快。

不難發(fā)現(xiàn),這兩點趨勢所指向的,正是當前大模型產業(yè)最為關鍵的兩個問題:

第一是技術側,支撐大模型能力的底層基礎設施是否完善,決定著一家企業(yè)能否做出大模型、做好大模型的能力迭代;

第二是應用側,大模型如何落地,如何賦能到千行百業(yè)、如何真正釋放出產業(yè)化價值,決定著一家企業(yè)在大模型賽道的上限。

而真正值得討論的是,在接下來的這場馬拉松中,擁有怎樣特質的企業(yè),將持續(xù)成為領跑者?

1、WAIC成大模型“秀場”:“國家隊”來了,秀產品也秀技術

大模型賽道到底有多熱?這屆WAIC是一個最佳的觀察窗口。

連線Insight觀察到,包括但不限于互聯(lián)網/云計算大廠陣營的百度、華為等;運營商陣營的中國移動、中國電信等;知名AI企業(yè)陣營的商湯科技等;大模型初創(chuàng)企業(yè)陣營的瀾舟科技、銜遠科技等,都帶來了大模型的最新產品及最新進度。

與此同時,在百花齊放的態(tài)勢下,大模型“國家隊”也確定了陣容。

7月7日的大會論壇上,國家標準委指導的國家人工智能標準化總體組,宣布我國首個大模型標準化專題組組長,由上海人工智能實驗室與百度、華為、阿里等企業(yè)聯(lián)合擔任,現(xiàn)場進行了證書頒發(fā)并正式啟動大模型測試國家標準制訂。

這意味著,過去混沌的大模型格局,正在逐漸變得越來越清晰。

再綜合來看,這屆以大模型為絕對重心的大會上,呈現(xiàn)出了以下幾個特征:

市場上幾乎所有的大模型廠商都來了;

圍繞大模型,廠商展出的重點,還包括了大模型底座、MaaS解決方案等;

通用大模型之外,面向垂直場景的行業(yè)大模型也不在少數(shù),以及能夠為客戶提供私有化部署的大模型也不在少數(shù)。

基于這幾點,這屆WAIC實則為我們提供了一個觀察大模型行業(yè)現(xiàn)狀,及接下來發(fā)展趨勢的最佳機會。

其中,作為大模型產業(yè)最具代表性的玩家之一,百度又是一個很好的觀察切口——它是最先探索將產品落地的AI企業(yè)之一,也是率先推出通用大模型產品的廠商之一。

除了展示了文心大模型的最新進展、大語言模型文心一言的最新進展外,百度還重點展示了業(yè)內首個一站式企業(yè)級大模型平臺文心千帆、全棧自研的AI大底座。

WAIC上演大模型競技賽,“國家隊”百度進化到哪兒了?

文心千帆大模型平臺,圖源百度智能云微信公眾號

自下而上層層拆解就不難發(fā)現(xiàn),百度在這次大會上的動作,不僅僅是對外展示過去一段時間在大模型領域的最新成果,同樣也在進一步向外界傳達其大模型的布局思路。

一方面,通過AI大底座的展示,百度透露出一個信號,布局大模型,最關鍵的還是要看技術。

另一方面,重點展出文心大模型、大語言模型文心一言和一站式企業(yè)級大模型平臺文心千帆的最新進展,這意味著,百度做大模型,最終的思路是通過底層的技術迭代以及開放的平臺生態(tài),推動大模型的場景落地。

其中邏輯在于,文心大模型是百度的基礎大模型,文心一言是知識增強大語言模型,是文心大模型中的一種,而文心千帆平臺要做的事情,就是將百度的這些模型以及第三方模型整合到一起,提供給客戶使用,在這一基礎上,文心千帆還提供覆蓋全生命周期的大模型工具鏈,同時支持大模型定制開發(fā)。

對此,王海峰指出,在文心一言這類大模型產業(yè)落地的進程中,可以采用“集約化生產,平臺化應用”的模式,即具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè)將模型生產的復雜過程封裝起來,通過低門檻、高效率的生產平臺,為千行百業(yè)提供大模型服務。

WAIC上演大模型競技賽,“國家隊”百度進化到哪兒了?

據(jù)百度透露,目前文心大模型已經在能源、汽車、政務、交通、金融等十余個行業(yè)率先落地。

透過百度,不難發(fā)現(xiàn),在當下的大模型賽道,真正的角逐重心,首先是技術,緊接著是場景落地,可以肯定的是,這將是一場馬拉松。

2、技術要夠硬核,也要有長期主義

大模型時代到來后,IT技術棧也發(fā)生了根本性變化,即從芯片層(CPU為主)、操作系統(tǒng)層、應用層的三層架構,發(fā)展成為了四層架構:芯片層(GPU為主)+框架層+模型層+應用層。

賽道中的任何一家入局企業(yè),都需要適應這一新的變化,在底層能力上持續(xù)進化、迭代。

百度是其中最有代表性的一家,從昆侖芯到飛槳深度學習框架,到文心大模型,再到上層的應用,在每一層技術棧都有布局和自研技術。百度也是全球為數(shù)不多的進行全棧布局的AI公司。

在大會現(xiàn)場,王海峰也指出,尤其是在框架層和模型層,百度的自研優(yōu)勢更加突出。

框架層,飛槳是我國第一個自助研發(fā)的產業(yè)級深度學習開放開源平臺,在中國深度學習平臺綜合市場份額上連續(xù)兩年位居第一。截至目前飛槳已凝聚 750萬名開發(fā)者,這也是百度2023年以來首次對外披露飛槳生態(tài)最新數(shù)據(jù)。

模型層,王海峰在現(xiàn)場指出,文心大模型現(xiàn)在已經迭代至3.5,實現(xiàn)了基礎模型升級、精調技術創(chuàng)新、知識點增強、邏輯推理增強等,模型效果提升了50%,訓練速度提升了2倍,推理速度提升了30倍。

而文心大模型的迭代,正是一個通過技術創(chuàng)新推動大模型能力迭代的范本。

WAIC上演大模型競技賽,“國家隊”百度進化到哪兒了?

在基礎模型訓練上,文心大模型3.5采用了飛槳最先進的自適應混合并行訓練技術及混合精度計算策略,并采用多種策略優(yōu)化數(shù)據(jù)源及數(shù)據(jù)分布,這加快了模型迭代速度,同時提升了模型效果和安全性。

同時,文心大模型3.5采取了多類型多階段有監(jiān)督精調、多層次多粒度獎勵模型、多損失函數(shù)混合優(yōu)化策略、雙飛輪結合的模型優(yōu)化等技術,使模型效果及場景適配能力進一步提升。

此外,在知識增強和檢索增強基礎上,文心大模型3.5提出了“知識點增強技術”,提升了大模型掌握和運用知識的能力。

在推理方面,則是通過大規(guī)模邏輯數(shù)據(jù)構建、邏輯知識建模、多粒度語義知識組合以及符號神經網絡技術,提升了文心大模型3.5在邏輯推理、數(shù)學計算及代碼生成等任務上的表現(xiàn)。

值得注意的是,文心大模型3.5 還新增了插件機制,默認的內置插件“百度搜索”,使得文心一言具備生成實時準確信息的能力;長文本摘要和問答插件“ChatFile”支持超長文本輸入等等。

王海峰表示,文心一言將發(fā)布更多優(yōu)質的百度官方和第三方插件,讓用戶能夠更好地應用文心大模型,同時也將逐步開放插件生態(tài),幫助開發(fā)者基于文心大模型打造自己的應用。

這一系列能力迭代背后,百度靠的是其在AI領域長期的投入和積累。

2013年開始,百度就開始布局AI相關技術,累計十年下來已經投入超過1000億元,其中核心研發(fā)投入多個季度占比超過20%。截至2022年4月,百度全球AI專利申請已經超過2.2萬件。

當然,所有的技術優(yōu)勢,最終都要轉化為可落地的成果,在大模型賽道,這意味著,大模型能否落地,將價值最大化。

3、從技術中來,到產業(yè)中去

大模型熱潮持續(xù)到現(xiàn)在,行業(yè)的競賽將進入到更深一層,既拼技術,也拼場景落地。

不斷探索大模型的能力邊界,推動大模型在具體行業(yè)場景下的落地,也成了當前市場參與者的重中之重。

據(jù)連線Insight了解,4月17日,文心一言在百度內部全面應用在智能工作平臺“如流”。百度此次在內部發(fā)布的智能工作工具,涵蓋了文本和圖片生成、代碼推薦兩大場景。

簡單來說,文心一言在實際的辦公、會議、編碼等場景的表現(xiàn),就像一個“超級助手”,幫助員工在日常工作中的思路構建、協(xié)作溝通、方案策劃、代碼編寫等方面大幅提升效率。

WAIC上演大模型競技賽,“國家隊”百度進化到哪兒了?

王海峰也表示,凡是要跟語言文字或程序代碼打交道的應用場景,都可能有文心一言的用武之地。他透露,目前在能源、金融、教育、辦公、媒體等諸多領域,已經有很多在積極應用文心一言的場景。

在這之前,百度還曾展示了文心一言+電商的場景:你只需要把商品的信息告訴AI,AI就會自動生成多種風格的商品帶貨腳本和風格,再搭配數(shù)字人主播,就可以進行直播帶貨。

7月6日,百度智能云事業(yè)群總裁沈抖在2023中國國際數(shù)字和軟件服務交易會上透露,目前已經有15萬家企業(yè)申請接入文心一言測試——這說明,文心一言的潛在落地場景,還在不斷拓寬。

同樣值得一提的還有文心一格,同樣是百度依托于飛槳、文心大模型的一款,在“AI作圖”方面的產品。

據(jù)悉,文心一格既能為畫師、設計師等視覺內容創(chuàng)作者啟發(fā)靈感,輔助藝術創(chuàng)作,又能為媒體、作者等文字內容創(chuàng)作者提供高質量、高效率的配圖。用戶就算完全沒有繪畫經驗,也能在文心一格畫出無限創(chuàng)意。

聚焦到企業(yè)客戶,同樣可以在文心一格體驗到業(yè)界領先的文生圖水平。

不過,相比起文心一言、文心一格正在不斷釋放的應用場景,百度探索大模型落地產業(yè)場景的思路,更值得被關注。

連線Insight 觀察到,百度的大模型產業(yè)布局中,有兩個信息尤為關鍵。

第一是一站式企業(yè)級大模型平臺文心千帆的推出。

如我們上文所提及,文心千帆實質上是一個大模型的集約平臺,百度將這一平臺開放,結合自身完善的大模型工具鏈,通過公有云服務、私有化部署等方式提供給企業(yè)客戶。

WAIC上演大模型競技賽,“國家隊”百度進化到哪兒了?

這一布局思路下,平臺具備了易用性、全面性、安全性、高效、開放、易拓展等特點,進而幫助企業(yè)高效、低成本地獲取大模型能力。

百度透露,截至目前,已有超過300家百度智能云生態(tài)伙伴參與到了“文心千帆大模型平臺”內測,包括工業(yè)、金融、政務、互聯(lián)網、運營商、教育等行業(yè)頭部企業(yè)。

第二是百度飛槳深度學習平臺,對大模型適配產業(yè)場景能力的提升。

一方面,為了讓大模型產業(yè)落地更高效便捷,飛槳提供了全流程產業(yè)化工具與平臺,包括大模型開發(fā)套件、場景模型生產線等,極大降低了應用門檻?!巴ㄟ^高效構建與快速迭代基于大模型的多樣化場景模型,讓大模型的落地像流水線一樣高效”。百度如此表示。

另一方面,飛槳的開放屬性也決定了,隨著越來越多的開發(fā)者快速在這里實現(xiàn)AI想法、創(chuàng)新AI應用,飛槳作為基礎平臺支撐,更利于支撐越來越多行業(yè)實現(xiàn)產業(yè)智能化升級。

而將這些聯(lián)系起來重新審視百度在大模型賽道的布局思路、落地方向,就不難發(fā)現(xiàn),百度大模型的起點、轉折點、未來的錨點,都集中在“技術”這兩個字上。

回顧百度過去十年堅定的技術投入歷程,我們很清楚地能看到百度對于技術的長期主義,以及這種堅守帶來的成效。

但對百度而言,大模型的戰(zhàn)事才剛剛展開,接下來在“大模型落地”這場馬拉松中,如何繼續(xù)保持領先,對百度而言極為重要。

本文來自投稿,不代表增長黑客立場,如若轉載,請注明出處:http://m.gptmaths.com/quan/101491.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2023-07-09 20:35
下一篇 2023-07-10 07:42

增長黑客Growthhk.cn薦讀更多>>

發(fā)表回復

登錄后才能評論