文|劉俊宏
在這個人工智能迅速發(fā)展的時代,我們正見證著一場關(guān)于技術(shù)、未來和創(chuàng)新的深刻討論。
在「2024 AI科技峰會」上,商湯科技的聯(lián)合創(chuàng)始人兼大裝置事業(yè)群總裁楊帆提出了對AI產(chǎn)業(yè)未來發(fā)展的深刻洞察。不僅僅是關(guān)于技術(shù)的展示,更是關(guān)于如何通過構(gòu)建強大的人工智能基礎(chǔ)設(shè)施來推動中國經(jīng)濟(jì)的發(fā)展引擎,以及如何應(yīng)對新一代人工智能技術(shù)帶來的挑戰(zhàn)。
現(xiàn)場,演講嘉賓解析商湯科技如何通過AI基礎(chǔ)設(shè)施建設(shè)來促進(jìn)產(chǎn)業(yè)的自我造血和健康發(fā)展。從信息化和智能化對中國經(jīng)濟(jì)發(fā)展的推動作用,到AI產(chǎn)業(yè)的發(fā)展趨勢,再到AI技術(shù)的商業(yè)化挑戰(zhàn),楊帆的洞見為我們提供了一個全新的視角,以理解AI如何在各行各業(yè)中重塑現(xiàn)有業(yè)務(wù)模型和工作方式。
核心觀點如下:
1、在未來20年,信息化和智能化的升級將成為中國經(jīng)濟(jì)發(fā)展的引擎。
2、AI產(chǎn)業(yè)想要在未來自我造血和健康發(fā)展,需要從圍繞應(yīng)用場景和降低AI利用成本兩個方面著手。
3、AI產(chǎn)業(yè)必將分化成有人來提供低成本、低門檻、高效率的AI基礎(chǔ)能力,AI三要素都會被基礎(chǔ)設(shè)施化。
4、商湯希望通過建設(shè)人工智能基礎(chǔ)設(shè)施,降低人工智能的使用門檻,促進(jìn)人工智能在各行業(yè)的廣泛應(yīng)用,從而推動中國人工智能產(chǎn)業(yè)的繁榮發(fā)展,并將人工智能基礎(chǔ)設(shè)施視為新的戰(zhàn)略方向,以大裝置為主要載體,致力于推動這一戰(zhàn)略目標(biāo)的實現(xiàn)。
以下為嘉賓演講實錄:
尊敬的各位領(lǐng)導(dǎo)、各位來賓,很高興跟大家聊一聊商湯最近兩年在大模型領(lǐng)域做的探索和嘗試。
伴隨著新一代生成式AI的成熟,我們正在從硬件到軟件再到應(yīng)用生態(tài),全方位地重構(gòu)整個信息化系統(tǒng)。過去50年信息化系統(tǒng)以流程的驅(qū)動為核心,未來伴隨AI能力持續(xù)增強,新一代信息系統(tǒng)將以數(shù)據(jù)為核心。類比編程,就像是過去面向過程編程到今天面向?qū)ο缶幊痰淖兓?,這種變化會對整個信息化行業(yè)帶來顛覆性的改變。如今,信息化已經(jīng)成為通用服務(wù)業(yè)滲透到各行各業(yè),相信在未來20年,信息化和智能化的升級也將成為中國經(jīng)濟(jì)發(fā)展的引擎。當(dāng)下正在發(fā)生的信息系統(tǒng)根本性的變革,會帶來無數(shù)新的機會,值得用AI把千行百業(yè)都重新做一遍。
過去幾年間,AI正在越來越快地達(dá)到人類基準(zhǔn)線。同時,觀察美國的數(shù)據(jù),2023年上半年人工智能生態(tài)呈現(xiàn)爆發(fā)趨勢。通過GitHub的數(shù)據(jù)庫和Hugging Face上模型數(shù)量,都能再度確認(rèn)這一趨勢。對于中國來說,考慮到模型成熟度和自身產(chǎn)業(yè)的特點,整體節(jié)奏上或許會比美國有所滯后,但相信在今明兩年也將能迎來AI生態(tài)的爆發(fā)。
AI生態(tài)的爆發(fā),背后對應(yīng)著AI對基礎(chǔ)設(shè)施強勁的需求。根據(jù)世界主流分析機構(gòu)的一致性判斷,未來10年新興產(chǎn)業(yè)復(fù)合年增長率將超過40%,生成式AI產(chǎn)品的需求將帶來巨大產(chǎn)品收入的增長空間。
為什么要構(gòu)建AI基礎(chǔ)設(shè)施?我從2014年作為聯(lián)合創(chuàng)始人加入商湯,到2018、2019年一直在思考這個問題——AI到底應(yīng)該如何盈利?我們也相信大部分的AI公司當(dāng)下也都在面臨著同樣的問題。
從根本的角度來發(fā)問,是因為AI不能幫我們解決問題嗎?并不是,我們看到了AI在手機、安防、自動駕駛、工業(yè)制造等場景下的應(yīng)用,已經(jīng)深刻地改變了我們生活中的方方面面。
我認(rèn)為,這個問題的答案是AI研發(fā)投入實在太大了。包括硬件資源、人才儲備以及技術(shù)不斷迭代的環(huán)節(jié)中,都需要大量的投入。除非能找到一個足夠大的市場,并且只做相同的一件事,否則很難將這些投入掙回來。但現(xiàn)在我們看到,過去十年間,AI的研發(fā)投入本身在呈指數(shù)級上漲,這讓AI商業(yè)化回報的難度越來越高。另一方面,當(dāng)AI技術(shù)落地到應(yīng)用場景時,單純地解決行業(yè)問題還不足以收獲完備的產(chǎn)品定義、恰當(dāng)?shù)男袠I(yè)生態(tài)位和足夠的利潤回報。這中間的差距,在于對行業(yè)的理解、行業(yè)資源的把握以及在行業(yè)內(nèi)的生態(tài)位。而這些能力,以技術(shù)為根基的公司并不能在短時間內(nèi)獲得。
如果AI產(chǎn)業(yè)想要在未來自我造血和健康發(fā)展,我認(rèn)為應(yīng)當(dāng)從兩個方面著手。
一方面是對于應(yīng)用側(cè)圍繞應(yīng)用場景的公司,雖然AI是其產(chǎn)品的關(guān)鍵競爭力,但并不適合以AI作為其原生標(biāo)簽。因為AI只是一種技術(shù),關(guān)鍵是如何利用技術(shù)對行業(yè)、客戶、場景中創(chuàng)造價值。只有在行業(yè)中有好的產(chǎn)品定義和生態(tài)卡位的時候,才能更掙錢。
另一方面,這些公司應(yīng)當(dāng)不斷降低AI在學(xué)習(xí)、使用、落地的成本和門檻。否則以今天AI研發(fā)技術(shù)對資源的無限需求下,利用AI將成為恐怖的增量成本。
對此,從2019年我們開始有了模糊的結(jié)論,在今天已經(jīng)清晰了起來——AI產(chǎn)業(yè)必將分化。
分化成有人來提供低成本、低門檻、高效率的AI基礎(chǔ)能力,包括算力、算法和數(shù)據(jù)的基礎(chǔ)能力,AI三要素都會被基礎(chǔ)設(shè)施化。讓更多的人在這基礎(chǔ)上以低門檻、高效率去使用這些基礎(chǔ)能力,在不同的行業(yè)和場景中創(chuàng)造價值,完成商業(yè)的閉環(huán)。這是我們認(rèn)為未來5-10年,AI能夠更加健康、百花齊放地賦能千行百業(yè)生態(tài)的方式。同樣,我們也認(rèn)為大模型基礎(chǔ)設(shè)施是行業(yè)勢必會分化出的趨勢。
其實,回顧過去十年AI技術(shù)的發(fā)展歷程,一個模型能夠容納更多的數(shù)據(jù)就能提供更好的智能,但如何讓模型容納更多的數(shù)據(jù)?這就需要模型具備更多的參數(shù),在模型更好的結(jié)構(gòu)下,通過更多的參數(shù)來“消化”掉這些數(shù)據(jù)。同時,消納更多的數(shù)據(jù)也意味著需要更大的算力來支撐整個訓(xùn)練過程。這些環(huán)節(jié)是AI技術(shù)在過去發(fā)展的第一驅(qū)動力,但至今我們還看不到終點。
所以,AI未來必將實現(xiàn)基礎(chǔ)設(shè)施化,而且基礎(chǔ)設(shè)施化將體現(xiàn)在三要素的每個方面。
我們今天已經(jīng)看到的算力基礎(chǔ)設(shè)施化,典型的有AIDC、AI云。算法的基礎(chǔ)設(shè)施化有MaaS、模型API,在過去的一年間正在被更多的人所認(rèn)知并接受。數(shù)據(jù)的基礎(chǔ)設(shè)施化,當(dāng)前行業(yè)內(nèi)雖然還沒有達(dá)成共識,但我相信隨著越來越多人關(guān)注,很快也將形成明確統(tǒng)一的認(rèn)識。
對于中國來說,當(dāng)下我們在三要素的發(fā)展上面臨著諸多挑戰(zhàn)。
算力部分,我們在今天仍面臨著芯片層面的技術(shù)挑戰(zhàn)。面對這些問題,我們在2021年攜手頭部AI平臺廠商和AI云側(cè)的芯片公司,成立了人工智能算力產(chǎn)業(yè)生態(tài)聯(lián)盟(ICPA),共同推動AI芯片加快完成市場化和商業(yè)化,讓國產(chǎn)AI芯片能夠快速形成具有市場競爭力的生態(tài)。破解2023年以來,全行業(yè)都在給英偉達(dá)“打工”的局面。而這個目標(biāo),現(xiàn)在看來并不遙遠(yuǎn)。今天有越來越多的國產(chǎn)AI芯片應(yīng)用于推理,也有少量的芯片應(yīng)用于訓(xùn)練。這些芯片正在快速接近實際商用的界限,性價比正在逼近英偉達(dá)在國內(nèi)所能提供的產(chǎn)品和方案。
伴隨著算法需求,我們也需要更大規(guī)模的算力集群的高速互聯(lián)。以我們在臨港的智算中心為例,已經(jīng)達(dá)到6800P的體量,單集群能連到4000卡。雖然與美國最先進(jìn)水平還有差距,但我們愿意為此持續(xù)努力并為之奮斗。
算力規(guī)模化布局上,預(yù)計到今年一季度結(jié)束,商湯會建成一張由10個點位構(gòu)成的算力網(wǎng)。在未來結(jié)合超大規(guī)模訓(xùn)練和各區(qū)域推理的落地,加速AI大模型落地進(jìn)程。
算法部分,在基模型能力上,我們的日日新·自然語言大模型在主客觀的指標(biāo),基本上已經(jīng)能夠?qū)?biāo)GhatGPT3.5,并且還在持續(xù)迭代。相信在與國內(nèi)各個合作伙伴和友商的共同推動下,中國自有關(guān)鍵性基模型的能力將持續(xù)改進(jìn)。
在垂直應(yīng)用上,商湯也做了比較多的探索和嘗試。我們做了擬人交互、代碼助手和金融領(lǐng)域等工具,實現(xiàn)了AI在場景的快速落地。
此外,在模型的價值觀上,我認(rèn)為中國基模型未來發(fā)展最為關(guān)鍵的要素是與中國倡導(dǎo)的價值觀對齊。當(dāng)基模型數(shù)據(jù)量和數(shù)據(jù)規(guī)模暫時無法拉開質(zhì)的差距前,基模型的模型能力難以拉開差距。這時候需要實現(xiàn)基模型與人的價值觀對齊,這同樣也需要大量訓(xùn)練策略在背后形成支撐和保障。
最后是數(shù)據(jù)積累層面,當(dāng)前中文全場景高質(zhì)量數(shù)據(jù)仍然處于匱乏狀態(tài)。我們需要更多、更高效數(shù)據(jù)以幫助推動整個模型能力的持續(xù)進(jìn)步。
最后,我們相信在這個體系之下,未來AI基礎(chǔ)設(shè)施可能是以智算中心、AI云或其他的形態(tài)。在今天,我們已經(jīng)能看到市場上不同業(yè)內(nèi)同仁正在用不同方式去做探索。未來,低門檻、低成本、高效率的AI基礎(chǔ)設(shè)施將幫助整個AI產(chǎn)業(yè)進(jìn)入一個更加良性、自我造血的繁榮生態(tài)。商湯大裝置希望能夠在人工智能基礎(chǔ)設(shè)施的產(chǎn)業(yè)發(fā)展中貢獻(xiàn)一份力量。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://m.gptmaths.com/cgo/112603.html