中國算力的想象力有多大?|產(chǎn)業(yè)特稿

一個萬億級的算力市場

 

中國算力的想象力有多大?|產(chǎn)業(yè)特稿

 

巨頭入場和“東數(shù)西算”的助推,讓中國離這個萬億級算力藍海更近了一步。

作者|思杭

編輯|皮爺

出品|產(chǎn)業(yè)家

 

2023年初,在青島、濟南、日照等12座城市,一座座嶄新的大型數(shù)據(jù)中心拔地而起。

其中,最引人矚目的屬2月23日,在青島嶗山區(qū)的青島人工智能計算中心。這是山東省第一個上線運行的人工智能計算中心,算力規(guī)??蛇_250P。

在青島這座城市,既有像卡奧斯這樣的工業(yè)互聯(lián)網(wǎng)平臺型企業(yè),也有像創(chuàng)新奇智、極視角、以薩技術(shù)等人工智能服務(wù)商。這些企業(yè)對算力、算法和數(shù)據(jù)有著龐大的需求。

像青島人工智能計算中心這樣的項目,最近兩年不在少數(shù)。而如今,人工智能再一次引爆算力需求。

前有ChatGPT誕世,后有百度“文心一言”,還有鮮為人知的claude+,由Anthropic公司開發(fā);騰訊近日也宣布研發(fā)ChatGPT聊天機器人。

為什么ChatGPT爆火后,國內(nèi)外大廠都前仆后繼地參與?又為什么OpenAI的ChatGPT被稱為“一直被模仿,從未被超越”?

1956年,人工智能開始發(fā)展,60年一直不溫不火,直至2017年,Alphago打敗圍棋世界冠軍,才算AI破圈的開始。決定AI的三大核心要素是數(shù)據(jù)、算法和算力。

首先,全球最不缺的就是數(shù)據(jù),尤其在中國,14億人口平均人手1.6部智能手機,未來隨著物聯(lián)網(wǎng)技術(shù)的完善,每人會生產(chǎn)出更龐大的數(shù)據(jù)量;其次是算法和算力,一個形象的比喻是,數(shù)據(jù)等于廚師炒菜用的食材,算法是菜譜,算力則相當(dāng)于廚師的廚藝。而在中國,拖后腿的是算法和算力。

據(jù)OpenAI近日發(fā)布的數(shù)據(jù),截止目前人們對算力的需求已增長超30萬倍。然而,就在各國加速布局算力產(chǎn)業(yè)之際,2022年美國商務(wù)部禁止了高端芯片設(shè)備及人工智能芯片的對華出口。這直接影響了英偉達和AMD兩大供應(yīng)商對A100和H100兩款高端加速卡的出口。

“1萬枚英偉達A100芯片是做好AI大模型的算力門檻”,這是行業(yè)內(nèi)公認的標準。H100則是比A100性能更高的芯片。

ChatGPT能有今天的突破,微軟功不可沒。構(gòu)建“永遠改變?nèi)藱C交互方式”的超級計算機,是OpenAI五年前的豪言壯志。為了幫助實現(xiàn)這個大膽的想法,微軟斥資數(shù)億美元做了一場賭注。這其中面臨的難題是前所未有的,比如在Azure云計算平臺上連接幾萬個英偉達A100芯片,再比如打造指數(shù)級增長的網(wǎng)絡(luò)GPU集群規(guī)模等。還好,微軟賭贏了。

在算法上,ChatGPT依然使用2017年論文中發(fā)布的Transformer,該算法原本的應(yīng)用場景是翻譯,因此它不僅具備英語語言能力,也有中文語言系統(tǒng),這解釋了為什么GPT能夠進行中文對話;但性能提升主要在算力上,ChatGPT這種大規(guī)模分布式訓(xùn)練已經(jīng)超出了摩爾定律的限制,上萬個A100芯片讓算力暴漲1萬倍,這種算力消耗前所未有。目前,ChatGPT依賴于A100芯片,未來若投入H100,性能會有更大提升。

AI技術(shù)不斷演進,對算力的需求也呈指數(shù)增長。據(jù)中國信通院預(yù)測,到2030年,近70%的公司都會用到人工智能。企業(yè)數(shù)字化轉(zhuǎn)型也需要算力支撐,在中美芯片競爭博弈背景下,自建算力系統(tǒng)迫在眉睫。

王堅在3月30日出席財富全球科技論壇時也談及到算力的重要性,“算力與‘電氣化’同等重要。而算力和電力一樣,只有極少數(shù)技術(shù)能幫助人類去做創(chuàng)新,這就是算力的重要性。”。

回到文章開篇的兩個問題,之所以國內(nèi)外大廠有能力開發(fā)聊天機器人,是因為其背后所需的技術(shù)并不難,像百度和華為都有自研芯片,文心一言就依賴于百度自研的昆侖芯;而之所以“從未被超越”,是因為ChatGPT背后巨大的算力支持,至少從現(xiàn)在來看,國內(nèi)還需要時間。

一、一個萬億級的算力市場

ChatGPT打破了摩爾定律的限制,也引爆了對AI算力的需求。GPT-4的算力消耗遠大于GPT-3和3.5,OpenAI也在不斷對Plus付費用戶調(diào)低閾值,將訪問限制由第一天的150 msg/4hr降至最近的25msg/3hr,簡言之,就是減少用戶的提問次數(shù),從而降低算力消耗。

具體來看,據(jù)GPT-4的公開數(shù)據(jù),在32K的上下文長度下,每1000個token的提問成本為0.06美金,回答完成成本為0.12美金。與GPT-3的成本對比,GPT-4的輸入成本增加了50%-200%,輸出升本增加200%-500%。

由ChatGPT帶來的算力恐慌也蔓延到了國內(nèi)。

近日,多只國產(chǎn)芯片股大漲。截至3月29日13:39,芯片 ETF 龍頭漲幅 4.37%,立昂微、北方華創(chuàng)漲停,中微公司漲超 9%,思瑞浦、瀾起科技漲超 8%,滬硅產(chǎn)業(yè)-U、兆易創(chuàng)新、景嘉微漲超 5%。

可以說,中國是一片巨大的算力藍海。一方面,人工智能的發(fā)展帶動數(shù)據(jù)流量增長,從而使算力規(guī)模激增;另一方面,算力深度融入互聯(lián)網(wǎng)、電信、金融、制造等行業(yè),助推各行業(yè)各領(lǐng)域完成數(shù)字化轉(zhuǎn)型。據(jù)中國信通院統(tǒng)計,截至2022年,算力需求最大的行業(yè)是互聯(lián)網(wǎng),占整體算力份額的近一半,其次,政府、服務(wù)和電信業(yè)也在加大算力投入,占比分別為12%、10%、7.2%。

 

中國算力的想象力有多大?|產(chǎn)業(yè)特稿

中國各行業(yè)算力應(yīng)用分布情況

 

從電商到社交,從游戲到金融,從醫(yī)療到教育,互聯(lián)網(wǎng)各行各業(yè)都需要算力。以電商巨頭阿里為例,每天數(shù)十億的交易數(shù)據(jù),單是搜索引擎就需要處理數(shù)百億個商品數(shù)據(jù),這還只是在搜索和推薦商品的場景。另外,阿里還有兩大塊風(fēng)控系統(tǒng),一塊是金融領(lǐng)域,主要業(yè)務(wù)是支付寶,另一塊非金融領(lǐng)域,如新零售、高德、大文娛等。這些都需要巨大的算力在背后支撐,進行存儲和分析數(shù)據(jù),或識別和預(yù)防欺詐。

2022年8月30日,阿里云啟動了張北超級智算中心,AI算力總規(guī)模為12 EFLOPS(每秒1200億億次浮點運算),據(jù)說超過了谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成為全球最大的智算中心。2023年3月,百度也完成了陽泉智算中心的升級,算力規(guī)模達4 EFLOPS,成為目前亞洲最大單體智算中心。

智算中心的建設(shè)是為AI大模型訓(xùn)練、自動駕駛、空間地理等人工智能探索應(yīng)用,提供智能算力服務(wù)。近年來,智能算力增長最為迅速。據(jù)IDC發(fā)布的數(shù)據(jù),2022年,我國智能算力規(guī)模達268 EFLOPS,預(yù)計未來5年,我國智能算力規(guī)模的年復(fù)合增長率將達52.3%。

而國家大力布局智能算力產(chǎn)業(yè)的背后,是智能算力存在的巨大供給“鴻溝”。據(jù)IDC預(yù)測,未來三年新產(chǎn)生的數(shù)據(jù)量將超過過去三十年的總和。這個鴻溝就表現(xiàn)在,數(shù)據(jù)總量在增長,真正被有效利用的數(shù)據(jù)占比卻不足1%。中國工程院院士王恩東在《瞭望》新聞周刊中說道,“目前無法具體統(tǒng)計AI算力缺口數(shù)據(jù),但中國在加速數(shù)字化轉(zhuǎn)型”,在這過程中,需要AI算法利用深度學(xué)習(xí),訓(xùn)練出深度神經(jīng)網(wǎng)絡(luò)模型,這需要足夠強的算力支撐。

未來,74.5%的企業(yè)都會用到AI,在智能算力方面,主要應(yīng)用包括AI語音技術(shù)、大數(shù)據(jù)分析與機器學(xué)習(xí)、圖像識別與處理及自然語言處理。像電商、智能家居、在線教育和人工智能等互聯(lián)網(wǎng)行業(yè)對智能算力需求非常大。比如,阿里旗下的天貓需要智能算力開發(fā)“推薦算法”和“超級搜索”,或用于個性化定制和營銷策略;再比如小米生態(tài)鏈公司Yeelight的智能家居系統(tǒng),也需要算力實現(xiàn)智能化聯(lián)動和語音控制。

如今,各國間的算力博弈進入白熱化階段。據(jù)中國信通院統(tǒng)計,2022年,我國服務(wù)器規(guī)模約2000萬臺,算力規(guī)模超150 EFlops,位居世界第二,僅次于美國;預(yù)測2023年,在ChatGPT引爆算力需求的背景下,中國算力規(guī)模將超200 EFlops。

巨頭入場和“東數(shù)西算”的助推,讓中國離這個萬億級算力藍海更近了一步。

二、巨頭造芯,算力能否跨越“卡脖子”困境?

2021年,字節(jié)下場造芯了,先是從百度截胡了三位芯片相關(guān)人才,而后又去華為海思、Arm、高通等公司“三倍(薪資)挖人”。這一波波操作引發(fā)了互聯(lián)網(wǎng)大廠的“芯片人才熱”。

早在自研芯片這一信號傳出之前,字節(jié)跳動就接連投資了RISC-V公司睿思芯科、AI芯片公司希姆計算、GPU芯片設(shè)計獨角獸摩爾線程、泛半導(dǎo)體行業(yè)智能制造商潤石科技、數(shù)據(jù)中心網(wǎng)絡(luò)芯片公司云脈芯聯(lián)、開發(fā)衍射光學(xué)芯片的公司光舟半導(dǎo)體等。

字節(jié)下場造芯只是一抹縮影,高薪挖人也是互聯(lián)網(wǎng)大廠追逐芯片夢的慣用手法。除了字節(jié)跳動,還有阿里、百度和騰訊。在一眾互聯(lián)網(wǎng)大廠中,最先吃螃蟹的人是百度。

故事開始于2010年,“這在當(dāng)年是百度的一個秘密項目。”百度高級副總裁曾透露。百度最初嘗試用FPGA架構(gòu)研發(fā)AI芯片,然而它一開始并沒有完全自研,而是同Arm、紫光展銳和賽靈思等公司合作,推出數(shù)款A(yù)I芯片,后來才走上自研的道路。2018年7月,百度正式發(fā)布其自研AI芯片“昆侖芯”,并于2020年量產(chǎn)。

 

中國算力的想象力有多大?|產(chǎn)業(yè)特稿

 

2021年,昆侖芯的業(yè)務(wù)被獨立了出來,由百度芯片首席架構(gòu)師歐陽劍出任昆侖芯片公司CEO。同時,該公司也在3月完成獨立融資,首輪估值約130億元,自此,中國誕生了一家國產(chǎn)芯片超級獨角獸。

阿里也緊跟步伐。在百度開始“秘密項目”的五年后,2015年,阿里巴巴宣布與集成電路設(shè)計企業(yè)杭州中天微合作,兩年后又向中天微注資5億元,宣布向芯片基礎(chǔ)架構(gòu)設(shè)計領(lǐng)域進軍。2017年10月,阿里達摩院成立,成立之初就將芯片列為研究領(lǐng)域之一。到了2018年,阿里進一步收緊腳步,于8月聯(lián)合中天微成立平頭哥半導(dǎo)體芯片公司。

從這一年開始,阿里的成績就尤為顯赫。從玄鐵902到玄鐵910,從含光800到倚天710、羽陣600,這些是阿里5年的成績單。2023年3月2日,阿里平頭哥首次展示RISC-V生態(tài)全景,并預(yù)測到2025年RISC-V架構(gòu)芯片有望突破800億顆。中國工程院院士倪光南在會上表示,“今天RISC-V是中國CPU領(lǐng)域最受歡迎的架構(gòu),中國芯片產(chǎn)業(yè)和整個芯片生態(tài)將會越來越多地聚焦于RISC-V架構(gòu),中國的巨大市場也將成為支撐RISC-V的重要基地?!?/p>

而早有造芯意識的馬化騰,卻是最后一個入場,動作也略顯低調(diào)。2016年,騰訊參與了可編程芯片公司Barefoot Networks的2300萬美元C輪融資。隨后銷聲匿跡了兩年,在2018年,馬化騰在論壇演講中表達了做芯片的想法。三年后,才在騰訊官網(wǎng)上看到其發(fā)布的招聘信息:芯片架構(gòu)師、芯片驗證工程師、芯片設(shè)計工程師等。對此,騰訊回應(yīng),只是在特定領(lǐng)域有芯片研發(fā)的嘗試,比如AI加速和視頻編解碼。

騰訊除了在芯片領(lǐng)域的投資,自研方面的成績在一波三折后,終于柳暗花明。

早在2015年,F(xiàn)PGA剛進入主流視野,沒有硬件基因的騰訊做過一次“造芯”的探索,但FPGA畢竟是“半定制”的電路,云端商業(yè)化還是失敗了,最后團隊人員遺憾告別。然而受挫之后,騰訊并沒有放棄對硬件之路的思考,中國芯片行業(yè)也在2018年回暖。一年后,騰訊內(nèi)部傳來了聲音,“AI芯片,要不要做?”雖然這一聲音遭遇過反對,但騰訊還是進行了小規(guī)模地試水,“蓬萊”芯片也就此誕世。

2020年1月,蓬萊芯片流片完成,經(jīng)過四次嘗試,“蓬萊”被點亮了。2021年11月,在騰訊數(shù)字生態(tài)大會上,又一口氣發(fā)布了三款專用芯片:紫霄、滄海和玄靈,分別專注于AI計算、視頻優(yōu)化和智能網(wǎng)絡(luò)。

如今,字節(jié)、百度、阿里、騰訊全部跨界,齊聚芯片行業(yè),究其原因,無非是由需求端和供給側(cè),兩者的合力共同拉動。

“字節(jié)跳動光服務(wù)器所需要的芯片就是幾十萬塊,只要達到自產(chǎn)自銷就能降低成本。何況還有Pico,一旦VR/AR產(chǎn)業(yè)爆發(fā),算力就是瓶頸,所以現(xiàn)在自研芯片也算是未雨綢繆。”華南一家AI芯片公司的資深架構(gòu)工程師李波透露。

不僅是字節(jié),騰訊也是如此。2019年,騰訊迎來云計算業(yè)務(wù)上的里程碑——云服務(wù)器規(guī)模突破100萬。以更低成本提供更高的網(wǎng)絡(luò)性能,成為當(dāng)時騰訊面臨的一大難題。

除了中國的互聯(lián)網(wǎng)巨頭,美國的亞馬遜、谷歌也在自研芯片。2014年,谷歌為數(shù)據(jù)中心設(shè)計了服務(wù)器芯片,2019年又在印度組建團隊,其芯片用途主要在云端和智能設(shè)備上;亞馬遜也于2018年發(fā)布其首款自研云服務(wù)器CPUGraviton,未來預(yù)計還會推出應(yīng)用于物聯(lián)網(wǎng)和智能設(shè)備的芯片。

從需求端來看,互聯(lián)網(wǎng)大廠和云計算公司造芯是未雨綢繆。未來,大部分互聯(lián)網(wǎng)廠商都會進入物聯(lián)網(wǎng)和智能設(shè)備等領(lǐng)域,而這些領(lǐng)域十分倚重硬件。所以,軟硬一體是未來互聯(lián)網(wǎng)公司和云計算廠商的必由之路。另外,很重要的一點,在市場層面,想要守住市場地位,實現(xiàn)差異化,底層硬件設(shè)施是關(guān)鍵,它直接影響著上層軟件的性能。

對于國內(nèi)互聯(lián)網(wǎng)大廠紛紛跨界造芯,除了美國限制高端芯片的對華出口,還有兩點更重要的原因——成本和針對性。早前,在英偉達芯片還沒有嚴禁向中國出口時,很多互聯(lián)網(wǎng)大廠就已經(jīng)表示過,由于算力需求龐大,英偉達的GPU芯片又太貴,大規(guī)模購買成本十分高昂。而且英偉達芯片屬于通用型,并不能針對特定某家企業(yè)算法做優(yōu)化。那么對芯片有不同場景需求的互聯(lián)網(wǎng)大廠,比如在AI加速器和視頻編解碼場景,想實現(xiàn)成本功耗最低、性能最優(yōu),自研是必選項。

從供給側(cè)來看,國內(nèi)芯片廠商和互聯(lián)網(wǎng)大廠造芯都已具備足夠成熟的技術(shù)。而需求方下場做芯片最大的優(yōu)勢在于,對需求的理解和洞察最深刻。

以阿里的含光為例,在2019年云棲大會上,阿里用4顆含光800芯片,就代替了40顆傳統(tǒng)GPU才能完成的視頻處理任務(wù)。而前者的成本,是后者的十分之一。騰訊的紫霄也打破了算力的瓶頸點,在圖片和視頻處理、自然語言處理、搜索推薦等應(yīng)用場景下,性能是業(yè)界標品的2倍。

芯片是一個全球性的產(chǎn)業(yè),從芯片制造角度分析,沒有任何一個國家能自己完成芯片的制造,這是不爭的事實。另外,我國芯片行業(yè)發(fā)展的另一大難題是芯片人才短缺。據(jù)相關(guān)數(shù)據(jù)統(tǒng)計,2025年我國芯片專業(yè)人才缺口將超30萬人。但從長遠來看,互聯(lián)網(wǎng)大廠跨界造芯、高薪搶人,也向供給端發(fā)送了芯片人才短缺的信號。

盡管如此,互聯(lián)網(wǎng)公司下場造芯,已經(jīng)解決了一部分問題,在特定場景下,應(yīng)用性更強,成本也更低。算力也因此有望跨越“卡脖子”困境。

三、中國的算力有多大想象力?

為什么說芯片是全球性產(chǎn)業(yè),任何國家都很難不借助外力造出來?

第一,芯片的科學(xué)原理很難。這一點可以從芯片人才短缺上去理解,目前,只有清華、上交、復(fù)旦、中科大、電子科技大學(xué)等幾所知名高校設(shè)有芯片相關(guān)專業(yè)。從這一現(xiàn)象就足以窺探,芯片科學(xué)原理的難度。

第二,芯片的工藝制造很難突破瓶頸。芯片加工和制造就是兩個最難的環(huán)節(jié)。芯片制造離不開光刻機,一臺光刻機至少有10萬個零部件,而一臺汽車的使用零部件只有5000個,足以想像光刻機的制造難度之大。制造芯片更是需要數(shù)百道工藝,有些工序還要循環(huán)數(shù)十遍。

中國算力的想象力有多大?|產(chǎn)業(yè)特稿

第三,EDA軟件(電子設(shè)計自動化軟件)也是國內(nèi)一大瓶頸。EDA軟件的用處是讓電子設(shè)計師實現(xiàn)在電腦上設(shè)計芯片,否則就需要人工設(shè)計、試驗,要耗費的人力和時間成本不計其數(shù)。但目前我國應(yīng)用的十幾種EDA軟件都來自美國。如果自己做EDA研發(fā)十分困難,它的算法就決定了芯片設(shè)計的優(yōu)劣。而如果EDA軟件質(zhì)量不夠,設(shè)計師就不可能設(shè)計出高質(zhì)量的芯片。

除了芯片層面,我國算力產(chǎn)業(yè)發(fā)展還受到建設(shè)方面的問題。比如不同芯片、操作系統(tǒng)、固件、整機系統(tǒng)兼容性不強,制約了產(chǎn)業(yè)的進一步發(fā)展。中國信通院王駿成認為,“算力應(yīng)用存在標準缺失、數(shù)據(jù)共享不夠、資源接口不統(tǒng)一等壁壘”,導(dǎo)致算力供需失衡。

對此,國家已于2022年初提出建設(shè)“東數(shù)西算”工程,助力打通我國東西部數(shù)字產(chǎn)業(yè)的“大動脈”,為經(jīng)濟發(fā)展注入新動能。國家信息中心郭明軍表示,通過該工程實現(xiàn)東西部算力資源的流通,依托算力網(wǎng)絡(luò),把算力真正用起來,實現(xiàn)“算力入戶”、“算力入企”、“算力入園”、“算力入校”。

在算力網(wǎng)絡(luò)建設(shè)層面,三大運營商成為算力網(wǎng)絡(luò)的主導(dǎo)者。據(jù)《財經(jīng)十一人》,2022年三大運營商云業(yè)務(wù)總營收1352億元,增速超過100%?!叭筮\營商每年都要花費千億元規(guī)模的資本開支用于基礎(chǔ)設(shè)施建設(shè)。2022年,中國移動、中國電信和中國聯(lián)通的資本開支分別為,1852億元、952億元和742億元?!逼滟Y本投入已超過BAT三大互聯(lián)網(wǎng)公司。

目前來看,國家層面、運營商和企業(yè)都在加大力度布局算力網(wǎng)絡(luò)。在此前提下,這一輪生成式AI技術(shù)演變能帶來多大規(guī)模的算力爆發(fā)?對產(chǎn)業(yè)格局會產(chǎn)生怎樣的影響?

首先,生成式AI會消耗巨大的算力,從而帶動對算力產(chǎn)業(yè)的需求。當(dāng)下,互聯(lián)網(wǎng)大廠BAT早已憑借自身在芯片領(lǐng)域的多年沉淀,開始投入大模型研發(fā)。所以,最先受益的會是ICT企業(yè)。

其次是頭部大公司,互聯(lián)網(wǎng)廠商自研芯片,也會將能力外溢給合作平臺和客戶,從而讓頭部廠商受益。

最后一輪機會則留給創(chuàng)業(yè)公司,生態(tài)產(chǎn)業(yè)鏈的完整會受益千行百業(yè),這也是生成式AI對各行業(yè)的顛覆,只是等到創(chuàng)業(yè)公司感受到變化,還需要一段時間。

備注:部分資料來自網(wǎng)絡(luò)

本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://m.gptmaths.com/quan/94545.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2023-04-03 16:02
下一篇 2023-04-03 18:08

增長黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評論