關(guān)注盧松松,會(huì)經(jīng)常給你分享一些我的經(jīng)驗(yàn)和觀點(diǎn)。
首先,我們應(yīng)該感謝OpenAI的額外措施。
前兩天OpenAI剛宣布說(shuō)要封禁中國(guó)地區(qū)的API調(diào)用,第二天,全球著名開(kāi)源平臺(tái)Hugging Face(笑臉)發(fā)布了一個(gè)AI開(kāi)源大模型排行榜單,直接宣告:中國(guó)AI大模型全球排名第一。
這下就有意思了,梳理整件事情,我也來(lái)談?wù)勎业目捶ā?/strong>
從這份開(kāi)源大模型排行榜可以看到,阿里通義千問(wèn)大模型 Qwen2-72B 再次登頂,成為全球開(kāi)源大模型排行榜的NO.1!排名第二是的臉書(shū)的llama3。而讓人震驚的是,阿里之前開(kāi)源的Qwen1.5基礎(chǔ)和Chat版本也都上榜了。
也就是說(shuō),這份榜單的前10名中,阿里就占了4個(gè),這份榜單,直接讓中國(guó)的AI開(kāi)源大模型揚(yáng)眉吐氣。
肯定有人問(wèn)了,為什么沒(méi)有百度的大模型呢?因?yàn)榘俣鹊腁I大模型不開(kāi)源啊,人家也測(cè)不了,只能測(cè)開(kāi)源的,所以最后的結(jié)論是阿里的AI大模型排第一。
值得一提的是,這次他們的評(píng)測(cè)流程也發(fā)生巨大變化:
Hugging Face提出了更有挑戰(zhàn)性的V2榜單,基于未受污染、高質(zhì)量數(shù)據(jù)集的新基準(zhǔn),運(yùn)用可靠的度量標(biāo)準(zhǔn)。V2榜單涵蓋的一般任務(wù)包括:知識(shí)測(cè)試、短文本和長(zhǎng)文本的理解推理、復(fù)雜的數(shù)學(xué)能力,以及與人類偏好高度相關(guān)的任務(wù)如指令遵循。榜單內(nèi)的測(cè)試集,更難、更好、更快、更強(qiáng)對(duì)模型的考察也更有說(shuō)服力。
因?yàn)橹暗腣1榜單,被過(guò)度使用,而且題目相對(duì)簡(jiǎn)單,一些新近出現(xiàn)的模型出現(xiàn)數(shù)據(jù)污染跡象;所以老的評(píng)測(cè)方法不用了。
而且這次他們用了整整300塊英偉達(dá)H100顯卡,對(duì)全球100多個(gè)主流開(kāi)源大模型都做了測(cè)試。也就是說(shuō),截止到目前,Hugging Face是全球最權(quán)威的開(kāi)源模型榜單了。
英偉達(dá)H100顯卡,在日本大概21.6萬(wàn)元一個(gè)(國(guó)內(nèi)不讓賣),那300塊H100是多少錢(qián)?看來(lái)Hugging Face還挺有錢(qián)的,能搞到這么多資源。
同時(shí)Hugging Face的聯(lián)合創(chuàng)始人Clem還發(fā)了推特(現(xiàn)在叫X):阿里最新開(kāi)源的通義千問(wèn)Qwen2-72B指令微調(diào)版本衛(wèi)冕冠軍,繼續(xù)位列全球開(kāi)源模型排行榜第一名。
中國(guó)在全球開(kāi)源大模型領(lǐng)域處于領(lǐng)導(dǎo)地位!!這條推特也印證了Hugging Face官方對(duì)阿里AI開(kāi)源大模型是認(rèn)可的。
Hugging Face自己本身也是一家開(kāi)源模型庫(kù)網(wǎng)站平臺(tái),它是大模型時(shí)代的“github”,對(duì)于做AI的人來(lái)說(shuō),Hugging Face就是個(gè)寶藏庫(kù),里面超多好用的東西,所以他搞的開(kāi)源模型排行榜很有公信力。
國(guó)內(nèi)很多公司也是這樣模式,搞榜單,增強(qiáng)自己權(quán)威性。當(dāng)年,某公司搞了個(gè)自媒體排行榜,在科技自媒體領(lǐng)域,盧松松也榮幸有了排名,然后就接到廣告了,可以說(shuō)對(duì)雙方都有好處,其實(shí)我一直很感激它呢。
好了,上面有些揣測(cè)的意思,接下來(lái)我也談?wù)勎业目捶ǎ?/p>
(1)這份榜單的意義是什么?
相當(dāng)于給國(guó)內(nèi)很多套殼AI工具的企業(yè)打了一針興奮劑,意思是就告訴諸位:除了OpenAI之外,我們自己的AI工具也可以用。
自從OpenAI屏蔽中國(guó)使用API接口后,中國(guó)那些大模型企業(yè)瞬間就興奮起來(lái)了,因?yàn)闆](méi)辦法用OpenAI做套殼應(yīng)用了,但對(duì)國(guó)內(nèi)AI大模型是利好消息。而這份榜單的推出,也是對(duì)OpenAI封禁最好的回應(yīng)。
我們應(yīng)該感謝OpenAI的封禁啊!
如果您對(duì) 通義千問(wèn)Qwen2-72B 感興趣的,也想做個(gè)AI工具,這里可以下載:https://huggingface.co/Qwen/Qwen2-72B-Instruct
(2)目前中國(guó)的AI實(shí)力到底如何?
美國(guó)的AI因?yàn)橛行酒?、算力、人才等因素的影響,所以美?guó)的AI更側(cè)重于底層架構(gòu)。上層建筑你隨便怎么用,但地基必須是我的。
而中國(guó)的因?yàn)槔厦赖某隹诠苤?,所以我們大部分的AI應(yīng)用側(cè)重于“應(yīng)用層面”,比如應(yīng)用到醫(yī)療、港口、礦場(chǎng)等領(lǐng)域。當(dāng)然我們普通人接觸最多少還是用AI寫(xiě)文章、寫(xiě)論文。比如松松最近就用AI智能體給客戶寫(xiě)行業(yè)文章,也算是AI應(yīng)用的一種吧。
而中國(guó)AI的格局已初步形成:
以AI開(kāi)源為主的阿里,同時(shí)還不斷投資各種AI大模型,C端層面以通義系類、百煉平臺(tái)為主。以閉源為主的百度,能力未知。C端層面以文心一言、蘿卜快跑為主。
兩家巨頭,阿里和百度走了兩條截然相反的路。
那目前中國(guó)的AI實(shí)力到底如何呢?我感覺(jué)目前還沒(méi)人說(shuō)到清楚,有一點(diǎn)是可以肯定的,就靠用戶量和收入說(shuō)話。在應(yīng)用層面、盈利模式、用戶體量三個(gè)維度去判斷的。
寫(xiě)作最后:
目前中國(guó)的AI實(shí)力還是可以的,只是很多人不認(rèn)可,而這次的排行榜阿里用實(shí)力告訴大伙,中國(guó)AI技術(shù)并不比國(guó)外的差,甚至還遙遙領(lǐng)先。
現(xiàn)在AI開(kāi)源大模型阿里已經(jīng)的排名第一了,雖然OpenAI不讓你用,但相信在不久的將來(lái),會(huì)有越來(lái)越的人使用阿里的通義千問(wèn)Qwen2-72B。
希望阿里也能頂住壓力,砥礪前行,更上一層樓吧。
關(guān)注盧松松,一個(gè)在北京的互聯(lián)網(wǎng)創(chuàng)業(yè)者,歡迎大家關(guān)注一下!因?yàn)槟汴P(guān)注的人,決定你看到的世界!
本文來(lái)自投稿,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.gptmaths.com/cgo/model/120216.html