在大模型核心技術研發(fā)上,360采取自主研發(fā)+合作研發(fā)“雙引擎”驅動,提升核心“發(fā)動機”的競爭力。
作者/洛枳 南溟
出品/新摘商業(yè)評論
ChatGPT的成功絕不是憑一己之力,這款史上增長速度最快應用背后,合作者微軟起著至關重要的作用,正是產(chǎn)研合作,才促成了大語言模型技術的顛覆性變革。中國已經(jīng)掀起了大模型之爭,然而幾個月的喧囂,卻沒有一家公司走上這條已經(jīng)被驗證的道路,中國版的“微軟+OpenAI”是否會出現(xiàn),是產(chǎn)業(yè)界關注的焦點。
今天,360公司和智譜AI的合作給出了答案,雙方宣布達成戰(zhàn)略合作。雙方共同研發(fā)的千億級大模型“360GLM”,并宣布該模型已具備新一代認知智能通用模型水準 。
一、中國的大模型時代正在來臨
ChatGPT的發(fā)布引發(fā)了一場大變 革,微軟宣布ChatGPT接入Office全家桶更是在應用上面帶來了顛覆性創(chuàng)新,震驚了整個世界。
回看國內,在ChatGPT發(fā)布并應用后,各家大廠很快跟進,百度的文心一言,阿里的通義千問,科大訊飛的星火等都在大模型領域不斷有新突破。
與此同時,各大廠也意識到,大模型技術的推進和具體應用結合的緊迫性。阿里云宣布阿里所有產(chǎn)品未來將接入“通義千問”大模型全面升級;科大訊飛的星火大模型具備文本生成、知識問答、數(shù)學能力等核心能力。
現(xiàn)實情況是,雖然很多公司都推出了大模型,但是各家大模型能力相差無幾,沒有一家能夠遙遙領先、一統(tǒng)江湖,但可以肯定的是,當大家都在“畫餅”時,落地才是關鍵。
業(yè)界有一個共識,最后能夠勝出的決定性因素是“場景”,擁有場景的公司才能在未來的大模型產(chǎn)業(yè)競爭中占據(jù)領先地位。
大模型技術本身不再是一個門檻,產(chǎn)業(yè)和研究如何更好地結合,如何更好地落地,是所有入局大模型的玩家需要進一步思考的問題。
顯然,沿著被驗證過的路徑走更容易獲得成功。
360和智譜AI的合作,完全可以看做是中國版的“微軟+OpenAI”。
如果只有產(chǎn)業(yè)公司,會缺乏Open AI科學家長期主義的理想,可能沒有人想到在大模型編碼人類所有的知識這條路上走得更遠。
反過來也是同樣的道理,如果只有Open AI,不斷發(fā)論文是沒有意義的,畢竟論文和技術如果不能跟用戶的場景相結合,也是不能成功的。
微軟和Open AI有非常好的分工:微軟在自己的產(chǎn)品里綁上Open AI的服務,讓Open AI的服務真正實現(xiàn)工程化、場景化、產(chǎn)品化,甚至包括商業(yè)化。
Open AI不一定擅長商業(yè)化,也不一定擅長產(chǎn)品和場景化,但就從核心技術上不斷從GPT3.5到GPT4.0,說不準GPT5已經(jīng)在路上。
國外已經(jīng)蹚出了一條成功的產(chǎn)研結合的道路,360沒有理由拒絕模仿這條成功的道路 。
二、技術+場景的“中國GPT組合”
智譜AI是由清華大學計算機系技術成果轉化而來的公司,被評為國內“最具OpenAI氣質和水準”的公司,去年11月,斯坦福大學大模型中心對全球30個主流大模型進行全方位評測,智譜 AI研發(fā)的雙語千億級超大規(guī)模預訓練模型GLM-130B 是亞洲唯一入選的大模型。
專業(yè)測評結果顯示,GLM-130B的準確性等關鍵指標與OpenAI、谷歌大腦、微軟和英偉達等公司的大模型接近或持平,全球已有70個國家1000余家機構申請使用。
智譜AI作為領先的大模型技術企業(yè),在追趕OpenAI方面處于頭部位置。 然而單純的技術過硬并不夠, 更重要的成就表現(xiàn)在落實到現(xiàn)實場景的應用中去。
此次360和智譜AI的合作,正是大模型與場景結合的重要實踐。360創(chuàng)始人周鴻祎一直強調場景在發(fā)展大模型中的重要性,他曾表示,技術如果不能跟用戶的場景相結合,是不能成功的。
隨著ChatGPT對人類的影響不斷加深,國內越來越多的企業(yè)闖入大模型領域,對此,周鴻祎表示:最關鍵的已經(jīng)不是你擁有大模型的技術,而是如何借鑒微軟和OpenAI的合作模式,如何能夠拿到更好的數(shù)據(jù)進行訓練,如何實現(xiàn)更好的工程化的訓練方法,以及,如何找到更好的用戶場景,能夠使用你的大模型。
據(jù)了解,360瀏覽器平均MAU為4.16億,360搜索日均請求量超10億次,這為大模型后續(xù)的流量運作、用戶反饋、模型調優(yōu)奠定了基礎。
360比肩微軟“全家桶”的全端應用恰恰為智譜AI提供了技術落地機會, 同時,通過全端應用的數(shù)據(jù),又能幫助大模型技術提供數(shù)據(jù)支持,對于大模型來說,更多的數(shù)據(jù)支撐和場景信息反饋,也是輔助其改進的重要一步,技術與數(shù)據(jù)共同作用下產(chǎn)生飛輪效應。
一定程度上來說,大模型的“卷”,卷的不僅僅是技術,還有技術和應用的結合。
這一點,微軟和OpenAI的產(chǎn)研合作模式,已經(jīng)驗證了其可行性。與此同時,國內大模型技術落地方面,還需要考慮更全面的應用,而不僅僅局限于某一領域,某一場景。
擁有能夠和微軟匹敵的用戶場景,360和智譜AI的合作將成為中國版“微軟+OpenAI”模式的最佳范本,在大模型產(chǎn)業(yè)競爭中占據(jù)一定優(yōu)勢,雙方在技術上的的強強聯(lián)合,在技術與場景的互補性上,能夠將國內大模型產(chǎn)業(yè)競爭提升到全新的維 度。
三、AI時代,360的兩條線
360的人工智能戰(zhàn)略是“兩翼齊飛”,一方面發(fā)展核心技術,另一方面搶占用戶場景。
在大模型核心技術研發(fā) 上,360采取自主研發(fā)+合作研發(fā)“雙引擎”驅動,提升核心“發(fā)動機”的競爭力。
360一直以安全聞名,實際在AI技術上,360一直是國內的第一梯隊,有著長期的積累。早在2015年,360就成立了人工智能研究院,將CV、NLP等AI前沿技術應用于IOT、安全大數(shù)據(jù)等領域。同時,承接了安全大腦-國家級人工智能開放平 臺項目。
得益于擁有國內先進的多模態(tài)研發(fā)團隊,360在自然語言理解、機器視覺與運動、語音語義交互等方面達到行業(yè)領先,核心成員 和團隊多次榮獲AI相關比賽冠軍/提名獎項。
大模型相關技術上,360通過多模態(tài)學習解決跨模態(tài)檢索,提升了搜索效率,接著,利用遷移學習技術、快速落地文本分類、信息檢索、人機對話、NER、Summary等能力進行了中文語言模型預訓練研究。
之后,360著手圖文跨模態(tài)研究,在50億圖文對中精選2300萬高質量中文圖文跨模態(tài)數(shù)據(jù)集開源。后續(xù)在CV、AIGC和MLLM上的研究,讓360在大模型上的前期準備有了更堅實的基礎。
在CV上,OVD開放了世界目標檢測大模型Zero/Few Shot;在AIGC上,中文Stable Diffusion模型嘗試解決了40億圖文對解決中文理解問題;在MLLM上,具備原生視覺和語言能力的多模態(tài)GPT通過領域對齊實現(xiàn)了跨模態(tài)知識遷移。
綜合來看,360的自主研發(fā)經(jīng)歷了自然語言理解、機器視覺與運動、多模態(tài)大語言模型等過程,日益精進。
基于AI核心技術,360借助自身優(yōu)勢場景,“四路并發(fā)”落地大模型,分別面向消費者、中小微企業(yè)、行業(yè)、政企和城市提供大模型相關產(chǎn)品和服務。
360GPT的產(chǎn)品矩陣是360智腦,360智腦全景包括360CV大模型、360GPT大模型、3 60GLM大模型、360多模態(tài)大模型。
周鴻祎對自家大模型的落地有著清晰的規(guī)劃,“360智腦”率先落地搜索場景之后,結合GPT能力的智能瀏覽器、AI生圖工具和企業(yè)智能營銷云將很快面向B端用戶開放測試。顯然在策略上,360并不急于求成,而是聚焦用戶剛需,成熟一個場景,開放一個場景。
周鴻祎在多個場合強調,中國的大模型落后GPT兩年左右,發(fā)展起來需要的是用戶的支持、理解和寬容。在有些問題、有些技能方面,中國玩家有后來居上的可能。只是說在有些能力方面,像強推理能力、思維鏈、涌現(xiàn)的能力還需要一個過程。
誠然,中國的GPT發(fā)展得確實還不夠成熟,但誰知道最后的勝出者會以什么方式出現(xiàn)呢,而這個玩家會不會是復制“微軟+OpenAI”成功模式的360呢?我們拭目以待吧。
本文來自投稿,不代表增長黑客立場,如若轉載,請注明出處:http://m.gptmaths.com/quan/97704.html