DeepSeek正在產(chǎn)生連鎖反應(yīng),開(kāi)放成為了大勢(shì)所趨,行業(yè)頭部都在主動(dòng)選擇開(kāi)放。
2月6日,OpenAI宣布ChatGPT Search向所有人開(kāi)放,無(wú)需注冊(cè),來(lái)到OpenAI官網(wǎng)首頁(yè)就可以直接使用搜索功能。
就在OpenAI公布ChatGPT Search全面開(kāi)放的前幾個(gè)小時(shí),谷歌也剛剛宣布向所有人開(kāi)放最新Gemini 2.0模型,包括Flash、Pro Experimental和Flash-Lite三個(gè)版本。
而在國(guó)內(nèi),屬百度反應(yīng)最為迅速,立即跟上了開(kāi)源和免費(fèi)的步伐。
2月13日,文心一言在官網(wǎng)宣布將于4月1日起全面免費(fèi),所有PC端和App端用戶均可體驗(yàn)文心系列最新模型,以及超長(zhǎng)文檔處理、專(zhuān)業(yè)檢索增強(qiáng)、高級(jí)AI繪畫(huà)、多語(yǔ)種對(duì)話等功能。
2月14日,百度宣布將在未來(lái)幾個(gè)月中陸續(xù)推出文心大模型4.5系列,并于6月30日起正式開(kāi)源。

另一方面,主動(dòng)接入DeepSeek成為了新的“時(shí)髦”。國(guó)內(nèi)大小規(guī)模企業(yè)紛紛宣布部署DeepSeek模型,大廠則以開(kāi)放的心態(tài),將新的推理功能融入到業(yè)務(wù)生態(tài)中。
2月16日晚,百度搜索和文心智能體平臺(tái)宣布將全面接入DeepSeek和文心大模型最新的深度搜索功能。搜索用戶可免費(fèi)使用DeepSeek和文心大模型深度搜索功能,文心智能體平臺(tái)的開(kāi)發(fā)者也將能隨時(shí)調(diào)用DeepSeek模型創(chuàng)建并調(diào)優(yōu)智能體。
DeepSeek-R1在行業(yè)中產(chǎn)生了一種正向的反饋,大廠與大廠之間,開(kāi)源與閉源之間逐漸開(kāi)始打破壁壘,促進(jìn)技術(shù)的流動(dòng)和落地。各玩家不在抱有對(duì)峙的態(tài)度,而是把重點(diǎn)轉(zhuǎn)向了如何利用行業(yè)先進(jìn)模型能力來(lái)賦能業(yè)務(wù)場(chǎng)景,促進(jìn)應(yīng)用產(chǎn)品升級(jí),從而讓更多用戶享受到技術(shù)的普惠成果。
打出開(kāi)放組合拳:從大模型到搜索
作為長(zhǎng)期在閉源大模型上深耕,從未放棄過(guò)大模型預(yù)訓(xùn)練的玩家,百度在開(kāi)放上反應(yīng)最為迅速。梳理其近期的動(dòng)作,從大模型到搜索,百度打出了一套開(kāi)放“組合拳”。
在開(kāi)放的大趨勢(shì)影響下,百度自研大模型加入了開(kāi)源、免費(fèi)的行列。百度宣布將在未來(lái)幾個(gè)月中陸續(xù)推出文心大模型4.5系列,并6月30起正式開(kāi)源。
對(duì)于DeepSeek,百度也表現(xiàn)出了積極擁抱態(tài)度。
先是在春節(jié)DeepSeek爆火期間,百度智能云宣布在千帆ModelBuilder平臺(tái)上架DeepSeek-R1及DeepSeek-V3兩款模型,以低于DeepSeek-V3官方刊例價(jià)3折和DeepSeek-R1官方刊例價(jià)5折的價(jià)格,讓企業(yè)用戶優(yōu)先、實(shí)惠地率先體驗(yàn)到了“滿血版”的最新模型。
正是因?yàn)殚_(kāi)放,才帶來(lái)了正向的拉動(dòng)效應(yīng)。數(shù)據(jù)顯示,模型上線首日,已有超1.5萬(wàn)家客戶通過(guò)千帆平臺(tái)進(jìn)行模型調(diào)用。
更深度的開(kāi)放體現(xiàn)在,百度敢于將自身核心業(yè)務(wù)和重點(diǎn)業(yè)務(wù)與DeepSeek做探索融合。DeepSeek的推理功能驚艷,但本質(zhì)上還是底座模型,缺乏使用功能的場(chǎng)景。而百度的搜索和智能體就是最佳的“練兵場(chǎng)”。

有人誤以為,有了DeepSeek-R1就能打敗所有的大模型。但實(shí)際上,DeepSeek-R1也有自身的局限性,快速接入推理功能的意義在于,跳過(guò)重復(fù)“造輪子”,減少無(wú)謂的浪費(fèi),優(yōu)先讓模型在場(chǎng)景中跑起來(lái),也讓更多用戶成為模型測(cè)試員。
從目前來(lái)看,DeepSeek的誕生,并沒(méi)有讓閉源大模型躺平,反而刺激了行業(yè)對(duì)自身的反思,從而加速模型升級(jí)和新產(chǎn)品推出。
卷模型性能、性價(jià)比正在成為行業(yè)主要趨勢(shì)。OpenAI首席執(zhí)行官Sam Altman發(fā)布消息稱,GPT-4.5、GPT-5即將陸續(xù)發(fā)布,免費(fèi)版ChatGPT將在標(biāo)準(zhǔn)智能設(shè)置下無(wú)限制使用GPT-5進(jìn)行對(duì)話。
文心大模型自身的深度搜索功能已經(jīng)上線,在其推理功能基礎(chǔ)上,還同時(shí)具備更強(qiáng)大的思考規(guī)劃和工具調(diào)用能力,可為用戶提供專(zhuān)家級(jí)內(nèi)容回復(fù),并處理多場(chǎng)景任務(wù),實(shí)現(xiàn)多模態(tài)輸入與輸出。
全民加速進(jìn)入AI搜索時(shí)代
當(dāng)DeepSeek爆火后,還是有很多人持觀望狀態(tài),原因在于不知道推理模型能具體在哪些場(chǎng)景產(chǎn)生明顯的提效。目前逐漸清晰的是,“推理大模型+搜索”將帶來(lái)1+1大于2的效果。
DeepSeek-R1模型以“思維鏈”功能著稱,可清晰展示問(wèn)題解決的邏輯過(guò)程,回答問(wèn)題深度大大增強(qiáng)。但自從其上線以來(lái),就存在幻覺(jué)問(wèn)題。百度搜索的龐大搜索生態(tài)和RAG(檢索增強(qiáng)生成)技術(shù),對(duì)DeepSeek-R1是一個(gè)有效的補(bǔ)充。
RAG的概念其實(shí)并不復(fù)雜。簡(jiǎn)單來(lái)說(shuō),就是讓大模型在執(zhí)行生成之前參考或引用某些數(shù)據(jù),而這些數(shù)據(jù)通常并不在該大模型的訓(xùn)練數(shù)據(jù)集內(nèi),屬于專(zhuān)有或私有數(shù)據(jù)。百度的RAG可通過(guò)引用外部知識(shí)有效減少生成內(nèi)容出現(xiàn)事實(shí)性錯(cuò)誤的問(wèn)題。再加上百度實(shí)時(shí)和全面的搜索生態(tài)加持,整個(gè)推理的過(guò)程就做到了,拿著參考案例和解題思路作答的效果。

在原有基礎(chǔ)上,此次百度搜索還接入了文心一言的深度搜索新功能,搜索的深度廣度和工具調(diào)用上了強(qiáng)化“推理”。具體體現(xiàn)在,推理的背后都藏著一個(gè)“專(zhuān)家”為用戶提供復(fù)雜問(wèn)題和查詢的解答。該“專(zhuān)家”起初就會(huì)對(duì)“搜”這個(gè)動(dòng)作去分類(lèi),搜專(zhuān)業(yè)問(wèn)題、熱點(diǎn)還是寫(xiě)代碼,而后會(huì)根據(jù)搜索目的確定搜索路徑和分析呈現(xiàn)方式。通過(guò)真實(shí)模擬人的思考步驟和過(guò)程,來(lái)實(shí)現(xiàn)解決問(wèn)題的目標(biāo)。
此外,文心一言深度搜索功能還提供了多項(xiàng)工具調(diào)用,包含了高級(jí)聯(lián)網(wǎng)、文檔問(wèn)答、圖片理解、iRAG等功能,以此彌補(bǔ)了DeepSeek-R1單模態(tài)的缺陷。
例如,當(dāng)用戶上傳了兩張圖片,采用“文心大模型4.0工具版”識(shí)別圖片信息并且比較分析時(shí)。它會(huì)自動(dòng)選擇調(diào)用圖片理解、高級(jí)聯(lián)網(wǎng)、代碼解釋器等工具,模擬人的思考過(guò)程,先分析意圖,還原分析路徑的過(guò)程中調(diào)取合適的工具,最后以圖表的方式直觀呈現(xiàn)異同。
如果想根據(jù)原有的照片風(fēng)格生成類(lèi)似的圖片,就可以調(diào)用百度獨(dú)有的iRAG(image based RAG),檢索增強(qiáng)的文生圖技術(shù)。將百度搜索的億級(jí)圖片資源跟強(qiáng)大的基礎(chǔ)模型能力相結(jié)合,就可以生成各種超真實(shí)的圖片,整體效果遠(yuǎn)遠(yuǎn)超過(guò)文生圖原生系統(tǒng),去掉了AI味兒,而且創(chuàng)作成本接近于0。
去年,各個(gè)玩家都在角逐AI應(yīng)用第一的寶座,僅憑投流推廣,還是無(wú)法達(dá)到一款超級(jí)應(yīng)用的水平。現(xiàn)在,接入DeepSeek推理模型,全新的模型能力和原有的場(chǎng)景、用戶相結(jié)合。一夜之間,就冒出了多個(gè)超大用戶量級(jí)別的AI應(yīng)用產(chǎn)品。
百度App月活7.04億,推理和搜索能力升級(jí)后,讓廣泛的用戶瞬間進(jìn)入了AI搜索新時(shí)代。

此外,百家號(hào)有1100萬(wàn)內(nèi)容創(chuàng)作者,百度文心智能體平臺(tái)開(kāi)發(fā)者突破80萬(wàn)。
生態(tài)的優(yōu)勢(shì)將逐漸顯。一方面,百度搜索的開(kāi)放性使其能整合全網(wǎng)信息,結(jié)合DeepSeek的推理能力與文心大模型的多模態(tài)處理能力,覆蓋更廣泛的用戶需求場(chǎng)景;另一發(fā)面,通過(guò)智能體平臺(tái)吸引開(kāi)發(fā)者共創(chuàng)工具,形成“技術(shù)+開(kāi)發(fā)者+場(chǎng)景”多輪驅(qū)動(dòng)的良性生態(tài)。
百度搜索已經(jīng)集齊技術(shù)、生態(tài)、場(chǎng)景的王牌,接下來(lái)將引領(lǐng)搜索的新變革。
真開(kāi)放的底氣與勇氣
OpenAI的首席執(zhí)行官Sam Altman認(rèn)為,正是因?yàn)榧夹g(shù)曲線發(fā)展到了一個(gè)新的節(jié)點(diǎn),所以各方競(jìng)爭(zhēng)之下大模型效率正在加速提升。
百度大模型和搜索能夠迅速調(diào)轉(zhuǎn)方向,加入到世界的潮流中,正是源于技術(shù)與變革的底氣。大模型和相關(guān)產(chǎn)品的降價(jià)只是表現(xiàn),歸根到底源于背后訓(xùn)練成本和推理成本的降低。
近期,百度智能云成功點(diǎn)亮昆侖芯三代萬(wàn)卡集群,這也是國(guó)內(nèi)首個(gè)正式點(diǎn)亮的自研萬(wàn)卡集群。據(jù)悉,百度智能云將進(jìn)一步點(diǎn)亮三萬(wàn)卡集群。
大規(guī)模集群的優(yōu)勢(shì)在于,可以通過(guò)任務(wù)并行調(diào)度、彈性算力管理等方式,提高計(jì)算資源利用率,避免算力閑置,提高單任務(wù)的計(jì)算效率,降低整體算力成本。其昆侖芯在性能上表現(xiàn)卓越,能夠在更少的計(jì)算資源下運(yùn)行大規(guī)模模型(如DeepSeek-V3/R1)。
百舸平臺(tái)實(shí)現(xiàn)大規(guī)模集群的高效部署管理。為了解決大模型訓(xùn)練時(shí)高通信帶寬的需求,百度建設(shè)了超大規(guī)模HPN高性能網(wǎng)絡(luò),通過(guò)優(yōu)化的擁塞控制算法、集合通信算法策略,提升了通信效率,將帶寬有效性提升到90%以上。
同時(shí),萬(wàn)卡集群的能耗極高,常規(guī)的散熱方案能耗可達(dá)十兆瓦或更高,這將提升企業(yè)進(jìn)行模型訓(xùn)練的電力成本。為此,百舸采用了創(chuàng)新性散熱方案,可以降低能耗,進(jìn)一步降低模型訓(xùn)練成本。

為了提升GPU的有效利用率,百舸優(yōu)化并完善模型的分布式訓(xùn)練策略,通過(guò)高效并行化任務(wù)切分策略,將訓(xùn)練主流開(kāi)源模型的集群MFU提升至58%。
為了保證大規(guī)模集群執(zhí)行訓(xùn)練任務(wù)的穩(wěn)定性,百度自研的BCCL(百度集合通信庫(kù)),能夠快速定位故障同時(shí)提供自動(dòng)化的容錯(cuò)能力,重新調(diào)度任務(wù)到健康節(jié)點(diǎn),繼續(xù)完成訓(xùn)練。目前已經(jīng)將故障恢復(fù)時(shí)間從小時(shí)級(jí)降低到分鐘級(jí),保障集群有效訓(xùn)練率達(dá)到98%。
除了訓(xùn)練成本,現(xiàn)階段,訓(xùn)練成本下降才是更主要的因素。有分析人士認(rèn)為,此次文心一言全面功能開(kāi)放,背后最大的原因之一就是推理成本不斷降低。
根據(jù)其分析,百度在模型推理部署方面有比較大的優(yōu)勢(shì),尤其是在飛槳深度學(xué)習(xí)框架的支持下,其中并行推理、量化推理等都是飛槳在大模型推理上的自研技術(shù)。飛槳和文心的聯(lián)合優(yōu)化可以實(shí)現(xiàn)推理性能提升,推理成本降低。
從技術(shù)發(fā)展曲線來(lái)看,大模型推理和AI成本一直在下降。
以GPT為例,2023年GPT-4的token成本為36美元/百萬(wàn)token,到了2024年中期GPT-4o成本下降為了4美元/百萬(wàn)token,在此期間每個(gè)token價(jià)格下降了約150倍,摩爾定律以每18個(gè)月性能翻倍的速度改變了世界。
“過(guò)去,我們談?wù)撃柖蓵r(shí),每18個(gè)月,性能水平或價(jià)格都會(huì)減半。但是今天,當(dāng)我們談?wù)摯笳Z(yǔ)言模型時(shí),增加的成本基本上降低了,可以在12個(gè)月內(nèi)降低90%以上”,百度CEO李彥宏在阿聯(lián)酋迪拜出席“世界政府峰會(huì)”說(shuō)道。
開(kāi)源、普惠、人人都用得上AI,也許已經(jīng)在路上了。
本文來(lái)自投稿,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.gptmaths.com/cgo/131040.html