?點(diǎn)擊關(guān)注
文|姚 悅
編|王一粟
百模大戰(zhàn),到了真正的亮劍時刻。
“京東一直在探索哪些產(chǎn)品、技術(shù)、場景可以真正把大模型用起來,在我們內(nèi)部的場景中反復(fù)驗(yàn)證后,才決定在7月份對外發(fā)布,現(xiàn)在我們在零售、健康、物流、金融等業(yè)務(wù)場景里已經(jīng)積累了一些經(jīng)驗(yàn)?!本〇|集團(tuán)技術(shù)委員會主席、京東云事業(yè)部總裁曹鵬在群訪中,對光錐智能表示。
大模型火熱半年,自2月官宣聚焦“產(chǎn)業(yè)大模型”后,一直相對低調(diào)的京東,也終于展示了自己的言犀大模型。但與此同時,大模型的競爭已經(jīng)趨于白熱化。據(jù)不完全統(tǒng)計(jì),當(dāng)前國內(nèi)已發(fā)布超過80個大模型產(chǎn)品,并已經(jīng)開始對應(yīng)不同行業(yè)、不同應(yīng)用場景頻繁發(fā)力。
究竟什么樣的大模型,才能在這番激烈的競爭中突出重圍?
一方面,大模型亟需尋找到場景快速落地,另一方面,中國實(shí)體產(chǎn)業(yè)需要技術(shù)驅(qū)動來降本增效。
于是,從產(chǎn)業(yè)中來,到產(chǎn)業(yè)中去,就成了京東大模型自然的選擇。
“大模型,讓技術(shù)幫助產(chǎn)業(yè)降本增效的可能性成倍遞增?!本〇|集團(tuán)CEO許冉認(rèn)為,從產(chǎn)業(yè)段切入大模型,如同從北坡攀爬技術(shù)珠峰。道路雖然更加艱難,卻有更波瀾壯闊的風(fēng)景。
長于產(chǎn)業(yè)的大模型
“言犀大模型訓(xùn)練時,融合70%的通用數(shù)據(jù)與30%數(shù)智供應(yīng)鏈原生數(shù)據(jù)”,IEEE Fellow、京東探索研究院院長、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬告訴光錐智能。
這種大模型訓(xùn)練方式,與此前業(yè)界早期普遍認(rèn)為的并不相同。
“目前,基礎(chǔ)模型有三種不同的應(yīng)用模式:第一種是通用基礎(chǔ)模型訓(xùn)練好后,遷移至行業(yè)基礎(chǔ)模型中,進(jìn)而做產(chǎn)業(yè)(垂直)應(yīng)用;第二種是通用基礎(chǔ)模型進(jìn)行微調(diào);第三種,則是利用通用大模型+‘知識庫和搜索引擎’?!睒I(yè)內(nèi)人士分享道。
2023京東科技峰會現(xiàn)場
由于前兩種的訓(xùn)練成本偏高,且用于通用大模型訓(xùn)練的公開數(shù)據(jù)“噪聲”過大,容易出現(xiàn)錯誤、謠言、偏見等問題,以至于讓AI 存在“幻覺”“一本正經(jīng)的胡說八道”,無法保障內(nèi)容真實(shí)可信,進(jìn)而阻礙大模型落地行業(yè)。
近期,從OpenAI到國內(nèi)部分公司,都開始偏向第三種應(yīng)用路徑,而京東也正是走的這條路。“知識庫+搜索引擎”,大致可以理解為是產(chǎn)業(yè)(垂類)領(lǐng)域的向量數(shù)據(jù)庫,這樣的向量數(shù)據(jù)庫與通用大模型結(jié)合,被業(yè)界稱之為“黃金搭檔”。
通過這樣的路徑,“言犀大模型一開始就既具備常識,又具備專業(yè)性。相當(dāng)于是既做了通識教育,又做了四年本科教育”,何曉冬形象地描述言犀大模型的差異性。
京東找到這樣的路徑,并不是偶然。
從事AIGC領(lǐng)域研究20余年的何曉冬,在2020年開始通過注意力機(jī)制、深度學(xué)習(xí)、Transformer 生成文檔、文案,他注意到,用大語言模型直接生成的文案、文字和報告總會出現(xiàn)一些“胡說八道”“玄幻”的現(xiàn)象。
于是,何曉冬和團(tuán)隊(duì)提出了知識注入的預(yù)訓(xùn)練語言模型(K-Plug),并于2021年發(fā)布了相關(guān)論文。“京東內(nèi)部用上更早一點(diǎn)”,何曉冬說,通過K-Plug,讓Transformer和行業(yè)知識結(jié)合,讓生成式語言模型的內(nèi)容生成正確率從83%、85%左右,直接提升到95%以上,才能達(dá)到商用程度。
“83%的正確率在to C 用戶的聊天中,也可以接受。但是,商用是不可接受的?!焙螘远岬?。
GPT能出現(xiàn)智能涌現(xiàn),依靠的不是數(shù)據(jù),而是文本數(shù)據(jù)中的知識。所以,相比一味的追求超大參數(shù)量,數(shù)據(jù)中的“知識”含量更為重要。
基于20年的行業(yè)“知識”積累,京東言犀可以說是“長”在了數(shù)智供應(yīng)鏈上。
供應(yīng)鏈?zhǔn)钱a(chǎn)業(yè)中數(shù)據(jù)最集中、結(jié)構(gòu)最復(fù)雜、相關(guān)度最密切的環(huán)節(jié)。在零售、物流,到健康、保險、工業(yè)等場景中,京東沉淀了從采購、分銷、交易、物流等產(chǎn)業(yè)鏈條中的巨量數(shù)據(jù),并且每天還會源源不斷產(chǎn)生大量“活”的交互數(shù)據(jù)。
在行業(yè)中長期積累的“知識”,保障了大模型的可信,極大的幫助大模型落地。
“只有自己的場景才能培養(yǎng)適合自己的大模型應(yīng)用”,京東集團(tuán)副總裁、京東科技產(chǎn)品與解決方案總裁高禮強(qiáng)如此說道。
30%的京東數(shù)智供應(yīng)鏈數(shù)據(jù),訓(xùn)練出了產(chǎn)業(yè)可用的大模型,而大模型在應(yīng)用過程中要落地,還需要在具體場景中繼續(xù)打磨。
在場景中歷練,算法與數(shù)據(jù)的飛輪
“大模型不是我們的目標(biāo),而是(產(chǎn)業(yè)服務(wù)的)工具?!辈荠i表示,大模型不能只用來聊天、畫畫、吟詩作賦,最終還是要在產(chǎn)業(yè)中創(chuàng)造價值。
所以,在語言大模型火熱的半年里,京東選擇了埋頭摸索和嘗試,讓大模型先在京東的多項(xiàng)業(yè)務(wù)中歷練。
由于AIGC在生成和交互中表現(xiàn)優(yōu)異,所以在京東健康中落地較快。
AI問診流程
在京東健康的諸多業(yè)務(wù)流程中,大模型首先在AI問診中落地。用戶輸入“我可以吃阿司匹林嗎?”的訴求后,接下來在AI的引導(dǎo)下,通過多輪對話逐步判斷病因,給出診斷、用藥參考,并進(jìn)行生活建議,醫(yī)療風(fēng)險提示。
這就是在言犀大模型3.0的基礎(chǔ)上,通過醫(yī)療知識和經(jīng)驗(yàn)訓(xùn)練的“慧醫(yī)千詢”大模型,在現(xiàn)場輔助診療場景下的具體表現(xiàn)。這背后,是京東健康累計(jì)線上問診數(shù)據(jù)2.8億,超3千萬高質(zhì)量臨患對話,140余科室醫(yī)療專家等數(shù)據(jù)積累。
如果是一般通用大模型,在遇到患者問題時,更傾向于直接把答案給出。“但是在實(shí)際的醫(yī)療場景下,是需要多輪對話,才能更深入了解用戶病史信息,這樣才能給出更適合用戶自身特點(diǎn)的方案?!本〇|集團(tuán)副總裁、京東健康技術(shù)產(chǎn)品部負(fù)責(zé)人李欣表示。
醫(yī)療是和百姓生活息息相關(guān)一個行業(yè),其中存在一個著名的“不可能三角”,即醫(yī)療服務(wù)不可能同時實(shí)現(xiàn)高質(zhì)量、高覆蓋、低成本,這本質(zhì)上是由于優(yōu)質(zhì)醫(yī)療資源的供給不足造成。
“慧醫(yī)千詢”的出現(xiàn),目標(biāo)就是通過遠(yuǎn)程醫(yī)療全流程方案,解決這個“不可能三角”。
李欣透露,“慧醫(yī)千詢”重點(diǎn)會做兩個核心場景,“首先是藥師的問答,這個非常專業(yè)化、具體,是醫(yī)療大模型最容易發(fā)揮作用的地方,AI自動化可以省去90%的人工工作量。再在這個基礎(chǔ)上,推全場景醫(yī)患問答?!?/p>
除了京東健康,大模型在京東物流、零售等方面也大展拳腳。
“電商的產(chǎn)品視頻、照片直接由人去拍攝非常貴,少則幾百塊,多則幾千塊?!本〇|集團(tuán)副總裁、京東科技產(chǎn)品與解決方案總裁高禮強(qiáng)表示,AIGC可以極大的降低商品營銷的成本。
目前,基于言犀的AIGC內(nèi)容營銷平臺,已經(jīng)能很好地理解商品特征,自動幫助商家生成商品圖片、賣點(diǎn)等營銷素材。以每套圖為例,成本降低90%,周期從7天縮短到半天。
通過對營銷的理解,以及用戶運(yùn)營經(jīng)驗(yàn)的持續(xù)積累,大模型解決了諸如關(guān)鍵性任務(wù),動態(tài)適應(yīng)性、用戶體驗(yàn)等問題。本次發(fā)布的AI增長營銷平臺是京東科技市場和平臺運(yùn)營團(tuán)隊(duì)依托日常的金融營銷工作結(jié)合大模型應(yīng)用的探索,能大幅優(yōu)化了營銷運(yùn)營流程,降低運(yùn)營人員的學(xué)習(xí)成本與操作成本,實(shí)現(xiàn)方案生產(chǎn)效率上百倍提高。將過去涉及產(chǎn)品/研發(fā)/算法/設(shè)計(jì)/分析師等5類以上職能才能完成的流程,壓縮至1人。同時,一個入口的全新交互模式,讓人機(jī)交互次數(shù)從2000次降低至少于50次,將操作效率提升了超過40倍。
另外,數(shù)字人在主播方面的落地也是行業(yè)熱點(diǎn),基于京東在電商領(lǐng)域知識增強(qiáng)模型K-PLUG,僅需在直播后臺上傳商品鏈接,數(shù)字人就能“閱讀”商品詳情,找到關(guān)鍵的規(guī)格、賣點(diǎn)等信息,并自動生成真實(shí)、生動、可閱讀性強(qiáng)的直播文案。
例如,商家原先寫出50個SKU的直播腳本需要至少五小時,使用K-PLUG模型只需要“一鍵生成”。目前K-PLUG商品文案寫作能力已經(jīng)覆蓋3000多個京東的品類,累計(jì)生成文案30多億字。
通過上面場景就可以看到,大模型在產(chǎn)業(yè)(垂類)場景中的降本增效非常明顯。
當(dāng)大模型在海量具體場景中使用時,人類真實(shí)反饋就會讓數(shù)據(jù)和算法的形成飛輪效應(yīng)。這期間,高質(zhì)量數(shù)據(jù)不斷生成,垂直行業(yè)的智能涌現(xiàn)才有可能出現(xiàn)。
為了支撐大模型在場景中的歷練,京東需要不斷在產(chǎn)品和算力方面提升能力。產(chǎn)品方面,日前,京東將積累高質(zhì)量行業(yè)數(shù)據(jù)的兩個平臺——數(shù)智平臺優(yōu)加DaaS和言犀智能服務(wù)都已升級到了3.0版本,進(jìn)一步提升了交互能力,以及更好地將數(shù)據(jù)用起來;算力方面,已經(jīng)布局了全國首個基于SuperPOD架構(gòu)的超大規(guī)模計(jì)算集群——天琴α,算力總規(guī)模達(dá)到135TFLOPS(每秒浮點(diǎn)運(yùn)算次數(shù))。
六年AI路,三年大模型
種樹最好的時間是在十年前。
在大模型突然爆火之前,京東很早已經(jīng)開始“栽樹”。
“技術(shù)、技術(shù)、技術(shù)”,2017年初,京東開始全面向 AI 技術(shù)轉(zhuǎn)型。
第一個技術(shù),主要用于解決內(nèi)部大規(guī)模人力帶來的效率問題;第二個技術(shù),是組件化、模塊化的技術(shù)服務(wù)對外輸出;第三個技術(shù),則是對前沿技術(shù)進(jìn)行探索和有秩序地創(chuàng)新。
2017年底,京東在人工智能的布局就開始落地,一方面聚集團(tuán)隊(duì),通過人才、研究、專利等打造技術(shù)護(hù)城河;但與此同時,京東也一直在思考一個問題——怎樣將這些技術(shù)落地產(chǎn)生閉環(huán)的商業(yè)價值和產(chǎn)品價值?
2018年,人工智能領(lǐng)域科學(xué)家何曉冬正式加入京東。2020年,何曉冬團(tuán)隊(duì)就開始關(guān)注如何利用深度學(xué)習(xí)的模型。2021年京東開始組建大模型團(tuán)隊(duì),探索深度學(xué)習(xí)及語音和語言技術(shù)在新興領(lǐng)域等應(yīng)用場景的落地。
早在2022年,京東就推出了百億參數(shù)的大模型Vega。但直到今年上半年ChatGPT大火,京東雖然在2月份宣布要做服務(wù)產(chǎn)業(yè)的大模型,但遲遲沒有對外公布。
“百模大戰(zhàn)”白熱化升級,外界都替京東著急了?!坝袩o數(shù)的朋友,最近都會跑過來問我,你們京東有沒有大模型?什么時候發(fā)大模型?”曹鵬在2023京東全球科技探索者大會暨京東云峰會上打趣道。
但這背后,其實(shí)回到一個很嚴(yán)肅的問題上,就是京東最初就思考的那個問題——技術(shù)的價值,也可以說成是大模型的價值。
“大模型本身是沒有辦法直接產(chǎn)生價值的,只有放到場景里才能夠產(chǎn)生實(shí)際的價值?!辈荠i說,“在京東我們真正講大模型本身會比較少,更多會講在產(chǎn)業(yè)里面、場景里面,怎么能夠利用新的技術(shù)帶來產(chǎn)業(yè)變化,真的給產(chǎn)業(yè)不斷提升效率、改善體驗(yàn)、降低成本,這才是一個技術(shù)真正核心的價值所在?!?/p>
關(guān)于大模型,京東制定了“三步走”戰(zhàn)略。第一步,基于內(nèi)部實(shí)踐構(gòu)建言犀大模型和言犀AI開發(fā)計(jì)算平臺;第二步,在零售、金融、健康、物流等京東內(nèi)部高復(fù)雜場景大規(guī)模錘煉,并針對重點(diǎn)場景的標(biāo)桿客戶進(jìn)行對外服務(wù),主要目的是發(fā)現(xiàn)那些看起來“不起眼”,但產(chǎn)業(yè)應(yīng)用中又非常關(guān)鍵的問題;第三步,針對嚴(yán)肅商業(yè)場景將大模型能力對外開放。
今年上半年,京東大模型走過了第一步,并在第二個階段有了初步嘗試,處于在第二個階段的深化和逐步向第三步邁進(jìn)的狀態(tài)。
大模型不是一天能煉成的。
在 ChatGPT 證明 AGI(通用人工智能)的可能性之前,AI技術(shù)長期面臨著技術(shù)突破遙遙無期、商業(yè)落地困難等問題,甚至AI行業(yè)自己也一度質(zhì)疑過人工智能的價值。
但在今年光錐智能觀察到一個現(xiàn)象,就是:
人工智能,已經(jīng)不再是獨(dú)立的人工智能實(shí)驗(yàn)室,而是泛化到所有業(yè)務(wù)當(dāng)中。
當(dāng) AI 離開實(shí)驗(yàn)室,才是價值綻放的開始。
京東對大模型的價值,有自己的理解。許冉在峰會上提出,“大模型的價值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方”的公式,她強(qiáng)調(diào),當(dāng)產(chǎn)業(yè)效率和產(chǎn)業(yè)的邊界得到質(zhì)的提升后,大模型才有了更重要的實(shí)際價值和意義,將不亞于又一次工業(yè)革命。
歡迎關(guān)注“光錐智能”,獲取更多前沿科技知識!
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://m.gptmaths.com/quan/101848.html