?點(diǎn)擊關(guān)注

文｜姚悅

編｜王一粟

百模大戰(zhàn)，到了真正的亮劍時刻。

“京東一直在探索哪些產(chǎn)品、技術(shù)、場景可以真正把大模型用起來，在我們內(nèi)部的場景中反復(fù)驗(yàn)證后，才決定在7月份對外發(fā)布，現(xiàn)在我們在零售、健康、物流、金融等業(yè)務(wù)場景里已經(jīng)積累了一些經(jīng)驗(yàn)?！本〇|集團(tuán)技術(shù)委員會主席、京東云事業(yè)部總裁曹鵬在群訪中，對光錐智能表示。

大模型火熱半年，自2月官宣聚焦“產(chǎn)業(yè)大模型”后，一直相對低調(diào)的京東，也終于展示了自己的言犀大模型。但與此同時，大模型的競爭已經(jīng)趨于白熱化。據(jù)不完全統(tǒng)計(jì)，當(dāng)前國內(nèi)已發(fā)布超過80個大模型產(chǎn)品，并已經(jīng)開始對應(yīng)不同行業(yè)、不同應(yīng)用場景頻繁發(fā)力。

究竟什么樣的大模型，才能在這番激烈的競爭中突出重圍？

一方面，大模型亟需尋找到場景快速落地，另一方面，中國實(shí)體產(chǎn)業(yè)需要技術(shù)驅(qū)動來降本增效。

于是，從產(chǎn)業(yè)中來，到產(chǎn)業(yè)中去，就成了京東大模型自然的選擇。

“大模型，讓技術(shù)幫助產(chǎn)業(yè)降本增效的可能性成倍遞增?！本〇|集團(tuán)CEO許冉認(rèn)為，從產(chǎn)業(yè)段切入大模型，如同從北坡攀爬技術(shù)珠峰。道路雖然更加艱難，卻有更波瀾壯闊的風(fēng)景。

長于產(chǎn)業(yè)的大模型

“言犀大模型訓(xùn)練時，融合70%的通用數(shù)據(jù)與30%數(shù)智供應(yīng)鏈原生數(shù)據(jù)”，IEEE Fellow、京東探索研究院院長、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬告訴光錐智能。

這種大模型訓(xùn)練方式，與此前業(yè)界早期普遍認(rèn)為的并不相同。

“目前，基礎(chǔ)模型有三種不同的應(yīng)用模式：第一種是通用基礎(chǔ)模型訓(xùn)練好后，遷移至行業(yè)基礎(chǔ)模型中，進(jìn)而做產(chǎn)業(yè)（垂直）應(yīng)用；第二種是通用基礎(chǔ)模型進(jìn)行微調(diào)；第三種，則是利用通用大模型+‘知識庫和搜索引擎’?！睒I(yè)內(nèi)人士分享道。

2023京東科技峰會現(xiàn)場

由于前兩種的訓(xùn)練成本偏高，且用于通用大模型訓(xùn)練的公開數(shù)據(jù)“噪聲”過大，容易出現(xiàn)錯誤、謠言、偏見等問題，以至于讓AI 存在“幻覺”“一本正經(jīng)的胡說八道”，無法保障內(nèi)容真實(shí)可信，進(jìn)而阻礙大模型落地行業(yè)。

近期，從OpenAI到國內(nèi)部分公司，都開始偏向第三種應(yīng)用路徑，而京東也正是走的這條路。“知識庫+搜索引擎”，大致可以理解為是產(chǎn)業(yè)（垂類）領(lǐng)域的向量數(shù)據(jù)庫，這樣的向量數(shù)據(jù)庫與通用大模型結(jié)合，被業(yè)界稱之為“黃金搭檔”。

通過這樣的路徑，“言犀大模型一開始就既具備常識，又具備專業(yè)性。相當(dāng)于是既做了通識教育，又做了四年本科教育”，何曉冬形象地描述言犀大模型的差異性。

京東找到這樣的路徑，并不是偶然。

從事AIGC領(lǐng)域研究20余年的何曉冬，在2020年開始通過注意力機(jī)制、深度學(xué)習(xí)、Transformer 生成文檔、文案，他注意到，用大語言模型直接生成的文案、文字和報告總會出現(xiàn)一些“胡說八道”“玄幻”的現(xiàn)象。

于是，何曉冬和團(tuán)隊(duì)提出了知識注入的預(yù)訓(xùn)練語言模型（K-Plug），并于2021年發(fā)布了相關(guān)論文。“京東內(nèi)部用上更早一點(diǎn)”，何曉冬說，通過K-Plug，讓Transformer和行業(yè)知識結(jié)合，讓生成式語言模型的內(nèi)容生成正確率從83%、85%左右，直接提升到95%以上，才能達(dá)到商用程度。

“83%的正確率在to C 用戶的聊天中，也可以接受。但是，商用是不可接受的?！焙螘远岬?。

GPT能出現(xiàn)智能涌現(xiàn)，依靠的不是數(shù)據(jù)，而是文本數(shù)據(jù)中的知識。所以，相比一味的追求超大參數(shù)量，數(shù)據(jù)中的“知識”含量更為重要。

基于20年的行業(yè)“知識”積累，京東言犀可以說是“長”在了數(shù)智供應(yīng)鏈上。

供應(yīng)鏈?zhǔn)钱a(chǎn)業(yè)中數(shù)據(jù)最集中、結(jié)構(gòu)最復(fù)雜、相關(guān)度最密切的環(huán)節(jié)。在零售、物流，到健康、保險、工業(yè)等場景中，京東沉淀了從采購、分銷、交易、物流等產(chǎn)業(yè)鏈條中的巨量數(shù)據(jù)，并且每天還會源源不斷產(chǎn)生大量“活”的交互數(shù)據(jù)。

在行業(yè)中長期積累的“知識”，保障了大模型的可信，極大的幫助大模型落地。

“只有自己的場景才能培養(yǎng)適合自己的大模型應(yīng)用”，京東集團(tuán)副總裁、京東科技產(chǎn)品與解決方案總裁高禮強(qiáng)如此說道。

30%的京東數(shù)智供應(yīng)鏈數(shù)據(jù)，訓(xùn)練出了產(chǎn)業(yè)可用的大模型，而大模型在應(yīng)用過程中要落地，還需要在具體場景中繼續(xù)打磨。

在場景中歷練，算法與數(shù)據(jù)的飛輪

“大模型不是我們的目標(biāo)，而是（產(chǎn)業(yè)服務(wù)的）工具?！辈荠i表示，大模型不能只用來聊天、畫畫、吟詩作賦，最終還是要在產(chǎn)業(yè)中創(chuàng)造價值。

所以，在語言大模型火熱的半年里，京東選擇了埋頭摸索和嘗試，讓大模型先在京東的多項(xiàng)業(yè)務(wù)中歷練。

由于AIGC在生成和交互中表現(xiàn)優(yōu)異，所以在京東健康中落地較快。

AI問診流程

在京東健康的諸多業(yè)務(wù)流程中，大模型首先在AI問診中落地。用戶輸入“我可以吃阿司匹林嗎？”的訴求后，接下來在AI的引導(dǎo)下，通過多輪對話逐步判斷病因，給出診斷、用藥參考，并進(jìn)行生活建議，醫(yī)療風(fēng)險提示。

這就是在言犀大模型3.0的基礎(chǔ)上，通過醫(yī)療知識和經(jīng)驗(yàn)訓(xùn)練的“慧醫(yī)千詢”大模型，在現(xiàn)場輔助診療場景下的具體表現(xiàn)。這背后，是京東健康累計(jì)線上問診數(shù)據(jù)2.8億，超3千萬高質(zhì)量臨患對話，140余科室醫(yī)療專家等數(shù)據(jù)積累。

如果是一般通用大模型，在遇到患者問題時，更傾向于直接把答案給出。“但是在實(shí)際的醫(yī)療場景下，是需要多輪對話，才能更深入了解用戶病史信息，這樣才能給出更適合用戶自身特點(diǎn)的方案?！本〇|集團(tuán)副總裁、京東健康技術(shù)產(chǎn)品部負(fù)責(zé)人李欣表示。

醫(yī)療是和百姓生活息息相關(guān)一個行業(yè)，其中存在一個著名的“不可能三角”，即醫(yī)療服務(wù)不可能同時實(shí)現(xiàn)高質(zhì)量、高覆蓋、低成本，這本質(zhì)上是由于優(yōu)質(zhì)醫(yī)療資源的供給不足造成。

“慧醫(yī)千詢”的出現(xiàn)，目標(biāo)就是通過遠(yuǎn)程醫(yī)療全流程方案，解決這個“不可能三角”。

李欣透露，“慧醫(yī)千詢”重點(diǎn)會做兩個核心場景，“首先是藥師的問答，這個非常專業(yè)化、具體，是醫(yī)療大模型最容易發(fā)揮作用的地方，AI自動化可以省去90%的人工工作量。再在這個基礎(chǔ)上，推全場景醫(yī)患問答?！?/p>

除了京東健康，大模型在京東物流、零售等方面也大展拳腳。

“電商的產(chǎn)品視頻、照片直接由人去拍攝非常貴，少則幾百塊，多則幾千塊?！本〇|集團(tuán)副總裁、京東科技產(chǎn)品與解決方案總裁高禮強(qiáng)表示，AIGC可以極大的降低商品營銷的成本。

目前，基于言犀的AIGC內(nèi)容營銷平臺，已經(jīng)能很好地理解商品特征，自動幫助商家生成商品圖片、賣點(diǎn)等營銷素材。以每套圖為例，成本降低90%，周期從7天縮短到半天。

通過對營銷的理解，以及用戶運(yùn)營經(jīng)驗(yàn)的持續(xù)積累，大模型解決了諸如關(guān)鍵性任務(wù)，動態(tài)適應(yīng)性、用戶體驗(yàn)等問題。本次發(fā)布的AI增長營銷平臺是京東科技市場和平臺運(yùn)營團(tuán)隊(duì)依托日常的金融營銷工作結(jié)合大模型應(yīng)用的探索，能大幅優(yōu)化了營銷運(yùn)營流程，降低運(yùn)營人員的學(xué)習(xí)成本與操作成本，實(shí)現(xiàn)方案生產(chǎn)效率上百倍提高。將過去涉及產(chǎn)品/研發(fā)/算法/設(shè)計(jì)/分析師等5類以上職能才能完成的流程，壓縮至1人。同時，一個入口的全新交互模式，讓人機(jī)交互次數(shù)從2000次降低至少于50次，將操作效率提升了超過40倍。

另外，數(shù)字人在主播方面的落地也是行業(yè)熱點(diǎn)，基于京東在電商領(lǐng)域知識增強(qiáng)模型K-PLUG，僅需在直播后臺上傳商品鏈接，數(shù)字人就能“閱讀”商品詳情，找到關(guān)鍵的規(guī)格、賣點(diǎn)等信息，并自動生成真實(shí)、生動、可閱讀性強(qiáng)的直播文案。

例如，商家原先寫出50個SKU的直播腳本需要至少五小時，使用K-PLUG模型只需要“一鍵生成”。目前K-PLUG商品文案寫作能力已經(jīng)覆蓋3000多個京東的品類，累計(jì)生成文案30多億字。

通過上面場景就可以看到，大模型在產(chǎn)業(yè)（垂類）場景中的降本增效非常明顯。

當(dāng)大模型在海量具體場景中使用時，人類真實(shí)反饋就會讓數(shù)據(jù)和算法的形成飛輪效應(yīng)。這期間，高質(zhì)量數(shù)據(jù)不斷生成，垂直行業(yè)的智能涌現(xiàn)才有可能出現(xiàn)。

為了支撐大模型在場景中的歷練，京東需要不斷在產(chǎn)品和算力方面提升能力。產(chǎn)品方面，日前，京東將積累高質(zhì)量行業(yè)數(shù)據(jù)的兩個平臺——數(shù)智平臺優(yōu)加DaaS和言犀智能服務(wù)都已升級到了3.0版本，進(jìn)一步提升了交互能力，以及更好地將數(shù)據(jù)用起來；算力方面，已經(jīng)布局了全國首個基于SuperPOD架構(gòu)的超大規(guī)模計(jì)算集群——天琴α，算力總規(guī)模達(dá)到135TFLOPS（每秒浮點(diǎn)運(yùn)算次數(shù)）。

六年AI路，三年大模型

種樹最好的時間是在十年前。

在大模型突然爆火之前，京東很早已經(jīng)開始“栽樹”。

“技術(shù)、技術(shù)、技術(shù)”，2017年初，京東開始全面向 AI 技術(shù)轉(zhuǎn)型。

第一個技術(shù)，主要用于解決內(nèi)部大規(guī)模人力帶來的效率問題；第二個技術(shù)，是組件化、模塊化的技術(shù)服務(wù)對外輸出；第三個技術(shù)，則是對前沿技術(shù)進(jìn)行探索和有秩序地創(chuàng)新。

2017年底，京東在人工智能的布局就開始落地，一方面聚集團(tuán)隊(duì)，通過人才、研究、專利等打造技術(shù)護(hù)城河；但與此同時，京東也一直在思考一個問題——怎樣將這些技術(shù)落地產(chǎn)生閉環(huán)的商業(yè)價值和產(chǎn)品價值？

2018年，人工智能領(lǐng)域科學(xué)家何曉冬正式加入京東。2020年，何曉冬團(tuán)隊(duì)就開始關(guān)注如何利用深度學(xué)習(xí)的模型。2021年京東開始組建大模型團(tuán)隊(duì)，探索深度學(xué)習(xí)及語音和語言技術(shù)在新興領(lǐng)域等應(yīng)用場景的落地。

早在2022年，京東就推出了百億參數(shù)的大模型Vega。但直到今年上半年ChatGPT大火，京東雖然在2月份宣布要做服務(wù)產(chǎn)業(yè)的大模型，但遲遲沒有對外公布。

“百模大戰(zhàn)”白熱化升級，外界都替京東著急了?！坝袩o數(shù)的朋友，最近都會跑過來問我，你們京東有沒有大模型？什么時候發(fā)大模型？”曹鵬在2023京東全球科技探索者大會暨京東云峰會上打趣道。

但這背后，其實(shí)回到一個很嚴(yán)肅的問題上，就是京東最初就思考的那個問題——技術(shù)的價值，也可以說成是大模型的價值。

“大模型本身是沒有辦法直接產(chǎn)生價值的，只有放到場景里才能夠產(chǎn)生實(shí)際的價值?！辈荠i說，“在京東我們真正講大模型本身會比較少，更多會講在產(chǎn)業(yè)里面、場景里面，怎么能夠利用新的技術(shù)帶來產(chǎn)業(yè)變化，真的給產(chǎn)業(yè)不斷提升效率、改善體驗(yàn)、降低成本，這才是一個技術(shù)真正核心的價值所在?！?/p>

關(guān)于大模型，京東制定了“三步走”戰(zhàn)略。第一步，基于內(nèi)部實(shí)踐構(gòu)建言犀大模型和言犀AI開發(fā)計(jì)算平臺；第二步，在零售、金融、健康、物流等京東內(nèi)部高復(fù)雜場景大規(guī)模錘煉，并針對重點(diǎn)場景的標(biāo)桿客戶進(jìn)行對外服務(wù)，主要目的是發(fā)現(xiàn)那些看起來“不起眼”，但產(chǎn)業(yè)應(yīng)用中又非常關(guān)鍵的問題；第三步，針對嚴(yán)肅商業(yè)場景將大模型能力對外開放。

今年上半年，京東大模型走過了第一步，并在第二個階段有了初步嘗試，處于在第二個階段的深化和逐步向第三步邁進(jìn)的狀態(tài)。

大模型不是一天能煉成的。

在 ChatGPT 證明 AGI（通用人工智能）的可能性之前，AI技術(shù)長期面臨著技術(shù)突破遙遙無期、商業(yè)落地困難等問題，甚至AI行業(yè)自己也一度質(zhì)疑過人工智能的價值。

但在今年光錐智能觀察到一個現(xiàn)象，就是：

人工智能，已經(jīng)不再是獨(dú)立的人工智能實(shí)驗(yàn)室，而是泛化到所有業(yè)務(wù)當(dāng)中。

當(dāng) AI 離開實(shí)驗(yàn)室，才是價值綻放的開始。

京東對大模型的價值，有自己的理解。許冉在峰會上提出，“大模型的價值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方”的公式，她強(qiáng)調(diào)，當(dāng)產(chǎn)業(yè)效率和產(chǎn)業(yè)的邊界得到質(zhì)的提升后，大模型才有了更重要的實(shí)際價值和意義，將不亞于又一次工業(yè)革命。

歡迎關(guān)注“光錐智能”，獲取更多前沿科技知識！

本文來自投稿，不代表增長黑客立場，如若轉(zhuǎn)載，請注明出處：http://m.gptmaths.com/quan/101848.html

產(chǎn)業(yè)大模型剛開卷，京東跑進(jìn)“最后半公里”

長于產(chǎn)業(yè)的大模型

在場景中歷練，算法與數(shù)據(jù)的飛輪

六年AI路，三年大模型

關(guān)于作者

光錐智能

發(fā)表回復(fù)

產(chǎn)業(yè)大模型剛開卷，京東跑進(jìn)“最后半公里”

長于產(chǎn)業(yè)的大模型

在場景中歷練，算法與數(shù)據(jù)的飛輪

六年AI路，三年大模型

關(guān)于作者

光錐智能

增長黑客Growthhk.cn薦讀更多>>

AI PC，是聯(lián)想們的銷量解藥嗎？

“AI+手機(jī)”等于AI手機(jī)嗎？

對話企企通CEO徐輝：數(shù)字采購何以搭建產(chǎn)業(yè)數(shù)字化“橋梁”？

8個月過去了，中國大模型落地進(jìn)展如何？

大模型2024：先把價格打下去

經(jīng)緯中國熊飛：美國市場的情況與中國市場的獨(dú)特機(jī)遇

發(fā)表回復(fù)

產(chǎn)業(yè)大模型剛開卷，京東跑進(jìn)“最后半公里”

AI PC，是聯(lián)想們的銷量解藥嗎？

對話企企通CEO徐輝：數(shù)字采購何以搭建產(chǎn)業(yè)數(shù)字化“橋梁”？

8個月過去了，中國大模型落地進(jìn)展如何？