逐浪100人丨對(duì)話魔琺科技CEO柴金祥:AI時(shí)代,虛擬人的邊界在哪?

?自象限原創(chuàng)

訪談丨程心

生成式AI的爆發(fā),帶領(lǐng)全民到達(dá)AIGC的新時(shí)代。

在這個(gè)新時(shí)代,虛擬人作為一種新興的內(nèi)容載體,不僅在娛樂(lè)、教育、零售等領(lǐng)域中扮演著越來(lái)越重要的角色,也成為了品牌與消費(fèi)者之間互動(dòng)的新媒介。

在去年虛擬人技術(shù)發(fā)展的一年中,3D虛擬人與2D虛擬人成為了行業(yè)一道極為明顯的分水嶺。2D虛擬人通常限于平面的視覺(jué)表現(xiàn),適用于傳統(tǒng)的社交媒體和網(wǎng)頁(yè)內(nèi)容。相比之下,3D虛擬人則提供了一個(gè)三維的、可以與之互動(dòng)的世界,它們不僅能夠提供更加真實(shí)的視覺(jué)體驗(yàn),更是未來(lái)“入口級(jí)的應(yīng)用”。

從技術(shù)的發(fā)展來(lái)看,虛擬人正從單一的形象展示向更加綜合和多元的“虛擬人+”階段過(guò)渡。這一階段的虛擬人不再僅僅是一個(gè)靜態(tài)的形象,而是成為了一個(gè)具備多種功能和服務(wù)能力的智能實(shí)體。它們可以是虛擬客服、虛擬教師、虛擬主播,甚至是虛擬健康顧問(wèn)。同時(shí),虛擬人的應(yīng)用場(chǎng)景正在迅速擴(kuò)展,從而推動(dòng)了相關(guān)行業(yè)的創(chuàng)新和變革。

在2024年開(kāi)年,「自象限」關(guān)注到虛擬人已經(jīng)在和其他技術(shù)進(jìn)行結(jié)合。以3D虛擬人頭部廠商魔琺科技為例,在其近期迭代的產(chǎn)品“有言”中,3D虛擬人進(jìn)入了3D視頻空間,用戶可以直接利用該平臺(tái)制作3D視頻,包括腳本、虛擬人形象、AI語(yǔ)音合成、燈光布景等多維度的綜合體現(xiàn)。

這也引出了另一個(gè)發(fā)人深省的問(wèn)題,在技術(shù)發(fā)展的早期階段,企業(yè)面臨著技術(shù)驅(qū)動(dòng)與產(chǎn)品驅(qū)動(dòng)的戰(zhàn)略選擇。技術(shù)驅(qū)動(dòng)的路徑強(qiáng)調(diào)技術(shù)創(chuàng)新和突破,可能會(huì)帶來(lái)顛覆性的變革,但也存在市場(chǎng)接受度和商業(yè)化應(yīng)用的不確定性。產(chǎn)品驅(qū)動(dòng)則更注重市場(chǎng)需求和用戶體驗(yàn),通過(guò)滿足用戶的實(shí)際需求來(lái)推動(dòng)技術(shù)的商業(yè)化。這兩種策略的選擇將直接影響企業(yè)的發(fā)展軌跡和市場(chǎng)競(jìng)爭(zhēng)力。

在這個(gè)行業(yè)發(fā)展的關(guān)鍵時(shí)期,魔琺科技作為擁有3D虛擬人及全棧AIGC技術(shù)的廠商,選擇了一條產(chǎn)品驅(qū)動(dòng)的發(fā)展路徑。在《逐浪100人》的第二期,「自象限」對(duì)話魔琺科技創(chuàng)始人柴金祥,探討AIGC時(shí)代,虛擬人的邊界以及技術(shù)和產(chǎn)品的平衡。

逐浪100人丨對(duì)話魔琺科技CEO柴金祥:AI時(shí)代,虛擬人的邊界在哪?▲魔琺科技創(chuàng)始人兼CEO柴金祥 受訪者提供

有言,有話說(shuō)

自象限:先聊聊這次有言的升級(jí)吧,我們能夠感受到這是一款不一樣的產(chǎn)品,和以往的產(chǎn)品相比,這一次升級(jí)特殊在哪?

柴金祥:與傳統(tǒng)的2D視頻生成工具不同,有言具有全棧的AIGC技術(shù),能夠一鍵生成高質(zhì)量的3D視頻內(nèi)容。這意味著用戶無(wú)需繁瑣的拍攝和后期制作流程,就能夠創(chuàng)造出具有深度和真實(shí)感的視頻體驗(yàn)。我們的3D虛擬人角色庫(kù)豐富多樣,用戶可以根據(jù)需要選擇不同的角色和場(chǎng)景,實(shí)現(xiàn)個(gè)性化的視頻創(chuàng)作。

在操作方面,這次升級(jí)加強(qiáng)了內(nèi)容的可控性和編輯能力。過(guò)去,視頻創(chuàng)作者往往受限于視頻素材的可用性和編輯難度。而現(xiàn)在,有言提供了從角色動(dòng)作、表情到場(chǎng)景、燈光、聲音等全方位的編輯功能,使得創(chuàng)作者可以精準(zhǔn)控制每一個(gè)細(xì)節(jié),確保視頻內(nèi)容完全符合他們的創(chuàng)意和需求。

并且我們針對(duì)了多場(chǎng)景的應(yīng)用進(jìn)行了優(yōu)化。有言支持團(tuán)隊(duì)協(xié)作、多語(yǔ)言輸出,可以生成多語(yǔ)言視頻助力產(chǎn)品出海,這對(duì)于全球化的市場(chǎng)環(huán)境尤為重要。無(wú)論是知識(shí)分享、教育培訓(xùn)還是品牌宣傳,有言都能提供強(qiáng)大的支持。

此外,我們還關(guān)注到了3D內(nèi)容與未來(lái)技術(shù)如VR/AR的結(jié)合。有言生成的3D視頻內(nèi)容可以直接適配未來(lái)的虛擬3D世界,這意味著我們的產(chǎn)品不僅僅是為了當(dāng)前的市場(chǎng),更是為了即將到來(lái)的元宇宙時(shí)代做準(zhǔn)備。

自象限:技術(shù)上的難度體現(xiàn)在哪?相較于以往的虛擬人或者3D視頻產(chǎn)品有哪些創(chuàng)新?

柴金祥:在這個(gè)用戶使用簡(jiǎn)單的產(chǎn)品中,是很多種復(fù)合型技術(shù)形成的一個(gè)綜合型的創(chuàng)新解決方案,舉幾個(gè)例子:

三維內(nèi)容的AIGC化:傳統(tǒng)的3D內(nèi)容制作依賴于專業(yè)團(tuán)隊(duì)和復(fù)雜的軟件工具,有言實(shí)現(xiàn)了從3D虛擬人形象建模、綁定、動(dòng)作、表情的AIGC化,比如說(shuō)人肌肉手工制作的過(guò)程是非常困難的,但是我們做到了AIGC化,一個(gè)人的能力,他的表情、眼神、手勢(shì)、動(dòng)作,聲音是 AIGC。另外燈光、鏡頭也需要通過(guò)最佳實(shí)踐,比如發(fā)布會(huì)的鏡頭切換需要用專業(yè)攝影師專業(yè)的方式,其實(shí)也是三維鏡頭,燈光模擬了專業(yè)燈光師進(jìn)行調(diào)控,這些都是AIGC。

目前來(lái)說(shuō),我們把最難的部分AIGC化,少部分采用模板庫(kù)的方式,比如說(shuō)視頻包裝的片頭片尾、BGM、字幕展示、貼紙文字等,隨著數(shù)據(jù)增多會(huì)逐步實(shí)現(xiàn)從UGC到AIGC的轉(zhuǎn)化。

它的難點(diǎn)其實(shí)還是在于高質(zhì)量3D數(shù)據(jù)的缺乏,3D內(nèi)容的生成需要大量的高質(zhì)量數(shù)據(jù)作為訓(xùn)練基礎(chǔ)。魔琺科技通過(guò)多年的積累,建立了龐大的3D數(shù)據(jù)庫(kù),這些數(shù)據(jù)不僅包括角色模型,還包括動(dòng)作、表情、場(chǎng)景等,還要滿足用戶的實(shí)時(shí)渲染與編輯需求,這要求后端系統(tǒng)具備高效的渲染能力和靈活的編輯接口,技術(shù)上的挑戰(zhàn)在于如何保證渲染速度和視頻質(zhì)量的同時(shí),提供流暢的用戶體驗(yàn)。

自象限:我們認(rèn)為虛擬人正在走向虛擬人+,您怎么看,未來(lái)魔琺會(huì)探索更多+之外的邊界么?

柴金祥:其實(shí)我們真正在做的是3D 超寫實(shí)虛擬 AIGC + X, 這一趨勢(shì)意味著虛擬人技術(shù)將不再局限于單一的應(yīng)用場(chǎng)景,而是會(huì)與更多行業(yè)、領(lǐng)域和技術(shù)相結(jié)合,形成更加豐富和多元的產(chǎn)品和服務(wù)。虛擬人+的概念代表了一種開(kāi)放性和擴(kuò)展性,它不僅能夠增強(qiáng)現(xiàn)有的業(yè)務(wù)流程,還能夠創(chuàng)造全新的用戶體驗(yàn)和商業(yè)模式。

有言生成的3D視頻,如果你今天放在Vision Pro 里面, AR/VR 中看到的就是3D的景象,虛擬人可能就在站在你面前,這就是3D視頻+VR/AR的一個(gè)應(yīng)用。今天本質(zhì)上是因?yàn)槲覀冎荒茉?PC 端或移動(dòng)端看到3D視頻,因此視覺(jué)上3D場(chǎng)景與2D場(chǎng)景的感受沒(méi)有那么強(qiáng)烈。

對(duì)于未來(lái),魔琺科技將持續(xù)探索虛擬人技術(shù)的各種可能性,并推動(dòng)其在更多“+”之外的邊界的應(yīng)用。半年以后我們可能也會(huì)把內(nèi)部3D 超寫實(shí)虛擬人AIGC全棧能力做成開(kāi)放平臺(tái),就像 ChatGPT的API接口調(diào)用一樣,無(wú)論是C端、 B端都可以調(diào)用API,使用背后的技術(shù)能力。

什么是魔琺?

自象限:您不斷提到產(chǎn)品戰(zhàn)略,所以魔琺是一家產(chǎn)品公司么?

柴金祥:是的,魔琺科技是一家以3D虛擬人和AIGC為核心的AI科技公司。我們的戰(zhàn)略重點(diǎn)在于利用人工智能AIGC技術(shù),創(chuàng)造出能夠?yàn)橛脩魩?lái)實(shí)際價(jià)值的產(chǎn)品。所以你會(huì)發(fā)現(xiàn)我們從來(lái)不發(fā)Demo,我們推向市場(chǎng)時(shí)就是以產(chǎn)品的形態(tài)落地,技術(shù)有沒(méi)有用,最終要落在產(chǎn)品中,看是否能給用戶帶來(lái)價(jià)值。

我認(rèn)為不僅要關(guān)注技術(shù)的先進(jìn)性,還注重產(chǎn)品的實(shí)用性、易用性和市場(chǎng)適應(yīng)性。我覺(jué)得將復(fù)雜的技術(shù)轉(zhuǎn)化為簡(jiǎn)單、直觀且高效的用戶體驗(yàn),這個(gè)才是最重要的。無(wú)論是3D虛擬人、AIGC技術(shù)還是VR/AR集成,我們的最終目標(biāo)都是打造出能夠被廣泛接受和使用的產(chǎn)品。

其實(shí)我們產(chǎn)品戰(zhàn)略是“1 + 3”,“1”是我們底層有技術(shù)的基礎(chǔ)設(shè)施,以3D 超寫實(shí)虛擬人AIGC操作系統(tǒng)為核心,讓所有人都能夠即插即用?!?”是指有言、有靈、有光三個(gè)消費(fèi)級(jí)產(chǎn)品平臺(tái),后面會(huì)有我們的直播產(chǎn)品和有靈一對(duì)一的交互虛擬人產(chǎn)品,越來(lái)越精細(xì)化。

自象限:為什么是產(chǎn)品驅(qū)動(dòng)而不是技術(shù)驅(qū)動(dòng)?背后的邏輯是是什么?

柴金祥:技術(shù)驅(qū)動(dòng)的公司可能會(huì)面臨技術(shù)過(guò)時(shí)或市場(chǎng)需求變化的風(fēng)險(xiǎn),而產(chǎn)品驅(qū)動(dòng)的公司本質(zhì)上是以用戶需求為核心,將用戶的需求轉(zhuǎn)換實(shí)際的價(jià)值,技術(shù)在進(jìn)步,但用戶的需求和行業(yè)kown-how有跡可循。比如3D視頻制作過(guò)程中的團(tuán)隊(duì)協(xié)作能力幾乎是一個(gè)剛需能力,無(wú)論技術(shù)怎么變,這個(gè)場(chǎng)景是不會(huì)變的。

相比于Sora這樣的2D視頻生成的產(chǎn)品,首先他要用戶具備一定的技術(shù)背景,或者需要通過(guò)反復(fù)嘗試和調(diào)整輸入?yún)?shù)來(lái)生成滿意的視頻內(nèi)容,其次它不可編輯,視頻中一旦發(fā)生錯(cuò)誤是不可更改的,在內(nèi)容生成自由度方面有一定的限制,而且Sora目前還是還是以生成“作品”為主,沒(méi)有辦法在商業(yè)的場(chǎng)景中使用,也就無(wú)法變成生產(chǎn)力。

從技術(shù)的角度來(lái)看,我之前提到了3D視頻AIGC的一個(gè)技術(shù)難點(diǎn)在于高質(zhì)量數(shù)據(jù)的不足,那么我們以產(chǎn)品的形式向行業(yè)提供生產(chǎn)力工具,我們的客戶也通過(guò)有言自主生成了很多高質(zhì)量的3D視頻數(shù)據(jù)來(lái)反哺我們的模型,去解決數(shù)據(jù)源頭不足的問(wèn)題,生產(chǎn)力工具像是一個(gè)“鉤子”,以此形成飛輪效應(yīng)。

過(guò)去十年,無(wú)論是B端還是C端,ChatGPT、Canva、還是Figma,你會(huì)發(fā)現(xiàn)一旦到了產(chǎn)品和市場(chǎng)需求匹配,增長(zhǎng)就特別快,就是這個(gè)道理。

自象限:如今AIGC產(chǎn)品的核心能力還是體現(xiàn)在降本增效的方面,有哪些具體的數(shù)據(jù)可以分享?

柴金祥:首先肯定是虛擬人制作的成本會(huì)逐漸變低。我們最早的時(shí)候企業(yè)設(shè)計(jì)專屬的虛擬人形象實(shí)際成交單價(jià)都是大幾十萬(wàn),我們自己的成本肯定也要幾十萬(wàn),但是就像上面講的,我們的客戶越來(lái)越多,數(shù)據(jù)越來(lái)越豐富,技術(shù)的進(jìn)步使得內(nèi)容生產(chǎn)變得越來(lái)越簡(jiǎn)單,從PGC到UGC再到AIGC,門檻越來(lái)越低,但質(zhì)量會(huì)越來(lái)越好。

下一個(gè)版本現(xiàn)在我們把定制化的形象轉(zhuǎn)化成了虛擬人生成的產(chǎn)品,企業(yè)可以自己“捏臉”,這個(gè)成本就是很低的了。到今年下半年,當(dāng)一個(gè)普通人就能通過(guò)AIGC定制一個(gè)3D虛擬人的時(shí)候,AIGC的核心是使得內(nèi)容創(chuàng)作的邊際成本接近于零。

其次是3D視頻的制作的成本在降低,親身經(jīng)歷過(guò)動(dòng)畫行業(yè)的就知道,像有言生成的高質(zhì)量動(dòng)畫一秒鐘的成本在500塊錢左右,如今我們已經(jīng)把它AIGC化了,企業(yè)用戶通過(guò)按月付費(fèi)的方式就可以讓所有的員工使用。

舉一個(gè)頭部客戶的案例,這個(gè)集團(tuán)客戶要了100個(gè)賬號(hào),實(shí)現(xiàn)每天生產(chǎn)30多個(gè)視頻,每一個(gè)賬號(hào)背后有4個(gè)人輪換在用,兩個(gè)月不到的時(shí)間里,做了近600條視頻總計(jì)近3000分鐘,這個(gè)成本和效率在以前是絕對(duì)想象不到的。

自象限:關(guān)于魔琺商業(yè)化的部分,您剛提到從項(xiàng)目定制化轉(zhuǎn)向標(biāo)準(zhǔn)化,這中間有什么契機(jī),是如何考慮的?

柴金祥:其實(shí)從公司一成立我們就想做產(chǎn)品化,只是我們那時(shí)候能力沒(méi)有到,做 business 到 eventually,這不是一種契機(jī)反而是一種堅(jiān)持,我們的美術(shù)水平在逐漸提升、技術(shù)在提升、算法在優(yōu)化,當(dāng)技術(shù)達(dá)到一定成熟期以及公司規(guī)模到一定體量的時(shí)候,才能實(shí)現(xiàn)標(biāo)準(zhǔn)化的產(chǎn)品落地。

反過(guò)來(lái)講,當(dāng)ChatGPT剛開(kāi)始做的時(shí)候,1.0、2.0時(shí)期沒(méi)有人相信它,只有到了3.5的時(shí)候它的能力達(dá)到了,大家才會(huì)覺(jué)得“噢,這個(gè)很了不起”,就像換做十幾年前的電動(dòng)車,所有都覺(jué)得馬斯克就是個(gè)瘋子。凡事只能先做到證明可行性,才有可能落到用戶層面。

其次隨著時(shí)間的推移,我們發(fā)現(xiàn)市場(chǎng)上對(duì)于高效、低成本、易于使用的視頻制作解決方案的需求日益增長(zhǎng)??蛻舨粌H需要高質(zhì)量的定制服務(wù),還需要能夠快速響應(yīng)市場(chǎng)變化、靈活調(diào)整內(nèi)容生產(chǎn)的標(biāo)準(zhǔn)化產(chǎn)品,我認(rèn)為這是一種“雙向奔赴”,最重要的難點(diǎn)是能不能實(shí)現(xiàn)。

早期我們自己的成本無(wú)論是研發(fā)成本還是人才成本都很高,我們自己也在攻克這些問(wèn)題,但是現(xiàn)在有言最大的成本其實(shí)就是算力成本,所以我們需要更多的用戶來(lái)對(duì)算力成本進(jìn)行攤薄,用戶增長(zhǎng),我的PMF自然就能達(dá)到。

本文來(lái)自投稿,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.gptmaths.com/cgo/model/115665.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
騰訊游戲駛?cè)搿安砺房凇?/span>
上一篇 2024-04-01 10:06
下一篇 2024-04-01 12:24

增長(zhǎng)黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評(píng)論