2023-02-22
21世紀(jì)經(jīng)濟(jì)報(bào)道 | 對(duì)話A股成長(zhǎng)力
2023年開(kāi)年以來(lái),作為史上用戶(hù)增長(zhǎng)速度最快的消費(fèi)級(jí)應(yīng)用,ChatGPT引發(fā)全球市場(chǎng)關(guān)注。日前,天娛數(shù)科旗下元境科技CEO王智武,在接受21世紀(jì)經(jīng)濟(jì)報(bào)道“對(duì)話A股成長(zhǎng)力”專(zhuān)題專(zhuān)訪中,闡明了天娛數(shù)科在接入ChatGPT后進(jìn)行的嘗試,以及在AIGC時(shí)代如何抓住新機(jī)遇等問(wèn)題,以下為專(zhuān)訪實(shí)錄。
報(bào)道全文
2023年開(kāi)年以來(lái),作為史上用戶(hù)增長(zhǎng)速度最快的消費(fèi)級(jí)應(yīng)用,ChatGPT引發(fā)全球市場(chǎng)的狂歡。在業(yè)內(nèi)看來(lái),ChatGPT或?qū)⑹侨斯ぶ悄芾锍瘫?,更是分水嶺,意味著AI技術(shù)發(fā)展到臨界點(diǎn)。
資本市場(chǎng)上的ChatGPT概念股也受到廣泛關(guān)注,天娛數(shù)科(002354.SZ)便是其中之一。
記者從天娛數(shù)科方面了解到,其子公司元境科技已基于MetaSurfing-元享智能云平臺(tái)率先接入ChatGPT模型,并成為百度文心一言首批先行體驗(yàn)官,后續(xù)也將全面體驗(yàn)并接入文心一言的能力。未來(lái)公司將更加關(guān)注虛擬人與ChatGPT等模型的整合應(yīng)用,將智能對(duì)話技術(shù)成果應(yīng)用在元宇宙智能生產(chǎn)領(lǐng)域,快速擴(kuò)展到不同行業(yè)、不同場(chǎng)景。
ChatGPT、百度文心一言等大模型的出現(xiàn)能夠解決目前虛擬人存在的哪些客觀問(wèn)題?天娛數(shù)科接入ChatGPT的技術(shù)邏輯是怎樣的?在接入過(guò)程中積累了哪些獨(dú)特的經(jīng)驗(yàn)?帶著一系列問(wèn)題,近日,21世紀(jì)經(jīng)濟(jì)報(bào)道記者專(zhuān)訪了天娛數(shù)科旗下元境科技CEO王智武。
ChatGPT為虛擬人注入“靈魂”
《21世紀(jì)》:公司虛擬人接入ChatGPT的初衷是什么?
王智武:長(zhǎng)期以來(lái),我們一直在元宇宙領(lǐng)域探索。我認(rèn)為,虛擬數(shù)字人未來(lái)主要會(huì)有兩種形態(tài),一種是身份型虛擬數(shù)字人,像天妤這種虛擬偶像;還有一種是服務(wù)型虛擬數(shù)字人,大多以AI驅(qū)動(dòng),涉及AI交互、語(yǔ)音問(wèn)答、圖形圖像驅(qū)動(dòng)等等。
我們當(dāng)時(shí)接入ChatGPT、百度文心一言等大模型的初衷,就是希望元境科技不僅僅只是一家做身份型虛擬人的公司,我們也想拓展更多服務(wù)型虛擬數(shù)字人,通過(guò)整合自研能力與領(lǐng)先的智能對(duì)話技術(shù)成果,應(yīng)用在元宇宙智能生產(chǎn)領(lǐng)域,不斷提升虛擬數(shù)字人智能驅(qū)動(dòng)能力與實(shí)時(shí)交互能力。
《21世紀(jì)》:目前接入ChatGPT的接入邏輯、付費(fèi)模式是怎樣的?
王智武:ChatGPT是一個(gè)大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型,公司依托“MetaSurfing-元享智能云平臺(tái)”,通過(guò)調(diào)用ChatGPT接口,并與自身人臉建模、形象驅(qū)動(dòng)、語(yǔ)音合成、語(yǔ)音識(shí)別、語(yǔ)義理解、圖像處理等多模態(tài)智能驅(qū)動(dòng)算法進(jìn)行緊密的智能化結(jié)合,從而升級(jí)虛擬數(shù)字人語(yǔ)言理解、多輪回復(fù)等“生成式交互”能力,并以應(yīng)用場(chǎng)景為導(dǎo)向,在ChatGPT通用大模型基礎(chǔ)上,進(jìn)行調(diào)優(yōu),針對(duì)虛擬主播、跨境電商直播帶貨等垂直場(chǎng)景進(jìn)行匹配,實(shí)現(xiàn)產(chǎn)品化解決方案,致力于用AIGC推動(dòng)元宇宙進(jìn)入智能時(shí)代。
我們現(xiàn)在是用的按字符收費(fèi)的模式,比如750個(gè)字左右是0.02美分,就我們目前情況而言,其實(shí)比人工成本要低很多,更適用于我們現(xiàn)階段的情況。
《21世紀(jì)》:公司接入ChatGPT模型,在技術(shù)方面做了哪些攻關(guān)嘗試?
王智武:虛擬人多模態(tài)技術(shù)驅(qū)動(dòng)其實(shí)有很多需要打通的技術(shù)點(diǎn)。虛擬人是涵蓋形象、語(yǔ)音、表情、動(dòng)作等等的多模態(tài)技術(shù)形態(tài),涉及各種各樣的技術(shù)融合。因此,怎樣打通各種模態(tài)之間的障礙,是我們現(xiàn)在要解決的問(wèn)題。
我們接入了ChatGPT的文本技術(shù)到虛擬人身上,以文本驅(qū)動(dòng),使它可以跟我們互動(dòng)問(wèn)答。眾所周知,ChatGPT本身只具備文本編譯、對(duì)話問(wèn)答的能力,要應(yīng)用在虛擬人的身上的話,我們希望用它的文本先轉(zhuǎn)成語(yǔ)音,然后再去驅(qū)動(dòng)虛擬人的嘴型、表情、神態(tài)、情緒等等。
整體來(lái)看,每個(gè)環(huán)節(jié)都有我們很多想去打通的一些技術(shù)點(diǎn)。涉及到跟我們自己的產(chǎn)品交互,我們做了很多嘗試,試圖讓虛擬人更加智能有趣,也一直在研究多模態(tài)的方向。這一部分,我們未來(lái)還會(huì)嘗試在短視頻制作、新聞播報(bào)等方面應(yīng)用。
《21世紀(jì)》:你認(rèn)為ChatGPT的出現(xiàn)能夠解決目前虛擬人存在的哪些客觀問(wèn)題?
王智武:一兩年前大家聊到人工智能,還會(huì)戲稱(chēng)其為人工智障,覺(jué)得很多NLP的問(wèn)答對(duì)話很傻。當(dāng)然,現(xiàn)階段的很多NLP技術(shù)或者其他小模型,整個(gè)問(wèn)答系統(tǒng)的效果還是不好,尤其在ChatGPT這種大模型面前。
比較來(lái)看,ChatGPT的智能化會(huì)更高一些。它是一個(gè)非常聰明的智能體,同時(shí)也非?!皥A滑”,未來(lái)可能它的效率、準(zhǔn)確性、智能化會(huì)更高一些。
搶灘AIGC時(shí)代新機(jī)遇
《21世紀(jì)》:公司接入ChatGPT后,在實(shí)際應(yīng)用方面積累了哪些經(jīng)驗(yàn)?
王智武:其實(shí)在國(guó)內(nèi)的虛擬人應(yīng)用市場(chǎng)上,ChatGPT目前大多還在技術(shù)調(diào)試和驗(yàn)證階段,而且感覺(jué)應(yīng)該離泛娛樂(lè)方向更近一些。如果直接把它大規(guī)模應(yīng)用在直播或者其它垂類(lèi)方向,目前還是不太可行的。
因此,我們接入ChatGPT,首先要經(jīng)過(guò)ChatGPT預(yù)訓(xùn)練大模型,它提前幫我們訓(xùn)練好了一部分,其他的部分要自己訓(xùn)練和數(shù)據(jù)填入。
在ChatGPT的基礎(chǔ)之上,針對(duì)垂類(lèi)領(lǐng)域,我們可以把想問(wèn)的一些問(wèn)題讓它去學(xué)習(xí),還可以設(shè)置一些相關(guān)標(biāo)簽和引導(dǎo)詞,只要點(diǎn)擊相關(guān)標(biāo)簽,它就會(huì)順著標(biāo)簽思路往下回答,盡量做到不讓虛擬人“胡說(shuō)八道”。
雖然它是一個(gè)大模型,但是我更希望在這個(gè)基礎(chǔ)之上,把它做成特定版的小模型,我更喜歡這樣的一個(gè)應(yīng)用場(chǎng)景,因?yàn)榇竽P吞珡V泛了。我們會(huì)針對(duì)某些垂類(lèi)領(lǐng)域,推出自己的解決方案,在我們的服務(wù)器里去搭建各種小模型,而且我也相信這也是很多公司的機(jī)會(huì)。
另外,如果把ChatGPT當(dāng)做一個(gè)工具,用它去訓(xùn)練我們的NLP,我覺(jué)得也會(huì)非常好用。因?yàn)樵谛∧P皖I(lǐng)域,國(guó)內(nèi)的一些語(yǔ)料庫(kù)相對(duì)少,ChatGPT更全一些,所以我希望未來(lái)有可能讓大模型去幫我們訓(xùn)練垂類(lèi)方面的一些小模型。
接下來(lái),我們會(huì)把它應(yīng)用在一些訓(xùn)練上。比如,在直播間里面,虛擬人可以更加多元化、多角度地跟彈幕之間的用戶(hù)問(wèn)答,介紹商品等。
《21世紀(jì)》:現(xiàn)階段元境科技虛擬人的應(yīng)用場(chǎng)景主要包括哪些?
王智武:我們現(xiàn)階段已經(jīng)在Tik Tok跨境電商直播、虛擬主播直播互動(dòng)等場(chǎng)景實(shí)現(xiàn)應(yīng)用,并正在形成產(chǎn)品化解決方案。后續(xù)可能還會(huì)應(yīng)用在教育、金融、房地產(chǎn)、文旅、影視解說(shuō)、廣告創(chuàng)意、游戲、快消、汽車(chē)等方向。
《21世紀(jì)》:在ChatGPT應(yīng)用拓展方面,你還有哪些試想?
王智武:首先我能想到的是游戲。游戲前期涉及很多概念設(shè)計(jì),包括一些關(guān)卡設(shè)計(jì)、前期的創(chuàng)意策劃等等,我希望用ChatGPT輔助我去做游戲前期的腳本策劃,順著它的一些獨(dú)特的思路往下深挖;把ChatGPT技術(shù)接到游戲里面去,比如讓NPC與玩家交互問(wèn)答,那也會(huì)很有意思;ChatGPT的底層支撐技術(shù)是AIGC,AIGC技術(shù)在整個(gè)繪畫(huà)領(lǐng)域,也可以幫我們?nèi)プ鲆恍┯螒蚯捌诘母拍顖D創(chuàng)意設(shè)定,游戲宣傳海報(bào),游戲背景圖等。
其次,ChatGPT在智能客服、輔助教育、文旅導(dǎo)游等方向也會(huì)有很大的用武之地。接入ChatGPT后,這些行業(yè)未來(lái)的想象空間會(huì)非常大,接下來(lái)就看怎樣去落地實(shí)現(xiàn),或許需要去做一些更加智能的定制化產(chǎn)品,這也是我們需要把握的機(jī)會(huì)。
《21世紀(jì)》:如何評(píng)價(jià)當(dāng)前AIGC技術(shù)的有關(guān)重大突破?
王智武:現(xiàn)階段,我看到的AIGC的突破性應(yīng)用,有文本模態(tài)的ChatGPT,有繪畫(huà)的Midjourney/DALL.E2,還有圖形圖像等,都在迅速發(fā)展。另外語(yǔ)音方面突破也不錯(cuò),可以很好地訓(xùn)練和復(fù)刻真人聲音,預(yù)計(jì)很快會(huì)有一個(gè)爆發(fā)階段。
《21世紀(jì)》:你認(rèn)為AIGC技術(shù)未來(lái)的行業(yè)應(yīng)用有哪些?
王智武:現(xiàn)在生成式AI已經(jīng)發(fā)展到一定高度,我認(rèn)為也是接下來(lái)的趨勢(shì)。AIGC的應(yīng)用場(chǎng)景不斷在拓展,包括文本內(nèi)容生成,圖片生成,視頻生成,廣告內(nèi)容生成,個(gè)性化客服等,而且AIGC技術(shù)也會(huì)與其他技術(shù)結(jié)合,如虛擬現(xiàn)實(shí),增強(qiáng)現(xiàn)實(shí)等,也會(huì)給游戲,新聞,廣告等行業(yè)帶來(lái)革新機(jī)會(huì),不斷提高內(nèi)容質(zhì)量,創(chuàng)造更好的用戶(hù)體驗(yàn)。
來(lái)源:21世紀(jì)經(jīng)濟(jì)報(bào)道
作者:雷晨
編輯:巫燕玲