每日經(jīng)濟(jì)新聞 2023-03-02 14:16:37
◎互聯(lián)網(wǎng)發(fā)展可以分為三個(gè)階段,第一個(gè)階段是PC互聯(lián)網(wǎng)時(shí)代,第二個(gè)階段是移動(dòng)互聯(lián)網(wǎng)時(shí)代,第三個(gè)時(shí)代,則是元宇宙時(shí)代。成維忠認(rèn)為,元宇宙時(shí)代的關(guān)鍵詞是“Conversation”,即人機(jī)的擬人化交流?;谶@個(gè)認(rèn)知,ChatGPT等LLM不可或缺,“生成式AI虛擬人也不可或缺”。
每經(jīng)記者 陳婷 海報(bào)設(shè)計(jì) 蔡沛君 每經(jīng)編輯 劉雪梅
■行業(yè)屬性:虛擬數(shù)字人
■估值/融資輪次:2021年11月,中科深智獲得晨山資本約千萬(wàn)美元B輪融資。
■核心競(jìng)爭(zhēng)力:自主研發(fā)CLAP算法;多模態(tài)驅(qū)動(dòng)技術(shù);3D AIGC產(chǎn)品
■未來(lái)關(guān)鍵詞:元宇宙時(shí)代;AGI;AIGC
2月25日,OpenAI CEO薩姆·阿爾特曼又一次公開提到了AGI(通用人工智能)。
在他發(fā)表的文章中,這位當(dāng)下全球的焦點(diǎn)人物強(qiáng)調(diào)了OpenAI的使命是確保AGI造福全人類,他認(rèn)為,AGI如果被成功創(chuàng)造出來(lái),可通過(guò)增加豐富度、推動(dòng)全球經(jīng)濟(jì)發(fā)展以及幫助發(fā)現(xiàn)改變可能性極限的新科學(xué)知識(shí),幫助提升人類。
ChatGPT,這一近期引爆全球關(guān)注的“新物種”,是由Open AI于2022年11月30日推向世界的,也就是說(shuō),薩姆·阿爾特曼可被稱作“ChatGPT之父”,與此同時(shí),他也是AGI的推崇者和踐行者。
在人工智能這條通往未來(lái)之路上,耕耘的人千千萬(wàn)萬(wàn),中科深智創(chuàng)始人兼CEO成維忠便是其中一員。與薩姆·阿爾特曼以及他所開創(chuàng)的Open AI相比,成維忠以及他所創(chuàng)立的中科深智選擇了一條更具差異化的競(jìng)爭(zhēng)路線。
成維忠本科畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué)物理系半導(dǎo)體專業(yè),研究生畢業(yè)于復(fù)旦大學(xué)世界經(jīng)濟(jì)研究所,曾在中興通訊、光明乳業(yè)、北緯科技等上市公司任職。作為創(chuàng)業(yè)老兵,2016年,他又創(chuàng)建了中科深智,創(chuàng)始團(tuán)隊(duì)沒有選擇Open AI的大語(yǔ)言模型方向,而是選擇了虛擬人動(dòng)作和表情的生成技術(shù)這一較為小眾的切入點(diǎn)。
究其原因,在接受《每日經(jīng)濟(jì)新聞》“對(duì)話未來(lái)商業(yè)”欄目(點(diǎn)擊直達(dá)專題:對(duì)話未來(lái)商業(yè)|記錄、預(yù)見、讓未來(lái)發(fā)生)專訪時(shí),成維忠向記者透露,ChatGPT突破的大語(yǔ)言模型被業(yè)內(nèi)視為AGI的“圣杯”,是大廠必定涉足的戰(zhàn)場(chǎng);中科深智的創(chuàng)業(yè)團(tuán)隊(duì)審時(shí)度勢(shì),堅(jiān)定了作為一家創(chuàng)業(yè)公司應(yīng)避其鋒芒的自身站位。
與Open AI路徑不同,但與薩姆·阿爾特曼對(duì)AGI的狂熱相似的是,在接受記者采訪時(shí),成維忠不止一次提到了“信仰”二字,而他的信仰便是“技術(shù)”本身。
“對(duì)于我們這些做技術(shù)的公司來(lái)說(shuō),如果只是為了贏利,卻不能發(fā)自內(nèi)心地把技術(shù)做好,公司可能會(huì)很快死亡。”成維忠說(shuō)。
但眼下,推出僅兩個(gè)月便俘獲全球1億用戶的ChatGPT,已引發(fā)了外界對(duì)于“元宇宙時(shí)代是否能真正到來(lái)”的質(zhì)疑,乃至對(duì)虛擬人前景的擔(dān)憂。
ChatGPT引爆全球關(guān)注 每經(jīng)記者 劉雪梅 攝
對(duì)此,成維忠表示,ChatGPT能夠提高虛擬人的智力,“但虛擬人的表情動(dòng)作還是需要我們用其他大模型來(lái)解決。”在成維忠看來(lái),元宇宙和ChatGPT不是替代關(guān)系,元宇宙是下一代互聯(lián)網(wǎng)的代名詞,是一個(gè)更大范疇的概念,“除非有一天我們證實(shí)了下一代互聯(lián)網(wǎng)不是以3D視覺、沉浸式環(huán)境為主的,那么元宇宙的概念就沒有被推翻。”
他表示,ChatGPT之所以能一炮而紅,并不僅僅是因?yàn)榧夹g(shù)上取得的成果,而是因?yàn)镃hatGPT的出現(xiàn)預(yù)示著下一代互聯(lián)網(wǎng)整個(gè)交互方式的改變。
成維忠認(rèn)為,互聯(lián)網(wǎng)發(fā)展可以分為三個(gè)階段,第一個(gè)階段是PC互聯(lián)網(wǎng)時(shí)代,第二個(gè)階段是移動(dòng)互聯(lián)網(wǎng)時(shí)代,第三個(gè)時(shí)代,則是元宇宙時(shí)代。他認(rèn)為,元宇宙時(shí)代的關(guān)鍵詞是“Conversation”,即人機(jī)的擬人化交流。基于這個(gè)認(rèn)知,ChatGPT等LLM不可或缺,“生成式AI虛擬人也不可或缺”。
帶領(lǐng)中科深智走到現(xiàn)在,成維忠多少有點(diǎn)“賭”的成分。
“2015年,我和創(chuàng)始團(tuán)隊(duì)就在討論,如果再創(chuàng)業(yè),我們是順著原來(lái)移動(dòng)互聯(lián)網(wǎng)的方向走,還是找新方向。”成維忠回憶。
當(dāng)時(shí),移動(dòng)互聯(lián)網(wǎng)創(chuàng)新的機(jī)會(huì)點(diǎn)已經(jīng)越來(lái)越少,成維忠和創(chuàng)業(yè)伙伴們將眼光投向了下一代互聯(lián)網(wǎng)。當(dāng)時(shí)還沒有完整概念的元宇宙,成為他們押注的未來(lái)。
“我們當(dāng)時(shí)在想,下一代互聯(lián)網(wǎng),無(wú)非要么做場(chǎng)景的技術(shù),要么做物品的技術(shù),要么做人的技術(shù)——我們覺得人的技術(shù)更重要。”成維忠說(shuō)。基于這些考量,起步時(shí),成維忠就給中科深智下了這么一個(gè)定位:圍繞虛擬人動(dòng)作和表情的生成技術(shù),為各行各業(yè)提供以軟件和算法為主驅(qū)動(dòng)的內(nèi)容生產(chǎn)工具。
當(dāng)記者問及為何不選擇大語(yǔ)言模型賽道時(shí),成維忠說(shuō):“我覺得如果大廠一進(jìn)來(lái),肯定會(huì)把我們‘滅掉’。”
中科深智創(chuàng)立于2016年,那是一個(gè)人工智能方興未艾的年份。不到一年前,2015年12月,Open AI誕生,在成立時(shí)的定位是一家非營(yíng)利機(jī)構(gòu),由阿爾特曼、特斯拉創(chuàng)始人馬斯克、PayPal聯(lián)合創(chuàng)始人蒂爾等硅谷科技大佬參與創(chuàng)立,承諾投資10億美元。
“成立的時(shí)候,Open AI起的調(diào)子就挺高的,當(dāng)然不像現(xiàn)在這樣全世界都知道,但我們(業(yè)內(nèi))那時(shí)候都知道。”成維忠回憶,當(dāng)時(shí),Open AI計(jì)劃做開源的大語(yǔ)言模型,“雖然那時(shí)Open AI的方向沒有現(xiàn)在這么清晰,因?yàn)樗F(xiàn)在用的底層技術(shù)是2017年谷歌才發(fā)布的。”
即便如今大名鼎鼎的Open AI,當(dāng)時(shí)也不過(guò)是初出茅廬的狀態(tài),但包括成維忠在內(nèi)的業(yè)內(nèi)人士已經(jīng)意識(shí)到,具備強(qiáng)勁資金基礎(chǔ)的大廠遲早會(huì)將大語(yǔ)音模型作為重心。
之所以如此確信,與大語(yǔ)言模型的特殊性有關(guān)。成維忠透露,一直以來(lái),ChatGPT所取得突破的大語(yǔ)言模型被業(yè)內(nèi)視為AGI的“圣杯”。
“人類資料中,最全面的信息便是語(yǔ)言的信息,樣本量是最大的,知識(shí)體系是最豐富的,做訓(xùn)練就會(huì)比較容易。”在此基礎(chǔ)上,不少美國(guó)專家有一個(gè)基本觀點(diǎn):用數(shù)學(xué)的角度來(lái)看,人類的大腦和語(yǔ)言的數(shù)學(xué)結(jié)構(gòu)相近(隱馬爾可夫模型),如果這個(gè)假設(shè)成立的話,通過(guò)語(yǔ)言的不停迭代訓(xùn)練,在取得了大的突破以后,AGI便實(shí)現(xiàn)了。
雖然打定了主意不做大語(yǔ)言模型,中科深智一開始還是走了一段試錯(cuò)之路。
“早期,可選擇可嘗試的過(guò)程很多,一直到2017年谷歌推出Transformer,我們找到了方向,慢慢道路就清晰了。”成維忠提到,ChatGPT的底層技術(shù)也是Transformer,“當(dāng)時(shí),谷歌基于Transformer做了很多demo,我們也很興奮,慢慢就把精力聚焦到這個(gè)方向上。”
無(wú)論Open AI,還是中深科智,將技術(shù)重心壓到Transformer上,都冒了非常大風(fēng)險(xiǎn)。
由于早期一直專注在底層技術(shù)的研發(fā),沒有做太多商業(yè)化的事情,所以中科深智早期的研發(fā)費(fèi)用都是由團(tuán)隊(duì)自掏腰包籌集的。2019年,公司推出第一代較為成熟的產(chǎn)品,情況才有所改善。2020年,在創(chuàng)立四年之后,中科深智終于獲得千萬(wàn)級(jí)天使輪融資。
下一個(gè)轉(zhuǎn)折點(diǎn)發(fā)生在2021年。企查查顯示,這一年年初,中科深智獲得著名投資機(jī)構(gòu)金沙江創(chuàng)投領(lǐng)投的數(shù)千萬(wàn)人民幣A輪融資。2021年11月,中科深智又獲得了晨山資本約千萬(wàn)美元的B輪融資。
也正是在這一年,成維忠覺得自己“賭對(duì)了”。
“從整個(gè)發(fā)展趨勢(shì)來(lái)看,這個(gè)方向真的被我們押中了,我們感覺自己做得越來(lái)越對(duì)了。”成維忠說(shuō)。
金沙江創(chuàng)投在官宣關(guān)于中科深智的融資消息時(shí),時(shí)任金沙江創(chuàng)投主管合伙人的朱嘯虎表示:“未來(lái)將會(huì)是消費(fèi)互聯(lián)網(wǎng)與企業(yè)服務(wù)并重的10年,我們持續(xù)看好用各類新技術(shù)為消費(fèi)大場(chǎng)景B端賦能的初創(chuàng)企業(yè)。”
獲得明星投資人的青睞固然是好事,但作為技術(shù)出身的一名創(chuàng)業(yè)者,成維忠始終還有一種“壯志未酬”之感,他希望資本能夠看到中科深智更多的技術(shù)價(jià)值。
成維忠說(shuō),“投資人對(duì)我們有信心,是因?yàn)樗麄冇X得我們?cè)谔摂M人領(lǐng)域的確是一家領(lǐng)頭的公司——一方面是我們做得早,另一方面我們也很聚焦。”
成維忠表示,國(guó)內(nèi)投資人更看重具體的產(chǎn)品落地,關(guān)注核心業(yè)務(wù)在市場(chǎng)上的表現(xiàn)和應(yīng)用前景,“和他們講一些特別‘飄’的事,他們不大感興趣。”
這或許也是中科深智較晚才獲得第一筆融資的原因。
成維忠回憶:“在那個(gè)時(shí)間點(diǎn),我們覺得最痛苦的事就是,雖然我們認(rèn)為這個(gè)方向很重要,但在和VC對(duì)話的時(shí)候,我們很難講清楚具體的實(shí)現(xiàn)路徑——我們認(rèn)為路是能走通的,但具體該基于什么大模型來(lái)做,有很多種可能性和不確定性。”他清楚地記得,當(dāng)時(shí)有投資人對(duì)他說(shuō):“既然你們覺得很重要,你們自己先砸錢再說(shuō)。”
因此,公司創(chuàng)始團(tuán)隊(duì)在早期,都是自掏腰包支撐公司的發(fā)展。
交談過(guò)程中,Open AI在美元資本助推下的崛起之路也讓成維忠感慨。在他看來(lái),國(guó)內(nèi)的資本市場(chǎng)邏輯和環(huán)境,更注重快速和短期的回報(bào),會(huì)給在垂直領(lǐng)域推進(jìn)生成式AI技術(shù)研發(fā)的企業(yè)帶來(lái)壓力。
守得云開見月明,獲得明星資本押注也算是階段性成功。在平衡資本的現(xiàn)實(shí)訴求和己身的技術(shù)理想的追求之間,中科深智已經(jīng)走出了一條獨(dú)有的發(fā)展路線。
成維忠向記者介紹,中科深智定位為生成式AI虛擬人和3D AIGC技術(shù)公司,發(fā)展到現(xiàn)在,主要為三個(gè)部分。
第一個(gè)部分是底層算法,用成維忠的話來(lái)說(shuō),是“自己覺得很寶貝的事”。據(jù)悉,中科深智的底層算法為自主研發(fā)的CLAP算法,即Contrastive Language-Action Pretraining算法。
第二個(gè)部分是虛擬人業(yè)務(wù)中臺(tái)Motionverse,資料顯示,這是一個(gè)多模態(tài)動(dòng)作生成驅(qū)動(dòng)引擎,該引擎融合了XR和AI技術(shù),可以用傳感器、語(yǔ)音、視頻等多種方式讓虛擬人動(dòng)起來(lái),隨時(shí)與用戶互動(dòng)。成維忠將這部分定義為“外界覺得很重要,公司內(nèi)部也覺得很重要”的部分。
第三個(gè)部分即3D AIGC產(chǎn)品。這一部分,在成維忠看來(lái),是投資人更為看重的部分。
產(chǎn)品方面,以單個(gè)產(chǎn)品為例,針對(duì)市場(chǎng)需求,中科深智推出了“自動(dòng)播”虛擬直播產(chǎn)品,讓虛擬主播們?nèi)隉o(wú)休地滾動(dòng)直播。據(jù)中科深智提供的數(shù)據(jù),其虛擬主播產(chǎn)品已經(jīng)服務(wù)了超過(guò)2000家客戶,占據(jù)主流電商平臺(tái)虛擬主播近70%的份額。
“整個(gè)市場(chǎng)是不停變化的,今年一個(gè)產(chǎn)品很好,三年以后還火不火很難確定。但是算法方向是一旦走順了就會(huì)越來(lái)越順。所以我們認(rèn)為底層的東西會(huì)更重要一些。”成維忠說(shuō)。
知止而后定,說(shuō)到業(yè)務(wù)范圍,中科深智保持謹(jǐn)慎,“脫離開技術(shù)的事,比如說(shuō)打造IP,都不是我們的業(yè)務(wù)范圍。”成維忠說(shuō)。
事實(shí)上,成維忠認(rèn)為,一家技術(shù)主導(dǎo)的公司在推出產(chǎn)品的時(shí)間點(diǎn)上需要多方考量。
“為什么ChatGPT火成這樣了,Open AI還是沒有推出產(chǎn)品?”成維忠分析,“一方面,是Open AI的團(tuán)隊(duì)認(rèn)為算法是不夠成熟的,在這種情況下,大量地推出產(chǎn)品可能會(huì)令用戶感到反感。另一方面,在一家公司不考慮營(yíng)收和產(chǎn)品的時(shí)候,這家公司就可以all in到算法的迭代中,算法的迭代必然會(huì)比較快。”
成維忠認(rèn)為,如果一家公司算法的迭代還沒到一個(gè)理想狀態(tài)就下場(chǎng)做產(chǎn)品和服務(wù)解決方案,“這自然會(huì)難受一些。”
伴隨著ChatGPT的一炮而紅,不少質(zhì)疑聲襲向了虛擬人乃至元宇宙賽道。甚至有觀點(diǎn)認(rèn)為,隨著ChatGPT成為焦點(diǎn),虛擬人乃至背后的元宇宙,都會(huì)成為“明日黃花”。
成維忠顯然不認(rèn)同這一觀點(diǎn)。在他看來(lái),ChatGPT的出現(xiàn)加速了元宇宙新時(shí)代的到來(lái),未來(lái),會(huì)出現(xiàn)超級(jí)虛擬人助手擔(dān)當(dāng)“元宇宙時(shí)代的入口”這一角色。
“我們過(guò)去互聯(lián)網(wǎng)的交互方式是菜單式的,菜單式的交互方式是科技發(fā)展的結(jié)果,與我們?nèi)说谋灸懿罹嗍欠浅4蟮摹?rdquo;成維忠說(shuō),“人類本能交流方式是通過(guò)聲音交流,或者面對(duì)面交流。”
在他看來(lái),ChatGPT提供了新的可能性:“現(xiàn)下,ChatGPT提供的是文本的會(huì)話,之后也可以通過(guò)聲音進(jìn)行交流,在對(duì)于未來(lái)的進(jìn)一步想象中,對(duì)面也可以是一個(gè)虛擬人,我們和虛擬人進(jìn)行溝通。”
也就是說(shuō),在成維忠預(yù)想的未來(lái)中,當(dāng)前人們習(xí)慣的文本會(huì)話,很快會(huì)變成聲音的會(huì)話,并最終演變?yōu)槁曇艏右曈X的多媒體會(huì)話。也正是因此,成維忠認(rèn)為,作為新時(shí)代的入口,虛擬人在未來(lái)世界中的地位不可撼動(dòng)。
這一切的前提,是虛擬人技術(shù)的進(jìn)一步成熟。值得一提的是,雖說(shuō)業(yè)內(nèi)大都認(rèn)為ChatGPT能夠提高虛擬人的智力,并賦予虛擬人以“靈魂”,單就技術(shù)層面而言,距離一個(gè)理想中的虛擬人真正到來(lái)還有一段路要走。
成維忠提到,ChatGPT并不能解決虛擬人人機(jī)交互的所有問題,如果想要一個(gè)虛擬人笑起來(lái)、像人一樣走路,就需要中科深智這樣做虛擬人動(dòng)作表情驅(qū)動(dòng)的大模型算法。“從技術(shù)的角度來(lái)說(shuō),雖說(shuō)ChatGPT會(huì)極大提升虛擬人的智力,但是它并不能讓虛擬人跟人的交互變得更為流暢、更為生動(dòng)。”成維忠說(shuō)。
這條路要走通,資本的支持必不可少。ChatGPT帶動(dòng)的這場(chǎng)“狂飆”,能否給中科深智的發(fā)展帶來(lái)更多機(jī)會(huì)?資本們的態(tài)度會(huì)不會(huì)發(fā)生新的轉(zhuǎn)變?
“我不確定。”成維忠很快回答。在他看來(lái),當(dāng)下外界的關(guān)注度更多集中在大語(yǔ)言模型上,未來(lái)一個(gè)明顯的轉(zhuǎn)折點(diǎn)可能會(huì)發(fā)生在GPT4問世之后,“GPT4的側(cè)重點(diǎn)可能會(huì)從語(yǔ)言大模型到多模態(tài)學(xué)習(xí)上,等到那一天,VC可能會(huì)覺得針對(duì)垂直行業(yè)的多模態(tài)訓(xùn)練才是未來(lái)比較誘人的方向。我堅(jiān)信這一時(shí)間點(diǎn)會(huì)到來(lái)。”
而多模態(tài)訓(xùn)練正是中科深智的擅長(zhǎng)領(lǐng)域,通過(guò)多模態(tài)驅(qū)動(dòng)技術(shù),中科深智讓虛擬人更有活力地與人交互。
成維忠向記者表示,所謂的多模態(tài)訓(xùn)練,是當(dāng)人輸入一個(gè)文本信息到虛擬人時(shí),ChatGPT可以將這個(gè)文本處理成虛擬人可以理解的語(yǔ)言,但在之后的階段,虛擬人具體如何動(dòng)作,便與ChatGPT這一語(yǔ)言模態(tài)無(wú)關(guān)了,需要更多模態(tài)的參與。
當(dāng)前階段,ChatGPT的出現(xiàn)已給中科深智在一級(jí)市場(chǎng)帶來(lái)了一定利好。至少,成維忠感覺到,當(dāng)他跟別人談起中科深智到底是做什么的,聽得懂的人越來(lái)越多了。
在他的預(yù)判中,虛擬人的發(fā)展會(huì)比元宇宙快一步,“虛擬人技術(shù)雖然是元宇宙原生技術(shù)的一部分,虛擬人本身也是一個(gè)交互工具,解決了交互問題,對(duì)互聯(lián)網(wǎng)的交互升級(jí)會(huì)起到關(guān)鍵作用。”
他認(rèn)為,在元宇宙真正到來(lái)之前,未來(lái)3到5年內(nèi),只要有屏幕有網(wǎng)絡(luò)的地方,便會(huì)有虛擬人的身影。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP