每日經(jīng)濟(jì)新聞 2024-08-12 16:14:06
◎2023年,很多人找到第四范式董事長戴文淵,問他:“ChatGPT會怎么幫助到我的企業(yè)?”上一次他被問及類似的問題是在2016年,那時,問句的主語是AlphaGO。
◎“要把AI做好,就先不要談AI的問題,先談?wù)劰臼亲鍪裁吹?,把這些問題談清楚,咱們再回頭看看AI是不是可以(對公司)有幫助。”戴文淵如此覺得。
每經(jīng)記者 可楊 每經(jīng)編輯 張海妮
一部由史蒂文·斯皮爾伯格(Steven Spielberg)執(zhí)導(dǎo)的電影《人工智能》,講述的是一個小男孩最終發(fā)現(xiàn)自己是人工智能的故事。
人工智能什么時候才能達(dá)到這樣的水平?難道人工智能的作用就是制造一個類人智能體嗎?這是第四范式創(chuàng)始人、董事長戴文淵投身人工智能產(chǎn)業(yè)早期最令他迷惑的兩個問題。
最終,他在圖靈獎獲得者詹姆斯·尼古拉·格雷(James Nicholas Gray,昵稱Jim Gray)2007年《科學(xué)發(fā)展的四個范式》的演講中找到答案。其中,第四范式階段是指數(shù)據(jù)科學(xué)——隨著數(shù)據(jù)爆發(fā)式增長以及技術(shù)演進(jìn),科學(xué)理論由計算機(jī)從海量數(shù)據(jù)中發(fā)現(xiàn)。
戴文淵所創(chuàng)立的人工智能公司“第四范式”的名字也由此而來。這家成立于2014年的企業(yè)級人工智能平臺企業(yè),迎著人工智能的潮起與潮落成長至今,作為掌舵者,戴文淵向《每日經(jīng)濟(jì)新聞》記者分享的心得是,不要太在乎AI(人工智能)是不是能做所有事,或者不能做所有事,因?yàn)檫@對于市場來說也不重要,客戶關(guān)心的問題是:“我是賣雞翅的,AI能做的所有的事情,跟我有什么關(guān)系?重要的是我的雞翅能不能(通過AI)賣得更好。”
大模型時代,第四范式主張對模型進(jìn)行“剪裁”,以求用最“經(jīng)濟(jì)”的方式做領(lǐng)先的AI。在戴文淵眼中,通用大模型和行業(yè)大模型是實(shí)現(xiàn)AGI的不同路徑,區(qū)別在于是用一個模型去實(shí)現(xiàn)AGI,還是用很多模型去實(shí)現(xiàn)AGI。而兩相比較之下,行業(yè)大模型是他認(rèn)為最“經(jīng)濟(jì)”的方式。
新的熱浪翻涌在第四范式成立的第十年,這也促使戴文淵作出了一些改變。
2023年,很多人找到戴文淵,問他:“ChatGPT會怎么幫助到我的企業(yè)?”上一次他被問及類似的問題是在2016年,那時,問句的主語是AlphaGO。
更有趣的是,這一次,幾乎所有的客戶、投資人、媒體記者都在使用“技術(shù)的語言”來提問,“參數(shù)”成為高頻詞,與之前的狀況大不相同。
戴文淵說:“要把AI做好,就先不要談AI的問題,先談?wù)劰臼亲鍪裁吹?,把這些問題談清楚,咱們再回頭看看AI是不是可以(對公司)有幫助。”
市場和客戶都對新技術(shù)感到興奮時,戴文淵希望能借此機(jī)會引導(dǎo)一個正確的“AI價值觀”:“不能先把參數(shù)做到一千億,再想這千億的參數(shù)到底能干什么?”
市場期望AI解決所有的問題,這反映了一種恐慌心理:萬一AI能做但是自己沒有用到,那可能會失去一些機(jī)會。戴文淵將此視為一個機(jī)遇,“擔(dān)憂”打開了世人想要了解AI的窗子,但誤解也同熱潮一同翻涌,第四范式要做的,是把AI的價值帶到眾人面前。
ChatGPT,這個目前最火爆的大模型應(yīng)用,將大模型帶到了人工智能圈層以外的世界,熱浪之下,一些人對于大模型的理解或許是:和ChatGPT一樣的技術(shù)。
直至今天,市場中最受關(guān)注的大模型依舊是以大語言模型為主,即“預(yù)測下一個字”的模型,年初爆火的Sora則是“預(yù)測下一幀畫面”的模型。
但應(yīng)用是更加實(shí)際的事,對于絕大多數(shù)企業(yè)而言,“預(yù)測下一個字”解決不了核心問題。例如,金融機(jī)構(gòu)需要解決風(fēng)控問題,但這不是語言問題;大語言模型可能會輔助金融機(jī)構(gòu)解決客服事宜,但這可能不是它的核心問題。真正的行業(yè)大模型應(yīng)當(dāng)是針對不同場景,構(gòu)建不同模態(tài),去預(yù)測下一個“事情”。
這背后有一個更大的誤解——很多人問,能不能基于開源大模型底座或GPT,訓(xùn)練行業(yè)需要的新模態(tài)模型。但即使同樣出自O(shè)penAI之手,要在GPT模型上直接精調(diào)出Sora,也是不可能的事情。
戴文淵介紹,大多數(shù)行業(yè)大模型是要基于特定業(yè)務(wù)所積累的特定模態(tài)的數(shù)據(jù),訓(xùn)練出一個基座大模型,就像目前訓(xùn)練底座的大語言模型、視頻模型一樣。
其實(shí),行業(yè)大模型這件事,其實(shí)已經(jīng)發(fā)生了十年之久。2014年,第四范式推出人工智能平臺——先知1.0,用建模型的方式,挖掘業(yè)務(wù)數(shù)據(jù)價值,提升業(yè)務(wù)效果。如今“先知”已經(jīng)迭代到了5.0版本,定位于降門檻,讓企業(yè)自行構(gòu)建高價值場景所需的行業(yè)大模型,例如預(yù)測疾病風(fēng)險、欺詐行為、災(zāi)害險情、設(shè)備故障等,打破大語言模型只能生成文字、圖像、視頻的局限。
1956年夏天,在達(dá)特茅斯學(xué)院舉辦了一場人工智能研討會,主題研究“讓機(jī)器能像人那樣認(rèn)知、思考和學(xué)習(xí),即用計算機(jī)模擬人的智能”的科學(xué)。
這次會議被普遍視為人工智能技術(shù)的起點(diǎn),由此出發(fā),人工智能開始沿著一條波浪式的曲線前進(jìn),經(jīng)歷著巨大的潮起與潮落,穿梭在失望與希望之間。
兩到三年,戴文淵認(rèn)為這是市場能給一場技術(shù)熱潮的最大耐心。
距離我們最近的一次潮起被認(rèn)為來自2016年,基于強(qiáng)化學(xué)習(xí)算法的AlphaGo戰(zhàn)勝人類圍棋選手李世石,“機(jī)器是否會代替人類”在彼時引發(fā)市場關(guān)注,商湯科技、曠視科技等一批人工智能“獨(dú)角獸”站到臺前。
第四范式是一家幸運(yùn)的公司,這家公司誕生于2014年,從誕生的第一天就開始做企業(yè)端的生意。不過那時候,很多企業(yè)告訴戴文淵,自己沒有人工智能預(yù)算。隨著AlphaGO成為那枚投向平靜水面的石子,突然之間,所有的客戶都找來問他:“你們是人工智能企業(yè),你來給我講一講AlphaGO可以幫我做什么?”“我們有預(yù)算,我們要AlphaGO。”
兩三年的時間,人們理想中的人工智能工具沒有誕生,市場信心在2019年崩盤。據(jù)獵豹全球智庫數(shù)據(jù),與2018年相比,2019年中國人工智能企業(yè)的融資金額由1484.53億元下降至967.27億元,下降幅度達(dá)到34.8%,融資數(shù)量也由737個下降至431個,下降幅度達(dá)四成。
直到ChatGPT成為下一顆石子,這場“寒冬”結(jié)束,AI市場再度迎來熱潮。
戴文淵認(rèn)為,在2023年以前,市場對AI是信心問題;從2023年開始,不再是信心問題,而是要找到正確路徑的問題。“不用擔(dān)心客戶認(rèn)為AI沒有用,需要解決的是,引導(dǎo)客戶反過來想業(yè)務(wù)的問題。”戴文淵說。
潮起潮落,似乎已經(jīng)成為人工智能行業(yè)的常態(tài)。潮為什么落,戴文淵認(rèn)為和“價值”相關(guān)。2016年,每家企業(yè)都陷入“怎么去用AlphaGO幫助到我”的問題中,這個潮落了。今天也一樣,如果每家企業(yè)想的都是“怎么用ChatGPT幫助到我”,可能這個潮也會落。
戴文淵判斷,兩三年內(nèi),如果大模型不能創(chuàng)造巨大價值,可能就會再度潮落,等待下一顆“石子”——或許是一個新的能夠吸引眼球的東西,或許是能夠在合理的投入產(chǎn)出中創(chuàng)造出足夠價值的技術(shù)。
當(dāng)下的機(jī)遇是市場的目光重新被吸引,但挑戰(zhàn)同樣在于,兩到三年內(nèi)能否兌現(xiàn)大模型的價值?
市場關(guān)注到人工智能“+”,戴文淵認(rèn)為這個加號非常重要,這意味著,未來的兩到三年,人工智能有可能可以去創(chuàng)造很大的價值,如果大家想的都是ChatGPT能不能幫到企業(yè),可能不見得能創(chuàng)造市場預(yù)期的價值。
“以語言模型而言,去年主要的落地場景都與客服相關(guān),如果在這么大的關(guān)注度之下,落地的應(yīng)用全是問答類場景,可能兩三年以后大家就失望了。”他說。
目前來看,大模型賦能行業(yè),依舊是一個充滿前景的故事。每個行業(yè)都有人在做貢獻(xiàn),有人在的地方,AI就有發(fā)揮作用的機(jī)會——理論上不存在大模型無法賦能的行業(yè),人效上可以充分發(fā)揮想象力。
目前,絕大多數(shù)企業(yè)的核心業(yè)務(wù)都由人來作決策,但人作決策時往往面臨兩個困境:水平參差不齊、精力有限。當(dāng)AI能力提升,哪怕其能力尚未全面超越人類,即便僅達(dá)到人類的平均水平,但如果能復(fù)制很多“人”,就很有可能提供更好的業(yè)務(wù)價值。
企業(yè)招聘員工時,并非需要每個員工都達(dá)到頂尖水平,而是注重每個員工是否能為企業(yè)帶來積極的貢獻(xiàn)。因此,戴文淵認(rèn)為,盡管第四范式的目標(biāo)是使得AI的表現(xiàn)超越絕大多數(shù)業(yè)務(wù)專家,但從實(shí)踐角度來看,AI即使僅僅達(dá)到專家平均的能力水平,也有可能為企業(yè)帶來顯著的價值提升。
從數(shù)字化時代開啟到數(shù)智化時代來臨,賦能傳統(tǒng)企業(yè)與實(shí)體經(jīng)濟(jì)始終是市場對技術(shù)的期待。隨著大模型來臨,數(shù)字技術(shù)從傳統(tǒng)的信息搜集、傳輸、整理、儲存,逐漸走到輔助決策甚至替代決策階段。
戴文淵指出,一些企業(yè)當(dāng)前在使用AI時,依舊存在數(shù)字化時代的慣性思維,即過于依賴同行業(yè)的成功案例,試圖直接移植成熟方案落地到本企業(yè)。但實(shí)際上AI和企業(yè)核心競爭力相關(guān)以后,不同企業(yè)的目標(biāo)是不一樣的。
這背后的根本原因在于,數(shù)字化時代,技術(shù)解決的不是核心業(yè)務(wù)問題,而是通過提升邊緣問題的效率,進(jìn)而讓整個企業(yè)的效率提升,但是核心問題仍然是人在解決。進(jìn)入AI時代,核心問題將交由機(jī)器學(xué)習(xí),所以每家企業(yè)所定位的核心競爭力也不同,無法完全復(fù)制。
理想狀態(tài)下,大模型應(yīng)該能夠幫助企業(yè)完成核心決策。為此,第四范式將企業(yè)的戰(zhàn)略目標(biāo)轉(zhuǎn)化為計算機(jī)可以記錄和跟蹤的語言,即企業(yè)的“北極星指標(biāo)”,以此作為企業(yè)最核心的關(guān)鍵指標(biāo)。
戴文淵認(rèn)為,對于企業(yè)而言,在使用AI前,需要先想明白一點(diǎn):對于提升“北極星指標(biāo)”,什么叫好,什么叫不好。以實(shí)體零售企業(yè)為例,其核心效率體現(xiàn)在每平方米所貢獻(xiàn)的效益上,這可能就是一家零售企業(yè)的“北極星指標(biāo)”。所有圍繞這一指標(biāo)的改進(jìn),都需要量化其對“北極星指標(biāo)”的實(shí)際影響,無論是提升還是下降。
戴文淵強(qiáng)調(diào),企業(yè)的“北極星指標(biāo)”永遠(yuǎn)是正確目標(biāo)的近似。因?yàn)榉较蚩倳l(fā)生偏移,需要及時調(diào)整后又前進(jìn)。而定位的調(diào)整,需要企業(yè)的核心決策者來完成。他認(rèn)為,企業(yè)有效使用大模型的核心是,一定要變成企業(yè)的“一把手”工程,因?yàn)?ldquo;一把手”需要告訴AI什么是對的,什么是好的,否則轉(zhuǎn)型很難成功——在人工智能的世界里,0和1是確定的。
而在實(shí)踐中,AI的應(yīng)用并不意味著每一步都能帶來提升。
“AI其實(shí)是一個實(shí)驗(yàn)的過程。”戴文淵舉例,假設(shè)有一百萬的客戶基礎(chǔ),可能將九十萬作為基線,剩余的十萬,每一萬作為一個實(shí)驗(yàn)組,持續(xù)嘗試模型的優(yōu)化與迭代。“早期的實(shí)驗(yàn)基本上是成功的,每次實(shí)驗(yàn)都會比九十萬更好。但是到了一定階段絕大多數(shù)的實(shí)驗(yàn)都是失敗的,也沒有關(guān)系,往往到了一定的規(guī)模體量以后,一百次體驗(yàn)如果能成功一次,就能賺回前面九十九次失敗的所有成本。”戴文淵說。
AI是一個實(shí)驗(yàn)的過程,這是戴文淵的認(rèn)知,但尚未在客戶中達(dá)成共識。
客戶的認(rèn)知提升是AI產(chǎn)業(yè)發(fā)展至關(guān)重要的一環(huán)。如果認(rèn)知遲遲沒有發(fā)生變化,AI會重新變成“需要有一個大模型、交付一個大模型,這個大模型的參數(shù)是不是一千億,是一千億就驗(yàn)收通過付款、結(jié)束”的過程,也許再經(jīng)過一年半載,客戶會覺得,大模型好像沒什么用。
這時,熱潮可能將會再度遺憾告終。
在通往通用人工智能(AGI)的路上,通用大模型和行業(yè)大模型是兩條不同的技術(shù)路線,戴文淵認(rèn)為,大家都是朝著AGI的方向前進(jìn),區(qū)別在于是用一個模型去實(shí)現(xiàn)AGI,還是用很多模型去實(shí)現(xiàn)AGI。
在他看來,從架構(gòu)角度、算力、能源成本而言,用一個模型去解決所有的問題,不是最經(jīng)濟(jì)的。
戴文淵還提出了一個更為少見的觀點(diǎn):并不存在真正的通用大模型,所謂的通用大模型,本質(zhì)是將多種場景融入一個模型中。例如,通過收集網(wǎng)絡(luò)上的廣泛語料,并進(jìn)行切分以支持不同垂直場景。優(yōu)化通用大模型的過程,需要對其各項能力進(jìn)行全面評估,一旦發(fā)現(xiàn)某項能力相對薄弱,再增加相關(guān)數(shù)據(jù),以強(qiáng)化該能力。從某種程度上講,這可以視為不同場景的組合。
而第四范式的做法是,進(jìn)行剪裁,先做垂直的行業(yè)模型。如果模型僅針對某一特定場景進(jìn)行應(yīng)用,就先通過該場景的數(shù)據(jù)模態(tài)構(gòu)建專用模型,同樣參數(shù)量往往能實(shí)現(xiàn)更好的效果。相反,若模型被設(shè)計為一個通用大型模型,最后通用大模型應(yīng)用到某一具體場景,往往很可能是不經(jīng)濟(jì)的。
戴文淵說:“比如我現(xiàn)在是人工智能的從業(yè)者,其實(shí)也是被剪裁的,我花了絕大多數(shù)的腦細(xì)胞去干AI,沒有花心思去學(xué)習(xí)怎么寫小說。如果我是一個全才,每個方面都很厲害,我去選擇做AI就很屈才了。從經(jīng)濟(jì)角度說,一個被剪裁過的模型更好。”
“經(jīng)濟(jì)”,在一個小時的采訪里,戴文淵至少5次提到這個詞。“我們致力于把這個問題(解決),或者把這個技術(shù)做出來,如果我選擇了不經(jīng)濟(jì)的一條路,可能最后我會做不出來,我們要綜合考慮每一種方向,每一個路線所面臨的問題,最后找到一個最有可能的解決方法。”戴文淵說。
“做最領(lǐng)先的AI是特別特別貴的事,需要花很多錢。”或許正因?yàn)槿绱耍诩夹g(shù)信仰派和商業(yè)信仰派之爭中,戴文淵認(rèn)為自己處于兩者之間。
AI顯然是個科學(xué)問題,但做出最領(lǐng)先的AI技術(shù),是個需要計算的經(jīng)濟(jì)問題。
戴文淵認(rèn)為,經(jīng)營一家AI技術(shù)公司,需要站在商業(yè)的角度思考問題:最領(lǐng)先的AI技術(shù)需要海量的算力和數(shù)據(jù),如果不能和商業(yè)更好(地)結(jié)合,那么長期持續(xù)的資金投入將變得難以為繼,“既需要技術(shù)又需要商業(yè),如果你要做最好的東西,就必須要都有”。
此外,對于AI從業(yè)者的自我修養(yǎng),戴文淵認(rèn)為,還需要具備韌勁與恒心,“人工智能就是一個起起伏伏的賽道,可能這兩年又被大家關(guān)注到了,甚至被吹上天,被吹上天的時候你不要覺得自己是神仙。同時,被踩到地下的時候,也不要覺得自己沒有價值”。
波浪式前進(jìn)的過程中,可以肯定的是,通往AGI的道路并沒有一個標(biāo)準(zhǔn)的指路牌。
“AGI是我們所有人的理想,AGI就是我自己心目當(dāng)中的一個無窮大。”戴文淵從來不認(rèn)為AGI是一件三年、五年甚至十年就能實(shí)現(xiàn)的事,相反,他覺得,AGI是一件永遠(yuǎn)做不到,但永遠(yuǎn)都在做的事。他又補(bǔ)充道,可能在不久的將來所誕生的人工智能,在人類看來已經(jīng)是AGI,判斷的因素在于,“對于人來說,人工智能究竟是不是AGI,在于能不能發(fā)現(xiàn)它還有地方不會。如果發(fā)現(xiàn)不了,那這對人來說已經(jīng)是AGI了”。
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP