每日經(jīng)濟(jì)新聞 2024-07-07 22:54:46
每經(jīng)記者 朱成祥 每經(jīng)編輯 楊夏
7月4日至6日,2024世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(WAIC 2024)在上海召開。期間,大模型、算力等多個(gè)領(lǐng)域?qū)<野l(fā)表了前瞻性思考。
商湯科技CEO徐立認(rèn)為,大模型本質(zhì)意義上是在做一個(gè)記憶的事情,記住世界的知識(shí)。而它僅有的一點(diǎn)點(diǎn)智力,完全是來自于對(duì)于知識(shí)背后高階的思維邏輯的記憶。所以說,在垂直行業(yè)里,如何構(gòu)造高階思維邏輯的合成數(shù)據(jù),往往是制勝的關(guān)鍵,并且是差異化的關(guān)鍵。這也是中國人工智能之路的關(guān)鍵。
愛芯元智創(chuàng)始人、董事長仇肖莘則認(rèn)為,大模型真正大規(guī)模落地需要云、邊、端三級(jí)緊密結(jié)合,而邊緣側(cè)和端側(cè)結(jié)合的關(guān)鍵在于AI計(jì)算與感知。
2024世界人工智能大會(huì)現(xiàn)場人潮涌動(dòng)。
突破大模型應(yīng)用障礙
關(guān)于大模型應(yīng)用落地,徐立表示,行業(yè)要進(jìn)行變化,交互模式一定是先行的。實(shí)時(shí)的交互性能夠帶來一個(gè)流暢的體驗(yàn),也是推動(dòng)超級(jí)時(shí)刻以及應(yīng)用變化的核心。對(duì)于GPT-4o的發(fā)布,外界感觸最深的是它可以實(shí)時(shí)地跟人進(jìn)行交互,從而重新定義了人機(jī)交互界面。
另外,阻礙大模型落地的一大因素是“大模型幻覺”。
MiniMax創(chuàng)始人、首席執(zhí)行官閆俊杰強(qiáng)調(diào)要降低錯(cuò)誤率。其表示,ChatGPT出來之后,國內(nèi)很多公司也在迎頭趕上,推出了很多模型。最核心的問題是,目前模型的錯(cuò)誤率還是比較高的。比如GPT-4,它在很多測試指標(biāo)上正確率可能只有60%、70%,即有30%到40%的錯(cuò)誤率。國內(nèi)的模型,錯(cuò)誤率整體上在60%到70%之間。
閆俊杰補(bǔ)充表示,為什么大模型的產(chǎn)品是對(duì)話形式?因?yàn)閷?duì)話的容錯(cuò)率比較高。為什么不能成為一個(gè)獨(dú)立的Agent(代理人)?因?yàn)槊恳徊蕉加?0%到40%的錯(cuò)誤率。因此,最核心的問題是怎么把大模型的錯(cuò)誤率從30%、40%,降低到3%、4%、2%,降低一個(gè)數(shù)量級(jí)。這將是AI從一個(gè)輔助人類的工具到能獨(dú)立完成工作最核心的標(biāo)志。
智譜AI首席執(zhí)行官張鵬則認(rèn)為,準(zhǔn)確率是一個(gè)方面,一般說準(zhǔn)確率的時(shí)候,大多數(shù)是限定在一些評(píng)測或者任務(wù)上,就看數(shù)值性的量化評(píng)測,但有些東西其實(shí)很難量化,比如說邏輯性,抽象思考的能力。張鵬強(qiáng)調(diào),這些恰恰是現(xiàn)在的模型,比人或者是比傳統(tǒng)的方法更強(qiáng)的地方。
張鵬認(rèn)為,現(xiàn)在很重要的點(diǎn)是突破大模型的多模態(tài)。因?yàn)檎嬲娜嗽诂F(xiàn)實(shí)世界解決問題的時(shí)候,他需要輸入的信息本身就是多模態(tài)的,除了自然語言以外還有視覺、聽覺、觸覺,所有這些是需要綜合起來才能解決現(xiàn)實(shí)世界當(dāng)中很多常見的問題,甚至不是復(fù)雜問題,都是常見問題。比如說掃地、做飯、洗衣服這些任務(wù),它所需要輸入的信息是多模態(tài)的,這些方面能力的突破會(huì)帶來AI的普惠。
關(guān)于工業(yè)大模型的應(yīng)用,香港工業(yè)人工智能及機(jī)械人研發(fā)中心(FLAIR)總裁黎少斌對(duì)《每日經(jīng)濟(jì)新聞》記者表示:“當(dāng)我們有更多的數(shù)據(jù),可以訓(xùn)練工業(yè)用的大模型。彼時(shí),我們可以直接去問設(shè)備,你的狀態(tài)怎么樣?有沒有什么不妥當(dāng)?設(shè)備就可以回一個(gè)答案,比如‘我發(fā)現(xiàn)可能某個(gè)設(shè)備有一點(diǎn)點(diǎn)問題,我應(yīng)該還能堅(jiān)持一個(gè)星期,你想想如何安排更換,做一個(gè)預(yù)維護(hù)’。”
其補(bǔ)充表示:“我們想把大模型技術(shù)與我們的一些解決方案結(jié)合起來,讓以后車間設(shè)備與人之間的溝通,會(huì)更像人與人之間的溝通。”
云側(cè)+端側(cè)算力配合
目前在大模型應(yīng)用方面,也開始更加強(qiáng)調(diào)云側(cè)與端側(cè)算力的配合。
徐立認(rèn)為,如果所有的資源都聚焦在云端,會(huì)帶來推理成本的大幅度增長,以及推理效率的下降,因?yàn)榫W(wǎng)絡(luò)的擁擠,勢(shì)必會(huì)帶來服務(wù)的不流暢。商湯科技在端側(cè)上加大了模型的優(yōu)化,提升了10%的性能精度,除此之外,速度有大規(guī)模提升,成本有大幅度下降。首包延遲下降40%,推理效率提升了15%。
愛芯元智創(chuàng)始人、董事長仇肖莘認(rèn)為,智能芯片和多模態(tài)大模型已經(jīng)成為人工智能時(shí)代的“黃金組合”,當(dāng)大模型的應(yīng)用日益廣泛,更經(jīng)濟(jì)、更高效、更環(huán)保將會(huì)成為智能芯片的關(guān)鍵詞,而搭載AI處理器的高效推理芯片將是大模型落地更合理的選擇,這也是推進(jìn)普惠AI的關(guān)鍵所在。
面壁智能副總裁賈超認(rèn)為,憑借在成本、隱私、延時(shí)性、可靠性等方面的優(yōu)勢(shì),端側(cè)AI發(fā)展會(huì)成為全球趨勢(shì),這也意味著大模型正式進(jìn)入輕量化時(shí)代。這一背景下,“模型知識(shí)密度,平均每8個(gè)月提升1倍”將會(huì)成為大模型時(shí)代的新摩爾定律。賈超強(qiáng)調(diào),企業(yè)開發(fā)端側(cè)大模型需要從算法側(cè)和芯片側(cè)雙向奔赴,讓端側(cè)模型用端側(cè)芯片,在用戶場景上高效落地,這樣才能給用戶帶來最極致的體驗(yàn)。
封面圖片來源:主辦方供圖
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP