亚洲狠狠,一级黄色大片,日韩在线第一区视屏,韩国作爱视频久久久久,亚洲欧美国产精品专区久久,青青草华人在线视频,国内精品久久影视免费

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

DeepSeek能否滿足醫(yī)院需求?病理大模型被神化了嗎?| 對(duì)話商湯醫(yī)療CEO張少霆

每日經(jīng)濟(jì)新聞 2025-03-04 00:36:29

近日,《每日經(jīng)濟(jì)新聞》記者專訪商湯科技副總裁、商湯醫(yī)療CEO張少霆,他表示,病理大模型并不是大家常說的“大模型”,它更接近傳統(tǒng)的預(yù)訓(xùn)練模型,還不能像語言大模型一樣“大殺四方”,還需要往下游任務(wù)深化。開發(fā)病理大模型面臨諸多技術(shù)挑戰(zhàn),如數(shù)據(jù)覆蓋面、運(yùn)行效率等。病理大模型落地涉及掃描儀廠家、AI廠家、存儲(chǔ)廠家等產(chǎn)業(yè)生態(tài)的聯(lián)動(dòng),需要生態(tài)合作伙伴的精誠合作。

每經(jīng)記者 林姿辰    每經(jīng)編輯 董興生    

“全靠大家支持,才能順利邁出第一步,不過晨跑最難的就是早起上跑道邁出第一步。”2月20日晚,張少霆在朋友圈轉(zhuǎn)發(fā)了一則消息,慶祝商湯醫(yī)療完成過億元Pre-A輪融資。

作為國內(nèi)AI(人工智能)龍頭商湯科技的副總裁、研究院副院長、商湯醫(yī)療CEO,張少霆在2018年加入商湯時(shí),就是以“智慧健康負(fù)責(zé)人”的身份亮相的。

去年夏天,國內(nèi)首個(gè)AI病理大模型PathOrchestra就出自商湯科技、西京醫(yī)院及清華大學(xué)的合作團(tuán)隊(duì),號(hào)稱“實(shí)現(xiàn)了全球最廣泛的臨床科研任務(wù)賦能,完成了人工智能病理研究領(lǐng)域從‘單模專病’到‘一模多病’的跨越式突破”。近日,國內(nèi)通信技術(shù)龍頭華為參與發(fā)布“瑞智病理大模型RuiPath”,讓病理大模型再次受到公眾關(guān)注。

作為AI醫(yī)療大模型領(lǐng)域最具挑戰(zhàn)性的“明珠”,病理大模型為何讓龍頭頻頻駐足?近日,《每日經(jīng)濟(jì)新聞》記者(以下簡稱“NBD”)獨(dú)家對(duì)話張少霆,了解到他的看法。

商湯科技副總裁、研究院副院長、商湯醫(yī)療CEO張少霆 圖片來源:受訪者供圖

都知道DeepSeek,但什么是病理大模型?

與DeepSeek等通用大模型不同,病理大模型專注于解決病理科醫(yī)生面臨的臨床問題;但與宮頸癌篩查等專用模型也不同,病理大模型致力于解決多種臨床任務(wù)。資料顯示,PathOrchestra覆蓋肺、乳腺、肝臟、食管等20余種器官,賦能百余項(xiàng)臨床任務(wù),是當(dāng)時(shí)全球賦能臨床任務(wù)最廣的病理大模型。

AI病理診斷流程 圖片來源:頭豹研究院報(bào)告

NBD:病理大模型和DeepSeek的區(qū)別是什么?

張少霆:DeepSeek等屬于語言大模型,病理大模型大多屬于圖像模型,也有部分是多模態(tài)模型,這是兩種完全不同的模型。前者(語言大模型)通常擁有數(shù)百億到數(shù)千億級(jí)參數(shù),使用不同的提示詞就能勝任成百上千種不同的任務(wù);后者(病理大模型)的參數(shù)規(guī)模則在億到十億級(jí)別,針對(duì)特定的下游任務(wù),仍然需要再加入相關(guān)數(shù)據(jù)后進(jìn)行微調(diào)訓(xùn)練,才能更好地適配這些任務(wù)。

所以,病理大模型并不是大家常說的“大模型”,它更接近傳統(tǒng)的預(yù)訓(xùn)練模型(Pre-trained Model),還不能像語言大模型一樣“大殺四方”,還需要往下游任務(wù)深化。

NBD:商湯醫(yī)療為什么選擇做病理大模型?

張少霆:在做基于醫(yī)療圖像的輔助診斷時(shí),有一個(gè)概念叫“長尾問題”。例如,肺結(jié)節(jié)檢測這類高頻問題的數(shù)據(jù)豐富且容易獲取,因此可以相對(duì)容易地收集到足夠多的數(shù)據(jù),來訓(xùn)練一個(gè)專才模型,這樣的模型不需要特別龐大就能效率高且性能出色。然而,對(duì)于那些小眾疾病,數(shù)據(jù)標(biāo)注稀缺且難以獲取。在這種情況下,傳統(tǒng)的數(shù)據(jù)收集和標(biāo)注方式就顯得力不從心了。

病理大模型的優(yōu)勢(shì)在于,它可以在長尾問題上減少對(duì)傳統(tǒng)數(shù)據(jù)收集和標(biāo)注的需求,從而提高模型的訓(xùn)練效率,更好地適配并解決子問題。

回過頭看,我們對(duì)病理領(lǐng)域的大模型研究是伴隨著技術(shù)范式的變化自然而然地發(fā)生的,經(jīng)歷了三個(gè)階段。2018年起,專注于胃腸和宮頸TCT(液基薄層細(xì)胞學(xué)檢測)的單點(diǎn)應(yīng)用;2021年起,與瑞金醫(yī)院合作將下游任務(wù)拓展到9種不同的疾病,在遷移學(xué)習(xí)方面取得了一定的成果;2023年起,開始嘗試訓(xùn)練病理大模型,來覆蓋多達(dá)幾十種“長尾”疾病。

NBD:資料顯示,PathOrchestra可以賦能百余項(xiàng)臨床任務(wù),這能涵蓋醫(yī)院病理科接觸到的所有疾病嗎?

張少霆:這里需要定義“任務(wù)”。比如,針對(duì)病理圖像進(jìn)行細(xì)胞分割或細(xì)胞檢測也屬于不同的任務(wù),因此我們說的100多種下游任務(wù)對(duì)應(yīng)的不是100多種疾病,目前基本能覆蓋二三十種疾病,像AI賦能最多的組織病理學(xué)中的胃腸小標(biāo)本、宮頸TCT標(biāo)本的輔助篩查,已經(jīng)滿足了病理科醫(yī)生日常工作的大部分需求,但這些都是通過專才模型來實(shí)現(xiàn)的。

當(dāng)下也還有很多病理切片需要醫(yī)生親自查看,例如腫瘤組織標(biāo)本,需要根據(jù)病理切片進(jìn)行十幾種不同疾病亞型的分類和判別。目前,將這類任務(wù)完全交給病理大模型還為時(shí)尚早,因?yàn)榇竽P湍壳爸痪邆渫ㄓ玫?ldquo;排兵布陣式”的陣法知識(shí),缺少逐個(gè)擊破的作戰(zhàn)能力,如果每個(gè)亞型都存在一定出錯(cuò)概率,十幾種亞型都同時(shí)正確的概率就低很多。

圖片來源:每經(jīng)記者 張韻 攝

病理大模型不容易做,但能有效解決兩大問題

2023年是大模型技術(shù)突破之年,當(dāng)年發(fā)布醫(yī)療大模型產(chǎn)品的醫(yī)療企業(yè)多達(dá)數(shù)十家,資本市場曾掀起一股AI醫(yī)療熱潮。但由于應(yīng)用落地存在挑戰(zhàn),這些醫(yī)療大模型在2024年的聲量明顯下降。如今,當(dāng)以病理大模型為代表的??拼竽P偷菆?,它們面臨的挑戰(zhàn)似乎只多不少。

NBD:開發(fā)病理大模型,面臨著哪些技術(shù)上的挑戰(zhàn)?

張少霆:挑戰(zhàn)還是蠻多的。第一個(gè)是數(shù)據(jù)覆蓋面,例如覆蓋不同疾病且注重?cái)?shù)量比例,不能只是追求總數(shù)量。比如大模型在某一疾病上的性能表現(xiàn)良好,但可能會(huì)影響對(duì)其他疾病的性能。我們需要找到一個(gè)平衡點(diǎn),使模型能夠兼顧多種疾病。第二個(gè)是大模型雖然泛化性更強(qiáng)、適用場景更多,但參數(shù)量大幅增加,導(dǎo)致運(yùn)行效率降低。如何在保持性能的同時(shí)控制運(yùn)行時(shí)間效率,是一個(gè)亟待解決的問題。

NBD:你剛才提到,在不同病理樣本之間,病理專項(xiàng)模型的性能可能不同。怎么盡可能保證病理大模型性能的一致和可靠?

張少霆:體外診斷(IVD)領(lǐng)域常常會(huì)面臨泛化性的問題。盡管商湯的病理產(chǎn)品已經(jīng)在近百家醫(yī)院實(shí)現(xiàn)了落地,目前觀察到的泛化性表現(xiàn)良好,但醫(yī)療領(lǐng)域需要用統(tǒng)計(jì)數(shù)據(jù)說話。我們正在制定泛化性實(shí)驗(yàn)的標(biāo)準(zhǔn)。如果產(chǎn)品在新場景中無法直接適用,就需要利用當(dāng)?shù)氐男聰?shù)據(jù)(包括標(biāo)注數(shù)據(jù))進(jìn)行小規(guī)模的參數(shù)微調(diào),從而使其能夠更好地適配新場景。

NBD:有醫(yī)生反映,病理學(xué)樣本數(shù)字化的比例并不高,這是不是個(gè)挑戰(zhàn)?

張少霆:是的。病理數(shù)字化是AI分析的前置條件,所以如果沒有病理數(shù)字化的基礎(chǔ)設(shè)施,AI也很難在臨床上進(jìn)行大規(guī)模輔助診斷賦能。對(duì)于病理大模型研究,病理數(shù)字化的影響也足夠深遠(yuǎn)。

PathOrchestra是基于當(dāng)時(shí)國內(nèi)規(guī)模最大的數(shù)字病理圖像數(shù)據(jù)集訓(xùn)練建立的,但僅僅數(shù)據(jù)量大是不夠的。如果我們回顧一下來自哈佛、微軟和斯坦福的那幾篇發(fā)表在《自然》雜志上的文章,就會(huì)發(fā)現(xiàn)數(shù)據(jù)的分布更為重要。例如,胃腸和宮頸TCT這兩個(gè)領(lǐng)域的數(shù)據(jù)量是巨大的,但是其中有多少是關(guān)于乳腺、肝臟等其他細(xì)分領(lǐng)域的數(shù)據(jù)?所以病理數(shù)字化程度越高、越廣泛,數(shù)據(jù)有足夠的覆蓋面,大模型才能均衡處理足夠多元的任務(wù),而這(數(shù)據(jù)量和數(shù)據(jù)分布)是不容易平衡的。

NBD:既然有這么多挑戰(zhàn),為什么還要做病理大模型?

張少霆:專有模型也面臨兩大挑戰(zhàn),首先是之前提到的長尾問題,其次是病理檢測屬于體外診斷,個(gè)別醫(yī)院尤其是基層醫(yī)院的制片流程可能不夠規(guī)范,導(dǎo)致病理圖像特征差異巨大,從而對(duì)專有模型的泛化性提出更高的挑戰(zhàn)。

而大模型能夠有效解決這兩個(gè)問題。在長尾問題上,大模型至少能提供比“沒有解決方案”更好的選擇;在泛化性上,大模型可以作為一個(gè)編碼器(encoder),提取病理圖像特征后再針對(duì)某個(gè)疾病的專項(xiàng)診斷模型進(jìn)行優(yōu)化,這種機(jī)制讓大模型能夠更好地總結(jié)病理數(shù)據(jù)的特征,從而具備更廣泛的疾病覆蓋能力。

不過,需要再次強(qiáng)調(diào)的是,病理大模型目前還無法像語言大模型那樣全面且直接地解決很多問題,更多是集中在科研領(lǐng)域。

醫(yī)院院長們?cè)趺纯创鼳I潮?

醫(yī)院是病理大模型等??颇P偷闹苯淤I方。在張少霆看來,公司去年參與的湖北省“‘小切片’守護(hù)大民生”工程,是病理AI模型落地的標(biāo)志性事件。這場發(fā)生在湖北全省醫(yī)院的智慧化、數(shù)字化和AI化轉(zhuǎn)型,覆蓋了數(shù)百家基層醫(yī)院。這一事件也預(yù)示著,病理大模型落地應(yīng)用似乎已經(jīng)達(dá)到了突破的臨界點(diǎn)。

NBD:對(duì)于病理AI的落地,有人支持,有人懷疑。據(jù)你觀察,醫(yī)院院長們是怎么想的?

張少霆:在技術(shù)發(fā)展的過程中,總有保守派和激進(jìn)派,我感覺國內(nèi)的決策者目前更傾向于擁抱新技術(shù)。對(duì)于頭部醫(yī)院,它們不僅希望引入AI,節(jié)省醫(yī)生的時(shí)間、提高診斷精度,更希望借助AI賦能其醫(yī)聯(lián)體醫(yī)院的業(yè)務(wù)。對(duì)基層醫(yī)院而言,這同樣是一個(gè)節(jié)省成本的過程。

然而,醫(yī)院決策采購的核心考量之一是能否帶來增量收入。有時(shí)候說服決策層支持采購的難點(diǎn)在于,大多數(shù)AI醫(yī)療產(chǎn)品的賣點(diǎn)是幫助醫(yī)生更準(zhǔn)確地診斷和節(jié)省時(shí)間,而不是直接為醫(yī)院帶來新增收入或快速回本,這也是之前AI醫(yī)療產(chǎn)品的推廣面臨困難的原因之一。

NBD:你怎么看待各家醫(yī)院接入DeepSeek或發(fā)布自有大模型的動(dòng)作?

張少霆:在不少醫(yī)院接入DeepSeek平臺(tái)后,通用大語言模型在醫(yī)療領(lǐng)域真正帶來的臨床效果還有待時(shí)間驗(yàn)證。事實(shí)上,現(xiàn)在很多頭部醫(yī)院都基于自有的研發(fā)團(tuán)隊(duì),或與合作企業(yè)一起嘗試基于通用模型開發(fā)垂類大模型,打造自有品牌。在這種趨勢(shì)下,曾經(jīng)的“百模大戰(zhàn)”已經(jīng)逐漸演變?yōu)榇怪鳖I(lǐng)域的“萬模大戰(zhàn)”。從底層架構(gòu)來看,這些模型大多基于開源的通用基座,且這些開源基座占據(jù)了主流地位,而在此基礎(chǔ)上,醫(yī)療知識(shí)的注入才是關(guān)鍵。

圖片來源:公司官網(wǎng)

NBD:在這波AI熱中,你覺得AI是不是被神化了?

張少霆:需要具體問題具體分析。例如,早期開發(fā)的影像類模型(如肺結(jié)節(jié)檢測)以及剛剛提到的胃腸病理和宮頸TCT(液基薄層細(xì)胞學(xué)檢測)等專有模型,不僅沒有被神化,反而可能被低估了。事實(shí)上,如今在國內(nèi)的大部分三甲醫(yī)院,報(bào)告撰寫背后都有AI的支持。

但從另一個(gè)角度看,通用大模型的醫(yī)療價(jià)值可能確實(shí)被夸大了。這些大模型的通用性能很強(qiáng),在很多任務(wù)上實(shí)現(xiàn)了超出預(yù)期的效果,但幻覺問題(指大模型生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)或用戶輸入的指令不一致)也不可忽視。從某種角度來看,幻覺問題在通用領(lǐng)域或許并非壞事,因?yàn)槟P涂梢韵袢艘粯?ldquo;編故事”,但在嚴(yán)肅領(lǐng)域,尤其是醫(yī)療領(lǐng)域,這可能是致命問題。

實(shí)際上,目前我們?cè)谏虾H鸾疳t(yī)院病理科應(yīng)用于臨床、幫助醫(yī)生完成大量任務(wù)的還是商湯的專有模型,且效果已經(jīng)經(jīng)過了多年臨床驗(yàn)證。

病理大模型的產(chǎn)業(yè)化還有多遠(yuǎn)?

2023年,多個(gè)病理大模型的海外研究項(xiàng)目發(fā)表在《Nature》及《Nature Medicine》上,這表明,這一領(lǐng)域在學(xué)術(shù)界已經(jīng)非?;钴S,工業(yè)界也在進(jìn)行一些嘗試。但需要澆一盆冷水的是,目前病理大模型的價(jià)值更多體現(xiàn)在學(xué)術(shù)界,而非產(chǎn)業(yè)界。

NBD:病理AI作為一個(gè)產(chǎn)品,其上市路徑是怎樣的?

張少霆:理想情況下,需要進(jìn)行特定的臨床試驗(yàn)并收集臨床數(shù)據(jù)來進(jìn)行分析,以判斷其是否真正適用于臨床。這需要明確具體的任務(wù)目標(biāo),例如模型在特定任務(wù)上的性能要達(dá)到多少標(biāo)準(zhǔn),并在多家醫(yī)院完成臨床試驗(yàn)后才能進(jìn)行部署。

但是,病理大模型往往號(hào)稱能診斷幾十種疾病,這種復(fù)雜性很難在認(rèn)證中被全面評(píng)估,很難通過NMPA(中國國家藥品監(jiān)督管理局)或FDA(美國食品藥品監(jiān)督管理局)的嚴(yán)格認(rèn)證過程,所以產(chǎn)業(yè)化目前還是以病理專才模型為主。

NBD:除了上市路徑待完善,病理AI的商業(yè)化還面臨哪些挑戰(zhàn)?

張少霆:我們花了兩年多時(shí)間和數(shù)千萬元投入,才拿到肝臟CT診斷領(lǐng)域的全國首張三類證(三類醫(yī)療器械注冊(cè)證),在病理AI商業(yè)化之前,企業(yè)需要投入極大的人力、財(cái)力、精力和時(shí)間,這是個(gè)巨大的挑戰(zhàn)。

另外,市場教育和生態(tài)鏈合作也是商業(yè)化的重要環(huán)節(jié)。目前,病理AI的普及程度還相對(duì)落后。病理科工作流相對(duì)復(fù)雜,其落地涉及到掃描儀廠家、AI廠家、存儲(chǔ)廠家等產(chǎn)業(yè)生態(tài)的聯(lián)動(dòng),更需要生態(tài)合作伙伴的精誠合作。例如在瑞金醫(yī)院,商湯主要負(fù)責(zé)AI研發(fā),衡道病理負(fù)責(zé)部分信息化,華為主要提供存儲(chǔ)硬件,通力合作打造了瑞金智慧病理樣板。

當(dāng)然了,從技術(shù)到商業(yè),我們常常高估一年的變化,卻低估十年的變化,所以大家可以給這個(gè)行業(yè)多一些耐心。

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

模型 大模型 醫(yī)院 醫(yī)療 DeepSeek Ai 商湯

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0