要聞

DeepSeek能否滿足醫(yī)院需求？病理大模型被神化了嗎？| 對話商湯醫(yī)療CEO張少霆

每日經濟新聞 2025-03-04 00:36:29

近日，《每日經濟新聞》記者專訪商湯科技副總裁、商湯醫(yī)療CEO張少霆，他表示，病理大模型并不是大家常說的“大模型”，它更接近傳統的預訓練模型，還不能像語言大模型一樣“大殺四方”，還需要往下游任務深化。開發(fā)病理大模型面臨諸多技術挑戰(zhàn)，如數據覆蓋面、運行效率等。病理大模型落地涉及掃描儀廠家、AI廠家、存儲廠家等產業(yè)生態(tài)的聯動，需要生態(tài)合作伙伴的精誠合作。

每經記者｜林姿辰每經編輯｜董興生

“全靠大家支持，才能順利邁出第一步，不過晨跑最難的就是早起上跑道邁出第一步。”2月20日晚，張少霆在朋友圈轉發(fā)了一則消息，慶祝商湯醫(yī)療完成過億元Pre-A輪融資。

作為國內AI（人工智能）龍頭商湯科技的副總裁、研究院副院長、商湯醫(yī)療CEO，張少霆在2018年加入商湯時，就是以“智慧健康負責人”的身份亮相的。

去年夏天，國內首個AI病理大模型PathOrchestra就出自商湯科技、西京醫(yī)院及清華大學的合作團隊，號稱“實現了全球最廣泛的臨床科研任務賦能，完成了人工智能病理研究領域從‘單模專病’到‘一模多病’的跨越式突破”。近日，國內通信技術龍頭華為參與發(fā)布“瑞智病理大模型RuiPath”，讓病理大模型再次受到公眾關注。

作為AI醫(yī)療大模型領域最具挑戰(zhàn)性的“明珠”，病理大模型為何讓龍頭頻頻駐足？近日，《每日經濟新聞》記者（以下簡稱“NBD”）獨家對話張少霆，了解到他的看法。

商湯科技副總裁、研究院副院長、商湯醫(yī)療CEO張少霆圖片來源：受訪者供圖

都知道DeepSeek，但什么是病理大模型？

與DeepSeek等通用大模型不同，病理大模型專注于解決病理科醫(yī)生面臨的臨床問題；但與宮頸癌篩查等專用模型也不同，病理大模型致力于解決多種臨床任務。資料顯示，PathOrchestra覆蓋肺、乳腺、肝臟、食管等20余種器官，賦能百余項臨床任務，是當時全球賦能臨床任務最廣的病理大模型。

AI病理診斷流程圖片來源：頭豹研究院報告

NBD：病理大模型和DeepSeek的區(qū)別是什么？

張少霆：DeepSeek等屬于語言大模型，病理大模型大多屬于圖像模型，也有部分是多模態(tài)模型，這是兩種完全不同的模型。前者（語言大模型）通常擁有數百億到數千億級參數，使用不同的提示詞就能勝任成百上千種不同的任務；后者（病理大模型）的參數規(guī)模則在億到十億級別，針對特定的下游任務，仍然需要再加入相關數據后進行微調訓練，才能更好地適配這些任務。

所以，病理大模型并不是大家常說的“大模型”，它更接近傳統的預訓練模型（Pre-trained Model），還不能像語言大模型一樣“大殺四方”，還需要往下游任務深化。

NBD：商湯醫(yī)療為什么選擇做病理大模型？

張少霆：在做基于醫(yī)療圖像的輔助診斷時，有一個概念叫“長尾問題”。例如，肺結節(jié)檢測這類高頻問題的數據豐富且容易獲取，因此可以相對容易地收集到足夠多的數據，來訓練一個專才模型，這樣的模型不需要特別龐大就能效率高且性能出色。然而，對于那些小眾疾病，數據標注稀缺且難以獲取。在這種情況下，傳統的數據收集和標注方式就顯得力不從心了。

病理大模型的優(yōu)勢在于，它可以在長尾問題上減少對傳統數據收集和標注的需求，從而提高模型的訓練效率，更好地適配并解決子問題。

回過頭看，我們對病理領域的大模型研究是伴隨著技術范式的變化自然而然地發(fā)生的，經歷了三個階段。2018年起，專注于胃腸和宮頸TCT（液基薄層細胞學檢測）的單點應用；2021年起，與瑞金醫(yī)院合作將下游任務拓展到9種不同的疾病，在遷移學習方面取得了一定的成果；2023年起，開始嘗試訓練病理大模型，來覆蓋多達幾十種“長尾”疾病。

NBD：資料顯示，PathOrchestra可以賦能百余項臨床任務，這能涵蓋醫(yī)院病理科接觸到的所有疾病嗎？

張少霆：這里需要定義“任務”。比如，針對病理圖像進行細胞分割或細胞檢測也屬于不同的任務，因此我們說的100多種下游任務對應的不是100多種疾病，目前基本能覆蓋二三十種疾病，像AI賦能最多的組織病理學中的胃腸小標本、宮頸TCT標本的輔助篩查，已經滿足了病理科醫(yī)生日常工作的大部分需求，但這些都是通過專才模型來實現的。

當下也還有很多病理切片需要醫(yī)生親自查看，例如腫瘤組織標本，需要根據病理切片進行十幾種不同疾病亞型的分類和判別。目前，將這類任務完全交給病理大模型還為時尚早，因為大模型目前只具備通用的“排兵布陣式”的陣法知識，缺少逐個擊破的作戰(zhàn)能力，如果每個亞型都存在一定出錯概率，十幾種亞型都同時正確的概率就低很多。

每經原創(chuàng)-G-公司-商湯科技-商湯科技上?？偛浚拷浻浾摺堩?、攝）1.jpg

圖片來源：每經記者張韻攝

病理大模型不容易做，但能有效解決兩大問題

2023年是大模型技術突破之年，當年發(fā)布醫(yī)療大模型產品的醫(yī)療企業(yè)多達數十家，資本市場曾掀起一股AI醫(yī)療熱潮。但由于應用落地存在挑戰(zhàn)，這些醫(yī)療大模型在2024年的聲量明顯下降。如今，當以病理大模型為代表的?？拼竽Ｐ偷菆觯鼈兠媾R的挑戰(zhàn)似乎只多不少。

NBD：開發(fā)病理大模型，面臨著哪些技術上的挑戰(zhàn)？

張少霆：挑戰(zhàn)還是蠻多的。第一個是數據覆蓋面，例如覆蓋不同疾病且注重數量比例，不能只是追求總數量。比如大模型在某一疾病上的性能表現良好，但可能會影響對其他疾病的性能。我們需要找到一個平衡點，使模型能夠兼顧多種疾病。第二個是大模型雖然泛化性更強、適用場景更多，但參數量大幅增加，導致運行效率降低。如何在保持性能的同時控制運行時間效率，是一個亟待解決的問題。

NBD：你剛才提到，在不同病理樣本之間，病理專項模型的性能可能不同。怎么盡可能保證病理大模型性能的一致和可靠？

張少霆：體外診斷（IVD）領域常常會面臨泛化性的問題。盡管商湯的病理產品已經在近百家醫(yī)院實現了落地，目前觀察到的泛化性表現良好，但醫(yī)療領域需要用統計數據說話。我們正在制定泛化性實驗的標準。如果產品在新場景中無法直接適用，就需要利用當地的新數據（包括標注數據）進行小規(guī)模的參數微調，從而使其能夠更好地適配新場景。

NBD：有醫(yī)生反映，病理學樣本數字化的比例并不高，這是不是個挑戰(zhàn)？

張少霆：是的。病理數字化是AI分析的前置條件，所以如果沒有病理數字化的基礎設施，AI也很難在臨床上進行大規(guī)模輔助診斷賦能。對于病理大模型研究，病理數字化的影響也足夠深遠。

PathOrchestra是基于當時國內規(guī)模最大的數字病理圖像數據集訓練建立的，但僅僅數據量大是不夠的。如果我們回顧一下來自哈佛、微軟和斯坦福的那幾篇發(fā)表在《自然》雜志上的文章，就會發(fā)現數據的分布更為重要。例如，胃腸和宮頸TCT這兩個領域的數據量是巨大的，但是其中有多少是關于乳腺、肝臟等其他細分領域的數據？所以病理數字化程度越高、越廣泛，數據有足夠的覆蓋面，大模型才能均衡處理足夠多元的任務，而這（數據量和數據分布）是不容易平衡的。

NBD：既然有這么多挑戰(zhàn)，為什么還要做病理大模型？

張少霆：專有模型也面臨兩大挑戰(zhàn)，首先是之前提到的長尾問題，其次是病理檢測屬于體外診斷，個別醫(yī)院尤其是基層醫(yī)院的制片流程可能不夠規(guī)范，導致病理圖像特征差異巨大，從而對專有模型的泛化性提出更高的挑戰(zhàn)。

而大模型能夠有效解決這兩個問題。在長尾問題上，大模型至少能提供比“沒有解決方案”更好的選擇；在泛化性上，大模型可以作為一個編碼器（encoder），提取病理圖像特征后再針對某個疾病的專項診斷模型進行優(yōu)化，這種機制讓大模型能夠更好地總結病理數據的特征，從而具備更廣泛的疾病覆蓋能力。

不過，需要再次強調的是，病理大模型目前還無法像語言大模型那樣全面且直接地解決很多問題，更多是集中在科研領域。

醫(yī)院院長們怎么看待AI潮？

醫(yī)院是病理大模型等?？颇Ｐ偷闹苯淤I方。在張少霆看來，公司去年參與的湖北省“‘小切片’守護大民生”工程，是病理AI模型落地的標志性事件。這場發(fā)生在湖北全省醫(yī)院的智慧化、數字化和AI化轉型，覆蓋了數百家基層醫(yī)院。這一事件也預示著，病理大模型落地應用似乎已經達到了突破的臨界點。

NBD：對于病理AI的落地，有人支持，有人懷疑。據你觀察，醫(yī)院院長們是怎么想的？

張少霆：在技術發(fā)展的過程中，總有保守派和激進派，我感覺國內的決策者目前更傾向于擁抱新技術。對于頭部醫(yī)院，它們不僅希望引入AI，節(jié)省醫(yī)生的時間、提高診斷精度，更希望借助AI賦能其醫(yī)聯體醫(yī)院的業(yè)務。對基層醫(yī)院而言，這同樣是一個節(jié)省成本的過程。

然而，醫(yī)院決策采購的核心考量之一是能否帶來增量收入。有時候說服決策層支持采購的難點在于，大多數AI醫(yī)療產品的賣點是幫助醫(yī)生更準確地診斷和節(jié)省時間，而不是直接為醫(yī)院帶來新增收入或快速回本，這也是之前AI醫(yī)療產品的推廣面臨困難的原因之一。

NBD：你怎么看待各家醫(yī)院接入DeepSeek或發(fā)布自有大模型的動作？

張少霆：在不少醫(yī)院接入DeepSeek平臺后，通用大語言模型在醫(yī)療領域真正帶來的臨床效果還有待時間驗證。事實上，現在很多頭部醫(yī)院都基于自有的研發(fā)團隊，或與合作企業(yè)一起嘗試基于通用模型開發(fā)垂類大模型，打造自有品牌。在這種趨勢下，曾經的“百模大戰(zhàn)”已經逐漸演變?yōu)榇怪鳖I域的“萬模大戰(zhàn)”。從底層架構來看，這些模型大多基于開源的通用基座，且這些開源基座占據了主流地位，而在此基礎上，醫(yī)療知識的注入才是關鍵。

圖片來源：公司官網

NBD：在這波AI熱中，你覺得AI是不是被神化了？

張少霆：需要具體問題具體分析。例如，早期開發(fā)的影像類模型（如肺結節(jié)檢測）以及剛剛提到的胃腸病理和宮頸TCT（液基薄層細胞學檢測）等專有模型，不僅沒有被神化，反而可能被低估了。事實上，如今在國內的大部分三甲醫(yī)院，報告撰寫背后都有AI的支持。

但從另一個角度看，通用大模型的醫(yī)療價值可能確實被夸大了。這些大模型的通用性能很強，在很多任務上實現了超出預期的效果，但幻覺問題（指大模型生成的內容與現實世界事實或用戶輸入的指令不一致）也不可忽視。從某種角度來看，幻覺問題在通用領域或許并非壞事，因為模型可以像人一樣“編故事”，但在嚴肅領域，尤其是醫(yī)療領域，這可能是致命問題。

實際上，目前我們在上海瑞金醫(yī)院病理科應用于臨床、幫助醫(yī)生完成大量任務的還是商湯的專有模型，且效果已經經過了多年臨床驗證。

病理大模型的產業(yè)化還有多遠？

2023年，多個病理大模型的海外研究項目發(fā)表在《Nature》及《Nature Medicine》上，這表明，這一領域在學術界已經非?；钴S，工業(yè)界也在進行一些嘗試。但需要澆一盆冷水的是，目前病理大模型的價值更多體現在學術界，而非產業(yè)界。

NBD：病理AI作為一個產品，其上市路徑是怎樣的？

張少霆：理想情況下，需要進行特定的臨床試驗并收集臨床數據來進行分析，以判斷其是否真正適用于臨床。這需要明確具體的任務目標，例如模型在特定任務上的性能要達到多少標準，并在多家醫(yī)院完成臨床試驗后才能進行部署。

但是，病理大模型往往號稱能診斷幾十種疾病，這種復雜性很難在認證中被全面評估，很難通過NMPA（中國國家藥品監(jiān)督管理局）或FDA（美國食品藥品監(jiān)督管理局）的嚴格認證過程，所以產業(yè)化目前還是以病理專才模型為主。

NBD：除了上市路徑待完善，病理AI的商業(yè)化還面臨哪些挑戰(zhàn)？

張少霆：我們花了兩年多時間和數千萬元投入，才拿到肝臟CT診斷領域的全國首張三類證（三類醫(yī)療器械注冊證），在病理AI商業(yè)化之前，企業(yè)需要投入極大的人力、財力、精力和時間，這是個巨大的挑戰(zhàn)。

另外，市場教育和生態(tài)鏈合作也是商業(yè)化的重要環(huán)節(jié)。目前，病理AI的普及程度還相對落后。病理科工作流相對復雜，其落地涉及到掃描儀廠家、AI廠家、存儲廠家等產業(yè)生態(tài)的聯動，更需要生態(tài)合作伙伴的精誠合作。例如在瑞金醫(yī)院，商湯主要負責AI研發(fā)，衡道病理負責部分信息化，華為主要提供存儲硬件，通力合作打造了瑞金智慧病理樣板。

當然了，從技術到商業(yè)，我們常常高估一年的變化，卻低估十年的變化，所以大家可以給這個行業(yè)多一些耐心。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。