要聞

國(guó)內(nèi)首個(gè)腦血管專(zhuān)病大模型亮相對(duì)話(huà)參與醫(yī)生：最初心里沒(méi)有底，后來(lái)AI證明我是錯(cuò)的

每日經(jīng)濟(jì)新聞 2024-09-13 22:55:44

◎醫(yī)師邳靖陶模擬了一個(gè)復(fù)雜的臨床場(chǎng)景，大模型給出的治療方案和預(yù)想的“標(biāo)準(zhǔn)答案”有所出入。而當(dāng)邳靖陶用“標(biāo)準(zhǔn)答案”去匹配臨床指南時(shí)，讓他印象深刻的結(jié)果出現(xiàn)了：是自己的診療思路存在盲區(qū)。

每經(jīng)記者｜林姿辰每經(jīng)編輯｜張海妮

距離谷歌大模型（Med-PaLM 2）拿下美國(guó)醫(yī)學(xué)執(zhí)照考試已經(jīng)快兩年了，人工智能（AI）夠資格成為臨床醫(yī)生的“假想敵”了嗎？

今年7月，一篇發(fā)表于Nature Medicine的論文顯示，即使是目前最先進(jìn)的大語(yǔ)言模型（LLM）也無(wú)法為所有患者做出準(zhǔn)確診斷，且診斷正確率（73%）明顯差于人類(lèi)醫(yī)生（89%）；在極端情況（膽囊炎診斷）下，LLM的正確率僅為13%。

但對(duì)于北京清華長(zhǎng)庚醫(yī)院神經(jīng)中心醫(yī)師邳靖陶來(lái)說(shuō)，他今年剛被AI“上了一課”。8月下旬，邳靖陶參與的靈犀醫(yī)學(xué)腦血管病專(zhuān)病大模型正式發(fā)布，該模型由其所在醫(yī)院的神經(jīng)中心武劍教授團(tuán)隊(duì)主導(dǎo)研發(fā)，是國(guó)內(nèi)首個(gè)基于專(zhuān)病的醫(yī)學(xué)人工智能模型。

“大模型的能力說(shuō)強(qiáng)也強(qiáng)，說(shuō)弱也弱，我們不能讓它天馬行空地自由發(fā)揮。”邳靖陶表示，專(zhuān)病大模型與ChatGPT的最大不同，是要將AI杜撰的似是而非的診療建議扼殺在搖籃里，避免災(zāi)難性后果。

清華大學(xué)附屬北京清華長(zhǎng)庚醫(yī)院神經(jīng)中心教授武劍圖片來(lái)源：受訪者提供

專(zhuān)病大模型對(duì)標(biāo)基層最缺的專(zhuān)科專(zhuān)家

作為國(guó)內(nèi)四大慢病之一，腦血管病的首次發(fā)病者約有2/3是60歲以上的老年人，其具有“高發(fā)病率、高患病率、高死亡率、高復(fù)發(fā)率”的特點(diǎn)。而截至2021年，我國(guó)65歲以上的老年人口已經(jīng)超過(guò)2億人，腦血管病醫(yī)生短缺、水平參差不齊的問(wèn)題尤為突出。

“基層醫(yī)院不缺全科醫(yī)生，但缺專(zhuān)科專(zhuān)家或?qū)２?zhuān)家，這就是大模型要解決的問(wèn)題。”邳靖陶介紹，腦血管病專(zhuān)病大模型是醫(yī)療機(jī)構(gòu)與科技企業(yè)的合作產(chǎn)物。具體來(lái)說(shuō)，新華三集團(tuán)提供技術(shù)人員、AI算法和算力，北京清華長(zhǎng)庚醫(yī)院和清華大學(xué)提供大數(shù)據(jù)和臨床需求，共同打造一款面向臨床醫(yī)生的輔助診斷工具。

武劍教授曾表示，醫(yī)學(xué)人工智能在緩解醫(yī)療資源緊張和提升醫(yī)療服務(wù)水平方面，具有巨大的潛力和優(yōu)勢(shì)。其核心在于對(duì)海量健康數(shù)據(jù)的深度挖掘和智能分析，這能夠大幅提升臨床診斷和治療的準(zhǔn)確性與效率。

目前，這個(gè)大模型的核心功能是分析和提取病歷中的關(guān)鍵信息，并與臨床知識(shí)庫(kù)相匹配，最終提供符合臨床指南的標(biāo)準(zhǔn)化治療建議。

一方面，臨床醫(yī)生可以輸入脫敏（不包括患者個(gè)人信息）的臨床病程信息，由大模型生成最終的治療方案。期間，如果大模型察覺(jué)到病程信息存在疏漏，會(huì)提醒醫(yī)生及時(shí)補(bǔ)充，保證病歷記錄的標(biāo)準(zhǔn)化。

另一方面，臨床醫(yī)生也可以輸入患者主訴（如主要癥狀和持續(xù)時(shí)間等信息）等簡(jiǎn)單信息，大模型將通過(guò)選擇性交互引導(dǎo)問(wèn)診方向，根據(jù)醫(yī)生點(diǎn)擊的選項(xiàng)，逐步完善臨床診療過(guò)程，提升醫(yī)生的循證能力。

想讓大模型“聽(tīng)話(huà)”，得說(shuō)它“聽(tīng)得懂”的話(huà)

在邳靖陶看來(lái)，與ChatGPT等通用大模型相比，專(zhuān)病大模型的專(zhuān)業(yè)性體現(xiàn)在思維鏈和知識(shí)庫(kù)兩方面。以腦血管病專(zhuān)病大模型為例，其數(shù)據(jù)來(lái)源包括兩大部分：一部分是經(jīng)過(guò)脫敏處理的臨床資料，涉及疾病的特定特征，發(fā)病情況以及診療過(guò)程等綜合信息。另一部分是公開(kāi)獲取的臨床指南、大量神經(jīng)病學(xué)和神經(jīng)科學(xué)的教科書(shū)和參考書(shū)籍，這些構(gòu)成了數(shù)據(jù)庫(kù)的核心內(nèi)容。值得注意的是，大模型并不能直接接收這些知識(shí)，而是需要經(jīng)臨床醫(yī)生和工科團(tuán)隊(duì)之手，將臨床指南的框架和重點(diǎn)內(nèi)容重新整理，轉(zhuǎn)化為計(jì)算機(jī)能夠理解的語(yǔ)言和流程后，再輸給大模型。

“如果不加限制地直接投喂，大模型會(huì)發(fā)散到其他方面，生成一些新的理解。但臨床指南已經(jīng)是最高級(jí)別的標(biāo)準(zhǔn)化診療推薦，在此基礎(chǔ)上的任何修改都是錯(cuò)誤的，也不是我們想要的。”邳靖陶告訴記者，想讓大模型“聽(tīng)話(huà)”，除了要投喂計(jì)算機(jī)能“聽(tīng)懂”的知識(shí)，更關(guān)鍵的是教給它一套臨床醫(yī)生的“思維鏈”，并依托這一能力對(duì)不同患者的臨床資料進(jìn)行推理。

例如，一位腦血管病醫(yī)生的診療流程大致包括詢(xún)問(wèn)病史，進(jìn)行體格檢查，考慮輔助檢查，綜合分析后給出準(zhǔn)確診斷等環(huán)節(jié)?；谠\斷結(jié)果，醫(yī)生會(huì)考慮患者的具體病因和其他基礎(chǔ)疾病情況，結(jié)合標(biāo)準(zhǔn)化的診療建議，制定規(guī)范化的治療方案。

在這個(gè)過(guò)程中，不同的患者主訴指向不同的詢(xún)問(wèn)方向。但問(wèn)題是，大模型的思維雖然“發(fā)散”，但不具備自主搭建思維鏈的能力，所以需要工科團(tuán)隊(duì)深刻理解臨床診療場(chǎng)景，將醫(yī)生的臨床思維轉(zhuǎn)換為機(jī)器可以理解的思維。而這個(gè)過(guò)程讓臨床醫(yī)生和技術(shù)團(tuán)隊(duì)，都經(jīng)歷了交叉學(xué)習(xí)的歷練。

“Gap（差距）主要是語(yǔ)言交流上的障礙，比如我們不理解思維鏈，他們不理解不同疾病間的關(guān)系。但這不會(huì)對(duì)我們的研究造成實(shí)質(zhì)性影響，只要了解對(duì)方領(lǐng)域的基礎(chǔ)知識(shí)，就能掃清困難。”邳靖陶說(shuō)。

圖片來(lái)源：受訪者提供

AI給出預(yù)期相反的診斷，最后發(fā)現(xiàn)醫(yī)生錯(cuò)了

邳靖陶透露，目前腦血管病專(zhuān)病大模型正在北京清華長(zhǎng)庚醫(yī)院神經(jīng)中心進(jìn)行臨床驗(yàn)證。此前，他和同事們?cè)褂谜鎸?shí)病例或模擬復(fù)雜臨床場(chǎng)景，對(duì)大模型進(jìn)行過(guò)內(nèi)部測(cè)試。這項(xiàng)測(cè)試建立在前期簡(jiǎn)單測(cè)試的基礎(chǔ)之上，旨在評(píng)估大模型對(duì)不同復(fù)雜程度、不同語(yǔ)言風(fēng)格和不同級(jí)別醫(yī)生的病歷的理解能力。

其中，最困擾邳靖陶的一個(gè)問(wèn)題是，如果大模型出現(xiàn)了錯(cuò)誤，怎么保證臨床醫(yī)生不受干擾呢？換言之，臨床醫(yī)生應(yīng)該怎么處理自己和大模型之間的關(guān)系？

這一矛盾在首次內(nèi)部測(cè)試時(shí)就出現(xiàn)了。當(dāng)時(shí)，邳靖陶模擬了一個(gè)復(fù)雜的臨床場(chǎng)景，大模型給出的治療方案和預(yù)想的“標(biāo)準(zhǔn)答案”有所出入。隨后，技術(shù)人員介入并回溯了大模型的推理過(guò)程，試圖找出可能的錯(cuò)誤，卻無(wú)功而返。

而當(dāng)邳靖陶用“標(biāo)準(zhǔn)答案”去匹配臨床指南時(shí)，讓他印象深刻的結(jié)果出現(xiàn)了：是自己的診療思路存在盲區(qū)。

“一開(kāi)始這個(gè)模型設(shè)計(jì)出來(lái)，到底能不能用于臨床，能不能起到提升和改善（診療效率）的作用，其實(shí)我心里也沒(méi)有底。但是這件事兒之后，給了我特別大的底氣。”邳靖陶總結(jié)這次經(jīng)歷，發(fā)現(xiàn)患者的臨床癥狀是一個(gè)綜合結(jié)果。例如，患者可能因?yàn)樯窠?jīng)系統(tǒng)問(wèn)題住院，但心血管、腎臟、肝臟狀況也在發(fā)生變化。盡管醫(yī)生接受過(guò)規(guī)范化的專(zhuān)科培訓(xùn)，但診療思維仍可能存在盲點(diǎn)，無(wú)法保證每次都能提供全面的診療方案。

另外，臨床指南是不斷更新的，并非所有醫(yī)生都能及時(shí)更新知識(shí)。當(dāng)醫(yī)生的知識(shí)更新滯后時(shí)，大模型可以幫助彌補(bǔ)這些紕漏。

不過(guò)，閱讀指南并做出判斷，仍是臨床醫(yī)生不能丟棄的基本功。邳靖陶表示，如果醫(yī)生發(fā)現(xiàn)大模型提供的診療方案與自己的判斷不符，不應(yīng)簡(jiǎn)單地接受或拒絕，而應(yīng)深入探究原因。這一思考過(guò)程有助于醫(yī)生提高臨床診療能力，是大模型作為臨床輔助診斷工具的終極愿景。畢竟，雖然大模型可以提供結(jié)論，但對(duì)診療過(guò)程負(fù)責(zé)的仍是臨床醫(yī)生本人。

“專(zhuān)病-專(zhuān)科-全科”是臨床大模型必經(jīng)之路

2023年7月，谷歌Research和DeepMind共同打造的全球首個(gè)全科醫(yī)療大模型Med-PaLM M正式發(fā)布。資料顯示，這個(gè)大模型具備臨床語(yǔ)言、影像和基因組學(xué)的理解能力，用于臨床指日可待。

而根據(jù)《2023醫(yī)療健康A(chǔ)I大模型行業(yè)研究報(bào)告》，截至2023年10月，國(guó)內(nèi)累計(jì)公開(kāi)的大模型數(shù)量達(dá)到238個(gè)，其中，醫(yī)療大模型近50個(gè)，涉及患者問(wèn)診、醫(yī)生助手、藥物研發(fā)、健康科普等多個(gè)領(lǐng)域。據(jù)邳靖陶觀察，許多醫(yī)療大模型的開(kāi)發(fā)從“全科”出發(fā)，直接構(gòu)建一個(gè)涵蓋所有專(zhuān)科的大型全科模型，供用戶(hù)咨詢(xún)各種疾病。

但在參與構(gòu)建腦血管病專(zhuān)病大模型后，武劍教授團(tuán)隊(duì)對(duì)這一模式表示懷疑。他們發(fā)現(xiàn)，把一種疾病的臨床指南梳理清楚頗具難度，打造對(duì)應(yīng)的思維鏈也耗時(shí)耗力，短期內(nèi)很難用同樣的方法訓(xùn)練出全科模型。換言之，目前的全科大模型能夠做到醫(yī)學(xué)科普，但很難在特定專(zhuān)科領(lǐng)域提供有效的臨床指導(dǎo)。因此，武劍教授團(tuán)隊(duì)的研發(fā)思路是以專(zhuān)病為起點(diǎn)，再走向全科。

“如果針對(duì)腦血管病的專(zhuān)病大模型走通了，我們可以把成功經(jīng)驗(yàn)復(fù)制到其他神經(jīng)系統(tǒng)疾病上；如果神經(jīng)系統(tǒng)疾病覆蓋全面了，就成了專(zhuān)科大模型；神經(jīng)科的經(jīng)驗(yàn)再?gòu)?fù)制到其他科，就會(huì)形成一個(gè)真正的全科醫(yī)療大模型。”邳靖陶表示，在武劍教授看來(lái)，國(guó)內(nèi)發(fā)病人數(shù)越多、疾病負(fù)擔(dān)越大的疾病，其專(zhuān)病大模型的臨床需求和研發(fā)空間就會(huì)越大，例如國(guó)家發(fā)病率最高的四大慢病——高血壓、糖尿病、冠心病、腦血管病都有非常廣闊的大模型開(kāi)發(fā)空間。

而在腦血管病專(zhuān)病大模型的發(fā)布會(huì)上，武劍教授已經(jīng)通過(guò)招募令的形式，呼吁全國(guó)神經(jīng)系統(tǒng)疾病領(lǐng)域的專(zhuān)家，以及人工智能領(lǐng)域的專(zhuān)業(yè)人士攜手把握創(chuàng)新技術(shù)的改革可能，改善臨床診療現(xiàn)狀。他曾表示，如果能打破學(xué)術(shù)壁壘，醫(yī)療大模型的重復(fù)性工作是完全可以避免的。

“這不是我們一個(gè)人能做的事情。”邳靖陶說(shuō)。

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線(xiàn)：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。