文|動(dòng)脈網(wǎng)
剛結(jié)束的2023世界人工智能大會(huì)上,聯(lián)影智能CEO周翔在談及大語(yǔ)言模型時(shí),將這一技術(shù)及其背后時(shí)代的特征歸納為兩個(gè)詞,一個(gè)是“融合”,一個(gè)是“涌現(xiàn)”。
“涌現(xiàn)”一詞的廣泛認(rèn)知?dú)w功于凱文·凱利那本經(jīng)典的《失控》,用以描述一個(gè)系統(tǒng)中個(gè)體間預(yù)設(shè)的簡(jiǎn)單互動(dòng)行為所造就的無(wú)法預(yù)知的復(fù)雜樣態(tài)的現(xiàn)象。如今的大語(yǔ)言模型便是如此,當(dāng)模型的尺度不斷增加,模型的能力會(huì)在一定范圍內(nèi)維持類(lèi)線性的走勢(shì)(深度學(xué)習(xí)便是如此),并在突破閾值后實(shí)現(xiàn)爆發(fā)式增長(zhǎng)。
“融合”未來(lái)產(chǎn)業(yè)的發(fā)展路徑,也是是涌現(xiàn)的“增程器”,指借助生態(tài)這一模式,跨越軟件與硬件之間的邊界、影像和文本之間的邊界、環(huán)節(jié)與流程之間的邊界,生成跨場(chǎng)景的多模態(tài)數(shù)據(jù)與多線程能力。這個(gè)過(guò)程,“融合”可為“涌現(xiàn)”供給多元、巨量的數(shù)據(jù)。
“融合”與“涌現(xiàn)”貫穿了整個(gè)世界人工智能大會(huì),其中的健康高峰論壇同樣試圖探究這兩個(gè)詞的背后邏輯。
然后將它應(yīng)用于未來(lái)的醫(yī)療領(lǐng)域。
天壤之別,醫(yī)療大模型不能套用通用大模型
與通用領(lǐng)域相比,醫(yī)療領(lǐng)域的大模型雖有相似之處,但在模型的設(shè)計(jì)、訓(xùn)練、應(yīng)用等環(huán)節(jié)方面均有天壤之別。
“定位”是醫(yī)療大模型與通用大模型最大的相似之處。無(wú)論是過(guò)去的機(jī)器學(xué)習(xí)、后續(xù)的深度學(xué)習(xí)還是如今的生成式AI及大語(yǔ)言模型,AI的本質(zhì)都是一種“工具的工具”,以“賦能”為價(jià)值實(shí)現(xiàn)路徑。AI——至少現(xiàn)階段的AI——不會(huì)成為一個(gè)醫(yī)生,也不會(huì)獨(dú)立研制一款藥物,否則Google、Microsoft早該撕下科技公司的標(biāo)簽,成為世界級(jí)的制藥公司。
“場(chǎng)景需求”、“訓(xùn)練數(shù)據(jù)”、“應(yīng)用對(duì)象”構(gòu)成了醫(yī)療大模型與通用大模型的差異,三個(gè)要點(diǎn)將兩類(lèi)模型遠(yuǎn)遠(yuǎn)分隔開(kāi),開(kāi)啟了各自的發(fā)展路徑。
先談“場(chǎng)景需求”。周翔在演講中對(duì)于兩者之間的場(chǎng)景需求差異進(jìn)行了完整解釋?zhuān)J(rèn)為通用的語(yǔ)言大模型不能完全滿(mǎn)足醫(yī)療場(chǎng)景需求原因有三:
首先,醫(yī)療行業(yè)的專(zhuān)業(yè)性與嚴(yán)肅性毋庸置疑,醫(yī)療場(chǎng)景對(duì)問(wèn)題的容錯(cuò)率低,這自然對(duì)語(yǔ)言大模型提出了更高的要求,即AI需要基于醫(yī)療專(zhuān)業(yè)語(yǔ)料給出更專(zhuān)業(yè)、更精準(zhǔn)的醫(yī)療建議;其次,目前醫(yī)療數(shù)據(jù)中有超過(guò)90%的數(shù)據(jù)來(lái)自于醫(yī)學(xué)影像,這也意味著一個(gè)切實(shí)有效的、能作復(fù)雜決策的醫(yī)療人工智能大模型,需要融合醫(yī)學(xué)影像、文本,甚至語(yǔ)音或是視頻等多模態(tài)信息以賦能各種醫(yī)療場(chǎng)景。最后,考慮到現(xiàn)階段醫(yī)院實(shí)際的部署環(huán)境和數(shù)據(jù)安全性要求,“大模型”不能無(wú)限“大”,院內(nèi)應(yīng)用的可及性是必須考慮的一環(huán)。
其次是“訓(xùn)練數(shù)據(jù)”。醫(yī)療數(shù)據(jù)多模態(tài)的特性實(shí)際上是對(duì)整個(gè)數(shù)據(jù)集的稀釋?zhuān)瑢⒑A酷t(yī)療大數(shù)據(jù)分散至各個(gè)場(chǎng)景中,每個(gè)子數(shù)據(jù)集的數(shù)量很難沖破系統(tǒng)發(fā)生涌現(xiàn)效應(yīng)需要的閾值。
已經(jīng)發(fā)布的醫(yī)療大模型大都聚焦于文本數(shù)據(jù)方面,譬如醫(yī)聯(lián)新近發(fā)布的MedGPT,便是鏈接了主訴、復(fù)診、購(gòu)藥等醫(yī)患文本溝通的環(huán)節(jié),尚未將影像數(shù)據(jù)接入大模型。
從長(zhǎng)期看,大模型在醫(yī)療領(lǐng)域充分釋放價(jià)值仍需要影像大數(shù)據(jù)助力。如今的CV、隱私計(jì)算等算法相關(guān)技術(shù)已經(jīng)到了應(yīng)用階段,反而是算力分配基礎(chǔ)設(shè)施、影像數(shù)據(jù)數(shù)據(jù)量?jī)身?xiàng)要素成了制約模型發(fā)展的關(guān)鍵所在。因此,算力分配、影像大數(shù)據(jù)等基礎(chǔ)設(shè)施建設(shè)及跨醫(yī)院數(shù)據(jù)集的構(gòu)建仍需推進(jìn),這需要數(shù)據(jù)管理方在觀念上進(jìn)行改變,并輔以時(shí)間的堆砌,實(shí)現(xiàn)醫(yī)療領(lǐng)域自有的“融合”。
最后是“應(yīng)用對(duì)象”。醫(yī)療大模型的服務(wù)方絕大多數(shù)為B端、G端,是一個(gè)極為嚴(yán)肅的領(lǐng)域,需要精準(zhǔn)的判斷并給出支撐判斷的證據(jù),不能像通用語(yǔ)言模型那樣給出一個(gè)模棱兩可的答案,繪制要素堆砌的圖像——這需要醫(yī)療大模型在結(jié)論精度上進(jìn)行提升,給出精準(zhǔn)的決策及建議。
9個(gè)方向,醫(yī)療大模型的“涌現(xiàn)”與“融合”
厘清大模型差異的目的是為了確立大模型的發(fā)展路徑。對(duì)于醫(yī)療大模型而言,這些差異的存在意味著它不能復(fù)刻通用大模型取得的“涌現(xiàn)”與“融合”,而需走出一條獨(dú)特的道路改進(jìn)模型、探尋價(jià)值。
健康高峰論壇上,中國(guó)信通院云大所副所長(zhǎng)閔棟便對(duì)醫(yī)療大模型可能的應(yīng)用方向進(jìn)行了完整概括,總計(jì)9點(diǎn),或能為這一新興行業(yè)的發(fā)展給予啟迪。
1、輔助診斷、輔助決策
相對(duì)于傳統(tǒng)CDSS而言,大模型的訓(xùn)練數(shù)據(jù)來(lái)源更為廣泛,自我凈化能力更為高效,因而能為CDSS帶來(lái)較大幅度的提升。
輔助診斷方面,醫(yī)生在診斷中需要調(diào)動(dòng)大量醫(yī)學(xué)知識(shí),記憶大量的患者信息,常會(huì)出現(xiàn)疲憊的問(wèn)題。此類(lèi)大模型的引入可以幫助醫(yī)生記錄信息,緩解疲勞。同時(shí),大模型還能通過(guò)學(xué)習(xí)電子病歷、醫(yī)學(xué)文獻(xiàn)等數(shù)據(jù)同醫(yī)生進(jìn)行一些語(yǔ)言互動(dòng),提升診斷的準(zhǔn)確性及效率。兩條作用路徑均能提升醫(yī)生診斷質(zhì)量、診斷效率。
2、治療方案生成
可在急救藥學(xué)服務(wù)、骨科、細(xì)菌感染等領(lǐng)域接受患者后迅速生成治療方案。尤其是在急救場(chǎng)景中,大模型在急救過(guò)程中迅速根據(jù)患者信息生成治療方案,可以輔助醫(yī)生更快做出診斷,為患者謀取更多救治時(shí)間。
3、質(zhì)控
可對(duì)結(jié)構(gòu)化的醫(yī)療文書(shū)進(jìn)行自動(dòng)錄入、形式質(zhì)控、內(nèi)涵質(zhì)控。各個(gè)醫(yī)生書(shū)寫(xiě)習(xí)慣不同,精力有限,大模型可快速的生成規(guī)范醫(yī)療文書(shū)模板,該模板具備質(zhì)控邏輯清晰、內(nèi)容表達(dá)豐富等特征,能夠按照標(biāo)準(zhǔn)準(zhǔn)確錄入文書(shū),減輕醫(yī)生在書(shū)寫(xiě)、檢查等環(huán)節(jié)的負(fù)擔(dān)。
4、患者服務(wù)
可通過(guò)通俗的語(yǔ)言為患者進(jìn)行導(dǎo)診、答疑。傳統(tǒng)的患者教育需要醫(yī)生投入大量精力進(jìn)行編寫(xiě),并在專(zhuān)業(yè)性、易讀性方面這個(gè)取得平衡,還會(huì)常常在后續(xù)溝通中為患者釋疑。大模型可以針對(duì)患者母語(yǔ)背景生成相關(guān)的患教資料;與患者對(duì)話(huà)提供患者需要的信息。
5、醫(yī)院管理
可生成醫(yī)院管理所需的各類(lèi)表單,為醫(yī)院管理者提供輔助管理決策支持,統(tǒng)計(jì)包含醫(yī)生基礎(chǔ)信息、臨床能力、醫(yī)院后勤、醫(yī)院財(cái)務(wù)等各個(gè)方面的數(shù)據(jù),然后生成匹配醫(yī)院現(xiàn)狀的動(dòng)態(tài)管理計(jì)劃,對(duì)醫(yī)療資源進(jìn)行一個(gè)智能高效的配置。以醫(yī)療設(shè)備管理為例,大模型可以規(guī)劃各項(xiàng)醫(yī)療設(shè)備采購(gòu)、維護(hù)計(jì)劃,生成維修相關(guān)表單,有效提高管理效率。
6、教科研
研究方面,可在選題立項(xiàng)、研究方案設(shè)計(jì)、結(jié)果分析、成果編寫(xiě)方面發(fā)揮很大作用。需要注意的是,大模型也會(huì)出現(xiàn)偽造參考文獻(xiàn)引文、無(wú)法甄別科研貢獻(xiàn),無(wú)法對(duì)于生成內(nèi)容負(fù)責(zé)等等問(wèn)題,有待后續(xù)逐一解決。
教育方面,可協(xié)助醫(yī)生編寫(xiě)教案,替代醫(yī)生解答部分問(wèn)題。醫(yī)生在履行教學(xué)職能時(shí)需耗費(fèi)大量時(shí)間編寫(xiě)教案,回答學(xué)生提出的各類(lèi)高重復(fù)度問(wèn)題,導(dǎo)致有臨床、科研任務(wù)的醫(yī)生其精力被重復(fù)性勞動(dòng)占用。大模型的引入可以分擔(dān)醫(yī)生壓力,如輔導(dǎo)第一年資學(xué)生的學(xué)習(xí),將醫(yī)生從醫(yī)學(xué)教學(xué)的任務(wù)中解放出來(lái),幫助其專(zhuān)注臨床科研工作。
7、中醫(yī)
中醫(yī)常面臨其醫(yī)療知識(shí)難以顯性化、結(jié)構(gòu)化的問(wèn)題,導(dǎo)致知識(shí)傳承相對(duì)困難。引入大模型可對(duì)中醫(yī)相關(guān)知識(shí)進(jìn)行數(shù)據(jù)挖掘,推動(dòng)相關(guān)知識(shí)體系的構(gòu)建,以標(biāo)準(zhǔn)化的形式為患者生成診療方案。
8、藥物研發(fā)、銷(xiāo)售
研發(fā)方面,大模型可在藥物發(fā)現(xiàn)、臨床前研究等環(huán)節(jié)中的提高靶點(diǎn)發(fā)現(xiàn)效率,構(gòu)建復(fù)雜分子;亦可在臨床實(shí)驗(yàn)環(huán)節(jié)對(duì)臨床試驗(yàn)的設(shè)計(jì)思路、統(tǒng)計(jì)方法的推薦等等方面提供支撐,極大提升藥物研發(fā)效率。
銷(xiāo)售方面,可在藥物市場(chǎng)推廣時(shí)以自動(dòng)化、智能化的方式連接目標(biāo)用戶(hù),降低營(yíng)銷(xiāo)成本,提升營(yíng)銷(xiāo)效率。
9、公共衛(wèi)生
用于輔助流行病學(xué)的大數(shù)據(jù)分析及趨勢(shì)判斷。由于傳播方式和傳播路徑具備復(fù)雜性、偶然性,疾病發(fā)展的不確信性和變化性非常大,超出常規(guī)算法的能力范疇。相比之下,大模型可以對(duì)流行病學(xué)的大數(shù)據(jù)分析和這個(gè)預(yù)測(cè)進(jìn)行有效支撐,給出較為精確的判斷。目前國(guó)內(nèi)外擁有大量研究機(jī)構(gòu)和醫(yī)院進(jìn)行相關(guān)探索,并已取得了不錯(cuò)的研究結(jié)果。
標(biāo)準(zhǔn)與倫理,制約大模型?保護(hù)大模型?
我們無(wú)法判斷上述的9個(gè)方向哪一個(gè)會(huì)最先跑出優(yōu)質(zhì)的醫(yī)療大模型成果,但可以確定的是,要實(shí)現(xiàn)大模型的蓬勃發(fā)展,必須創(chuàng)造一個(gè)包容企業(yè)、醫(yī)院、高校、研究機(jī)構(gòu)等角色發(fā)力的舞臺(tái)。這需要需監(jiān)管機(jī)構(gòu)出臺(tái)法案,行業(yè)專(zhuān)家出臺(tái)標(biāo)準(zhǔn)共識(shí),為大模型盡早創(chuàng)造公平的競(jìng)爭(zhēng)環(huán)境,引導(dǎo)科技朝著向善的方向發(fā)展。
健康高峰論壇上,中國(guó)信息通信研究院、國(guó)家衛(wèi)生健康委醫(yī)療管理服務(wù)指導(dǎo)中心、中國(guó)信通院上海工創(chuàng)中心、訊飛醫(yī)療科技股份有限公司、北京協(xié)和醫(yī)院、復(fù)旦大學(xué)智能醫(yī)學(xué)研究院、華中科技大學(xué)同濟(jì)醫(yī)學(xué)院、中國(guó)科學(xué)技術(shù)大學(xué)附屬第一醫(yī)院、國(guó)家骨科與運(yùn)動(dòng)康復(fù)臨床醫(yī)學(xué)研究中心、心血管健康聯(lián)盟共同參與了 醫(yī)療健康行業(yè)大模型標(biāo)準(zhǔn)研究啟動(dòng)儀式,踏出了推動(dòng)醫(yī)療大模型規(guī)范發(fā)展的第一步。
未來(lái),以中國(guó)信通院為首的機(jī)構(gòu)們將加速開(kāi)展前沿研究;研制符合醫(yī)療健康行業(yè)應(yīng)用特色的AI大模型三層技術(shù)標(biāo)準(zhǔn)框架(基礎(chǔ)設(shè)施層、模型層、應(yīng)用層);從數(shù)據(jù)處理、算法模型、服務(wù)管理等三個(gè)層面,依托實(shí)驗(yàn)室開(kāi)展醫(yī)療AI大模型合規(guī)性、安全性、可控性、可靠性評(píng)估,促進(jìn)行業(yè)在發(fā)展中規(guī)范,在規(guī)范中發(fā)展。
標(biāo)準(zhǔn)研究之外,生成式AI的倫理問(wèn)題也是今年世界人工智能大會(huì)討論的核心。《生成式AI倫理與治理倡議書(shū)》、《人工智能醫(yī)學(xué)影像倫理手冊(cè)》相繼發(fā)布,一方面要解決當(dāng)代AI遺留的可信問(wèn)題、隱私問(wèn)題、醫(yī)療問(wèn)題;另一方面要為生成式AI做好準(zhǔn)備,防止新興技術(shù)身處濫用的境地。
對(duì)于世界人工智能大會(huì)的各類(lèi)標(biāo)準(zhǔn)制定,現(xiàn)場(chǎng)中專(zhuān)家們的聲音并不統(tǒng)一。有專(zhuān)家認(rèn)為:醫(yī)療行業(yè)需謹(jǐn)慎對(duì)待新技術(shù)的發(fā)展,借助層層標(biāo)準(zhǔn)解構(gòu)技術(shù),在保證可信的前提下實(shí)現(xiàn)技術(shù)落地,既是對(duì)患者的保護(hù),也是對(duì)AI技術(shù)本身的保護(hù)。
也有專(zhuān)家認(rèn)為:技術(shù)和監(jiān)管不會(huì)協(xié)同發(fā)展,總是螺旋上升。因此,面對(duì)新興技術(shù), 應(yīng)盡力探尋監(jiān)管行為最為合適的“度”,避免過(guò)輕監(jiān)管導(dǎo)致技術(shù)的應(yīng)用偏離的向善的方向,也避免過(guò)度監(jiān)管抑制了技術(shù)的應(yīng)用與創(chuàng)新。
理性看待醫(yī)療大模型
盡管世界人工智能大會(huì)的每一個(gè)論壇都被大模型、生成式AI所包圍,但仍有一部分企業(yè)堅(jiān)持著自己的思路,按部就班的發(fā)展自己的AI應(yīng)用。
譬如GE醫(yī)療便在論壇之上發(fā)布了無(wú)關(guān)于大模型的《2023創(chuàng)想健康新未來(lái)報(bào)告》,并將愛(ài)迪生數(shù)字醫(yī)療生態(tài)全新升級(jí)到了2.0;數(shù)坤科技董事長(zhǎng)毛新生談的是中國(guó)AI的創(chuàng)新,要在心血管疾病、肺部疾病等領(lǐng)域做出原創(chuàng)的符合中國(guó)人特征的AI產(chǎn)品;91360則專(zhuān)注于數(shù)字病理的創(chuàng)新,仍在努力解決乳腺癌等常見(jiàn)癌種的篩查問(wèn)題。
畢竟,當(dāng)下醫(yī)療大模型“涌現(xiàn)”與“融合”的產(chǎn)物沒(méi)有跳出深度學(xué)習(xí)一代AI的應(yīng)用范疇,也尚未展示新的商業(yè)路徑,解決各類(lèi)AI長(zhǎng)期面臨的高成本低收益問(wèn)題。它還需要時(shí)間積累,既要完成技術(shù)的自我涌現(xiàn),又要深入臨床,與醫(yī)療進(jìn)行深度融合。
在抵達(dá)那個(gè)關(guān)鍵閾值之前,當(dāng)代醫(yī)療AI不能遺棄。