文|動(dòng)脈網(wǎng)
千禧年后的第二個(gè)十年,移動(dòng)醫(yī)療、人工智能等前沿技術(shù)的發(fā)展喚起醫(yī)療數(shù)據(jù)的需求。作為算法、算力、數(shù)據(jù)三要素中最常見但又最難獲取的要素,醫(yī)療數(shù)據(jù)彼時(shí)仍以碎片化、非標(biāo)準(zhǔn)化的形態(tài)分散于醫(yī)院各個(gè)系統(tǒng)中。為了尋找智能模型所需的養(yǎng)料,大量科技醫(yī)療創(chuàng)業(yè)公司找到三級醫(yī)院進(jìn)行合作,在幫助醫(yī)院進(jìn)行數(shù)據(jù)治理的同時(shí),打造智慧化的臨床應(yīng)用。
醫(yī)院科室的參與、政策對于信息化建設(shè)的強(qiáng)制要求,合力促使醫(yī)院圍繞互聯(lián)互通、智慧醫(yī)院等方向開啟規(guī)模化建設(shè)。不少醫(yī)院開始打造醫(yī)院大數(shù)據(jù)中心、科研級大數(shù)據(jù)平臺,完成了醫(yī)療大數(shù)據(jù)基礎(chǔ)設(shè)施的構(gòu)造,也與企業(yè)合作開發(fā)了不少智慧化的應(yīng)用。
但在2019年中美貿(mào)易爭端開啟后,包含個(gè)人私密信息醫(yī)療數(shù)據(jù)成為關(guān)注重點(diǎn)之一。由于對此類數(shù)據(jù)進(jìn)行治理、集成、應(yīng)用存在一定泄露風(fēng)險(xiǎn),醫(yī)院與企業(yè)的合作目的開始轉(zhuǎn)變。
為避免政策風(fēng)險(xiǎn)帶來的不確定性,不少醫(yī)院期望大數(shù)據(jù)及其研究結(jié)果以醫(yī)院范圍為界限展開,使得醫(yī)療大數(shù)據(jù)的研究重心轉(zhuǎn)向醫(yī)院科研需求。此趨勢下,醫(yī)療大數(shù)據(jù)產(chǎn)業(yè)轉(zhuǎn)化一定程度減少,醫(yī)療大數(shù)據(jù)行業(yè)發(fā)展整體放慢。
不過,政治因素并非鉗制醫(yī)療大數(shù)據(jù)發(fā)展的唯一因素,更需關(guān)注的是該類建設(shè)投資回報(bào)及參與度問題。
對于絕大多數(shù)而言醫(yī)院而言,院內(nèi)外規(guī)范化的IT建設(shè)是一項(xiàng)難以計(jì)量回報(bào)的投資,在缺乏合適的工具估算大數(shù)據(jù)建設(shè)的產(chǎn)出時(shí),醫(yī)院對于相關(guān)投資仍然持有保守態(tài)度。
此外,要讓該項(xiàng)建設(shè)發(fā)揮價(jià)值,醫(yī)院動(dòng)用資金支持僅是一部分,更重要的是醫(yī)院深入了解醫(yī)療大數(shù)據(jù)建設(shè)內(nèi)容,將系統(tǒng)與業(yè)務(wù)有效融合,才能構(gòu)造行之有效的大數(shù)據(jù)體系。
從目前來看,院內(nèi)已存在各類標(biāo)準(zhǔn)推動(dòng)醫(yī)療數(shù)據(jù)的互通互認(rèn)、治理應(yīng)用,但還需完整做好每一類場景全流程數(shù)據(jù)的收集、清洗、歸納、存儲(chǔ)都一系列步驟,形成多模態(tài)、跨流程、可服務(wù)于應(yīng)用的大數(shù)據(jù),真正將醫(yī)療數(shù)據(jù)沉淀下來。但就目前而言,醫(yī)院缺乏積極性,去實(shí)踐全流程、高參與度的數(shù)據(jù)治理。
將數(shù)據(jù)的“生產(chǎn)要素”屬性應(yīng)用起來或是上述種種問題的解決之道。畢竟,只有將醫(yī)療大數(shù)據(jù)的被動(dòng)應(yīng)用轉(zhuǎn)變?yōu)橹鲃?dòng)管理,才談得上用好醫(yī)療大數(shù)據(jù),才有幾乎觸及數(shù)據(jù)的“流通”。
挖掘數(shù)據(jù)的“生產(chǎn)要素”價(jià)值:政策技術(shù)雙重助力
自2020年4月,中共中央、國務(wù)院印發(fā)《關(guān)于構(gòu)建更加完善的要素市場化配置體制機(jī)制的意見》,將“數(shù)據(jù)”列為勞動(dòng)力、土地、資本等之外的第五大生產(chǎn)要素后,幾乎每隔一段時(shí)間都會(huì)新增大數(shù)據(jù)的利好政策,推動(dòng)這一行業(yè)的發(fā)展。
具體而言,2021年11月,《“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃》提出了一個(gè)精確的總體目標(biāo),要求“到2025年我國大數(shù)據(jù)產(chǎn)業(yè)測算規(guī)模突破3萬億元,年均復(fù)合增長率保持25%左右,創(chuàng)新力強(qiáng)、附加值高、自主可控的現(xiàn)代化大數(shù)據(jù)產(chǎn)業(yè)體系基本形成。”
2022年12月,《中共中央 國務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》(后簡稱:數(shù)據(jù)二十條)對外發(fā)布則以構(gòu)建基礎(chǔ)制度為目標(biāo),從數(shù)據(jù)產(chǎn)權(quán)、流通交易、收益分配、安全治理等四個(gè)方面,對制定數(shù)據(jù)基礎(chǔ)制度進(jìn)行了全面部署,最終構(gòu)建公平與效率相統(tǒng)一的數(shù)據(jù)要素按貢獻(xiàn)參與分配的制度。
2023年3月,國家數(shù)據(jù)局組建完畢,中央網(wǎng)絡(luò)安全和信息化委員會(huì)辦公室、國家發(fā)展和改革委員會(huì)共同管理,兩大機(jī)構(gòu)將在后續(xù)協(xié)調(diào)推進(jìn)數(shù)據(jù)基礎(chǔ)制度建設(shè),統(tǒng)籌數(shù)據(jù)資源整合共享和開發(fā)利用,統(tǒng)籌推進(jìn)數(shù)字中國、數(shù)字經(jīng)濟(jì)、數(shù)字社會(huì)規(guī)劃和建設(shè)等。
圖片來源:蛋殼研究院
技術(shù)方面的迭代同樣推動(dòng)人們重新審視數(shù)據(jù)這一生產(chǎn)要素的價(jià)值。2022年末,大語言模型(LLM)ChatGPT的火熱帶動(dòng)人們重新審視人工智能的價(jià)值,并聚焦于背后支撐應(yīng)用的技術(shù)生成式AI(Generative AI)。2023年開始,不少醫(yī)療IT公司、醫(yī)療AI公司、互聯(lián)網(wǎng)醫(yī)療公司均已開發(fā)出自己的大語言模型,并嘗試在醫(yī)院場景之中開發(fā)各項(xiàng)新式AI應(yīng)用。
拆解這一新興人工智能仍是算法、算力、數(shù)據(jù)、知識四要素,但對于國內(nèi)企業(yè)而言,算法部分均用的開源模型,算力可以根據(jù)需求購置GPU實(shí)現(xiàn),知識可以通過向權(quán)威知識庫購買或達(dá)成戰(zhàn)略合作得到,唯獨(dú)數(shù)據(jù)需要企業(yè)與醫(yī)院達(dá)成合作,在脫敏、不出院的情況下訓(xùn)練模型。
政策與技術(shù)雙向驅(qū)動(dòng),醫(yī)療大數(shù)據(jù)產(chǎn)業(yè)再度火熱。如今,更多醫(yī)院開始參與大數(shù)據(jù)基礎(chǔ)及應(yīng)用建設(shè),大企業(yè)們也嗅到風(fēng)向,廣泛參與其中,為產(chǎn)業(yè)注入新的活力。
新一代醫(yī)院數(shù)據(jù)中心,拉開千億市場序幕
要將數(shù)據(jù)有效的利用起來,第一步總是收集數(shù)據(jù)。伴隨信息技術(shù)和網(wǎng)絡(luò)技術(shù)的跨越式發(fā)展,現(xiàn)代醫(yī)院的運(yùn)營特征表現(xiàn)為醫(yī)療業(yè)務(wù)的智能化與應(yīng)用部署的敏捷化,使得醫(yī)院業(yè)務(wù)產(chǎn)生的信息朝著復(fù)雜化、專業(yè)化、海量化的方向發(fā)展,并對各系統(tǒng)之間的互聯(lián)互通提出更高層級的要求。
此趨勢下,圍繞網(wǎng)絡(luò)帶寬、服務(wù)器性能、交換機(jī)處理能力等設(shè)備運(yùn)行特征建設(shè)數(shù)據(jù)中心機(jī)房的思路無法應(yīng)對新型數(shù)據(jù)結(jié)構(gòu)下涌現(xiàn)的數(shù)據(jù)安全保障、線上業(yè)務(wù)支撐、數(shù)據(jù)資產(chǎn)管理等需求,亟需引入新的IT架構(gòu)來應(yīng)對新的業(yè)務(wù)對計(jì)算資源、存儲(chǔ)資源、網(wǎng)絡(luò)資源的新要求。
因此,部分醫(yī)院開始轉(zhuǎn)變信息化建設(shè)思路,借助云技術(shù)打造新一代醫(yī)院數(shù)據(jù)中心,綜合利用各類數(shù)據(jù)服務(wù)臨床、決策和科研過程,提高醫(yī)院管理的科學(xué)化、規(guī)范化、精細(xì)化水平。
新一代醫(yī)院數(shù)據(jù)中心架構(gòu)(數(shù)據(jù)來源:蛋殼研究院、《新一代醫(yī)院數(shù)據(jù)中心建設(shè)指導(dǎo)》)
傳統(tǒng)大數(shù)據(jù)中心分為兩類形式。一類是以業(yè)務(wù)支撐為主、整合電子病歷的臨床數(shù)據(jù)中心(CDR),其作用是支撐日常的醫(yī)療活動(dòng),收集與呈現(xiàn)醫(yī)療過程中的數(shù)據(jù),繪制常規(guī)報(bào)表統(tǒng)計(jì)等。另一類以管理和科研為主的大數(shù)據(jù)中心,其作用是面向臨床研究、醫(yī)院管理與智能產(chǎn)品開發(fā),滿足科研、管理活動(dòng)中的數(shù)據(jù)批量處理的挖掘與分析需求。
目前國內(nèi)大部分全院級CDR完成了醫(yī)院各業(yè)務(wù)數(shù)據(jù)的物理匯聚,但數(shù)據(jù)質(zhì)量仍處于原始狀態(tài),對數(shù)據(jù)的深層架構(gòu)與邏輯關(guān)系尚未進(jìn)行梳理,針對現(xiàn)有CDR開展臨床相關(guān)的數(shù)據(jù)分析挖掘仍具有極大困難。
此外,由于不同科研數(shù)據(jù)庫一般采用自定義的數(shù)據(jù)模型,在建立多中心數(shù)據(jù)池、數(shù)據(jù)共享或數(shù)據(jù)合并時(shí)需要花費(fèi)大量時(shí)間和資源進(jìn)行數(shù)據(jù)映射和重新編碼,一旦出錯(cuò)很容易導(dǎo)致計(jì)算機(jī)數(shù)據(jù)調(diào)用、分析過程和結(jié)果出現(xiàn)混亂。
要解決傳統(tǒng)大數(shù)據(jù)中心存在的問題,新一代大數(shù)據(jù)中心應(yīng)具備以下能力。
1、滿足醫(yī)院創(chuàng)新業(yè)務(wù)需求。提供多種大數(shù)據(jù)應(yīng)用開發(fā)工具并支撐大數(shù)據(jù)應(yīng)用部署,例如利用NLP從海量電子病歷數(shù)據(jù)中提取知識,輔助臨床科研;利用深度學(xué)習(xí)從海量的醫(yī)學(xué)影像中訓(xùn)練人工智能模型,輔助醫(yī)生臨床診斷。
2、滿足醫(yī)院管理發(fā)展的需求。支撐人工智能應(yīng)用為醫(yī)院運(yùn)營管理提供更深的洞察和更敏捷的反應(yīng);支撐實(shí)時(shí)流計(jì)算,能夠應(yīng)用大數(shù)據(jù)分析技術(shù)并將分析結(jié)果實(shí)時(shí)反饋到臨床業(yè)務(wù);支撐邊緣計(jì)算與物聯(lián)網(wǎng)技術(shù)實(shí)現(xiàn)智慧后勤。
3、滿足醫(yī)院智慧應(yīng)用配置需求。支持搭建安全、有彈性、可擴(kuò)展的對外服務(wù)平臺;支撐區(qū)塊鏈等創(chuàng)新技術(shù)解決數(shù)據(jù)共享、流通、歸集和安全問題。
4、滿足跨部門業(yè)務(wù)協(xié)同需求。支撐云網(wǎng)融合技術(shù),能夠在保證內(nèi)外網(wǎng)間數(shù)據(jù)交換的安全性的前提下以打通院內(nèi)系統(tǒng)、外部系統(tǒng)及云上系統(tǒng),以實(shí)現(xiàn)醫(yī)院業(yè)務(wù)的連續(xù)性。
5、滿足數(shù)據(jù)治理需求。可提供的全局?jǐn)?shù)據(jù)服務(wù)需要覆蓋數(shù)據(jù)標(biāo)準(zhǔn)管理、基礎(chǔ)數(shù)據(jù)管理、數(shù)據(jù)采集、數(shù)據(jù)匯聚、數(shù)據(jù)深度加工、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全管理等對數(shù)據(jù)的全生命周期治理服務(wù)。
6、滿足數(shù)據(jù)服務(wù)需求。支撐醫(yī)院內(nèi)部實(shí)現(xiàn)系統(tǒng)互聯(lián)互通和數(shù)據(jù)對接共享的需要;醫(yī)院提升海量數(shù)據(jù)資源質(zhì)量的需要,數(shù)據(jù)驅(qū)動(dòng)醫(yī)院進(jìn)行科學(xué)決策的需要,面對數(shù)據(jù)安全風(fēng)險(xiǎn)的需要。
當(dāng)然,除了建設(shè)新一代醫(yī)院數(shù)據(jù)中心外,醫(yī)院也需補(bǔ)全影像數(shù)據(jù)中心、臨床科研數(shù)據(jù)庫等基礎(chǔ)設(shè)施的建設(shè),進(jìn)一步做好數(shù)據(jù)的治理歸納,已在后續(xù)的應(yīng)用之中更好地發(fā)揮價(jià)值。
大語言模型,數(shù)據(jù)治理的新動(dòng)力?
盡管NLP的發(fā)展有力推進(jìn)了智慧醫(yī)院的建設(shè),但落在具體場景中,如自動(dòng)書寫病案、智能問診、智能隨訪等,該技術(shù)仍然沒有脫離關(guān)鍵詞映射數(shù)據(jù)庫的邏輯,沒有能夠真正做到智慧智能。
大語言模型(LLM)的出現(xiàn)能夠一定程度解決現(xiàn)有技術(shù)面臨的智能程度不夠問題。在分析文本類信息時(shí),LLM不僅能夠從大量給定信息中找到任務(wù)需要的關(guān)鍵項(xiàng),還能對未知信息進(jìn)行預(yù)設(shè),綜合上下文做出推理。
相較于千億級參數(shù)的通用大模型,醫(yī)療中文本類大模型的參數(shù)可控制于100萬以內(nèi),包含文本與多模態(tài)影像的大模型參數(shù)可控制于500萬內(nèi),因而非頭部互聯(lián)網(wǎng)公司也能參與醫(yī)療LLM的建設(shè)。
醫(yī)療大模型企業(yè)產(chǎn)業(yè)圖譜(截至2023年9月20日,數(shù)據(jù)來源:蛋殼研究院)
不過,從概念到落地,現(xiàn)階段的醫(yī)療LLM仍需解決兩個(gè)問題。
一是部署。當(dāng)企業(yè)將大模型部署至醫(yī)院時(shí),需要醫(yī)院購置相應(yīng)GPU驅(qū)動(dòng)模型運(yùn)行。通常而言,服務(wù)一個(gè)科室的應(yīng)用需要的GPU成本在數(shù)千元左右,但要負(fù)擔(dān)全院需求,醫(yī)院可能劃分百萬元級的成本購置芯片,因此,要推動(dòng)LLM應(yīng)用大規(guī)模落地,一方面需要推動(dòng)醫(yī)院主動(dòng)部署LLM運(yùn)行環(huán)境,另一方面需要企業(yè)方優(yōu)化模型,盡可能降低醫(yī)院在基礎(chǔ)設(shè)施方面付出的成本。
二是應(yīng)用。目前基于LLM構(gòu)建的智能應(yīng)用仍然沒有脫離傳統(tǒng)醫(yī)療IT應(yīng)用的范疇,如病案質(zhì)控、智能問診等,企業(yè)需要圍繞醫(yī)院需求構(gòu)造“殺手級”應(yīng)用,喚起醫(yī)院購置的LLM的需求,進(jìn)而實(shí)現(xiàn)LLM 的規(guī)模落地。
構(gòu)建LLM需要的成本不菲,且需大量醫(yī)療數(shù)據(jù),因而競爭仍存在于頭部醫(yī)療IT企業(yè)與互聯(lián)網(wǎng)企業(yè)間。由于LLM應(yīng)用需置于醫(yī)療信息系統(tǒng)中,因而非醫(yī)療IT公司只能使用外掛的方式進(jìn)入IT環(huán)境,操作流暢性受限,相較之下,擁有醫(yī)療信息管理系統(tǒng)的醫(yī)療IT公司占有優(yōu)勢。同時(shí),LLM對于醫(yī)院的架構(gòu)要求嚴(yán)苛,能夠支持AI應(yīng)用的智能架構(gòu)將比傳統(tǒng)EA企業(yè)架構(gòu)更好展現(xiàn)LLM的能力界限。
此外,現(xiàn)有的垂直醫(yī)療大模型幾乎都是基于臨床外的醫(yī)療數(shù)據(jù)培育而來。伴隨行業(yè)競爭的不斷加劇,臨床數(shù)據(jù)這一要素或?qū)⒅匦禄氐絃LM角逐的核心位置,進(jìn)一步推動(dòng)數(shù)據(jù)治理的進(jìn)行。
應(yīng)用級醫(yī)療大數(shù)據(jù)的交易可能
那么,從“生產(chǎn)要素”到“資產(chǎn)”,醫(yī)療數(shù)據(jù)還有多遠(yuǎn)?
與勞動(dòng)力、資本等生產(chǎn)要素相似,醫(yī)療數(shù)據(jù)的價(jià)值體現(xiàn)于應(yīng)用與流通過程。但無論是在數(shù)據(jù)平臺間應(yīng)用流轉(zhuǎn),還是未來他通過交易所變更歸屬主體,只要存在流動(dòng),必然會(huì)數(shù)據(jù)泄露、數(shù)據(jù)濫用等問題。因此,只有保障醫(yī)療數(shù)據(jù)流動(dòng)的安全,才能保障醫(yī)療大數(shù)據(jù)產(chǎn)業(yè)的良性發(fā)展。
此外,一個(gè)穩(wěn)定數(shù)據(jù)交易市場是保障數(shù)據(jù)流通效率的基礎(chǔ)所在。因而必須構(gòu)建數(shù)據(jù)的需求方和數(shù)據(jù)的擁有方的有效對接機(jī)制,形成穩(wěn)定的上下游的關(guān)系,并為數(shù)據(jù)所有者提供獲得專利權(quán)和著作權(quán)有國家知識產(chǎn)權(quán)保護(hù)等法律保護(hù)。
雖然國內(nèi)已有不少大數(shù)據(jù)交易所開始運(yùn)營,但數(shù)據(jù)要素流通市場整體形式仍較為單一,通過交易所掛牌數(shù)據(jù)較少,從量和質(zhì)上都無法滿足數(shù)據(jù)市場的需求。相較之下,大量的場外數(shù)據(jù)交易市場活躍,但缺乏有效監(jiān)管和安全保障。
醫(yī)療方面,已有不少交易所將為“醫(yī)療衛(wèi)生”數(shù)據(jù)設(shè)置交易品類,但絕大部分交易所該品類下并無供應(yīng)商品,僅貴州大數(shù)據(jù)交易所上架了一款“兒童構(gòu)音障礙早篩語音數(shù)據(jù)”的產(chǎn)品,售價(jià)25萬元,僅交易兩筆。
要實(shí)現(xiàn)從“生產(chǎn)要素”到“資產(chǎn)”的轉(zhuǎn)變,數(shù)據(jù)交易市場必須建立以政府為主導(dǎo)、市場化的數(shù)據(jù)要素交易機(jī)構(gòu)和服務(wù)平臺組成的體系。數(shù)據(jù)供應(yīng)方進(jìn)行有效的數(shù)據(jù)歸集、加工;外部機(jī)構(gòu)搭建平臺、輔助標(biāo)準(zhǔn)、提供安全;交易中心提供供需對接服務(wù),實(shí)現(xiàn)數(shù)據(jù)升值、數(shù)據(jù)變現(xiàn);監(jiān)管機(jī)構(gòu)保障市場監(jiān)管和質(zhì)控,營造良好的流通環(huán)境。
理想狀態(tài)下的數(shù)據(jù)要素平臺閉環(huán)(數(shù)據(jù)來源:蛋殼研究院)
總的來說,我國數(shù)據(jù)要素流通市場仍處于發(fā)展的初級階段,在數(shù)據(jù)交易需求持續(xù)高漲的趨勢下,一方面需要國家主導(dǎo)完善數(shù)據(jù)要素服務(wù)相關(guān)制度,引導(dǎo)培育數(shù)據(jù)要素交易市場,另一方面也需培養(yǎng)更多供應(yīng)商豐富數(shù)據(jù)供應(yīng)體系,并加大數(shù)據(jù)交易所傳播力度,最終實(shí)現(xiàn)在有效市場支撐下的數(shù)據(jù)供需匹配,讓各類數(shù)據(jù)要素高效安全地流通起來。