文|閆宏秀
上海交通大學科學史與科學文化研究院教授
數(shù)據(jù)作為一種新型生產要素所具有的基礎性戰(zhàn)略意義已經被各界所認可。
依據(jù)我國的《國家健康醫(yī)療大數(shù)據(jù)標準、安全和服務管理辦法(試行)》《中共中央國務院關于構建數(shù)據(jù)基礎制度更好發(fā)揮數(shù)據(jù)要素作用的意見》《數(shù)字中國建設整體布局規(guī)劃》等文件,技術賦能旨在人民幸福感的提升。
就AI醫(yī)療而言,數(shù)據(jù)是其必備條件。在我國,醫(yī)療本身就在于增進人民的福祉,且AI的發(fā)展本應向善、為善。因此,AI醫(yī)療的宗旨也應是以技術推進福祉。
然而,由于技術的不確定性與監(jiān)管的不完善,AI醫(yī)療中的數(shù)據(jù)問題頻發(fā)。其中,與“數(shù)據(jù)-隱私”相關的問題更為密集且普遍。
AI醫(yī)療中的“數(shù)據(jù)-隱私”困境
數(shù)據(jù)的質量、數(shù)量、獲取的正當性、使用的邊界、泄露等問題是當下全球數(shù)智化進程的重點與難點所在,特別是醫(yī)療數(shù)據(jù)的高敏感性與高隱私性使得數(shù)據(jù)的安全性備受關注。這種安全性從技術的視角來看,至少包括獲取安全、使用安全與存儲安全。 從理論上來講,應以合法合規(guī)和倫理的方式來釋放數(shù)據(jù)潛能,進而推進醫(yī)療創(chuàng)新。易言之,醫(yī)療數(shù)據(jù)應確?;颊叩闹闄嗪瓦x擇權,在數(shù)據(jù)流通的過程中應遵循公益性原則,且應確保數(shù)據(jù)的安全性和完整性。 然而,現(xiàn)實情況卻并非完全如此。如,存在不知情同意的數(shù)據(jù)獲取現(xiàn)象,存在即使患者是在知情同意的條件被獲取數(shù)據(jù),卻也并不一定能知曉數(shù)據(jù)未來可能會被如何使用的現(xiàn)象等。 2020年6月,英國 Babylon Health 的 GP app 出現(xiàn)軟件缺陷導致患者數(shù)據(jù)泄露[1];2024年9月,美國 AI 醫(yī)療保健公司 Confidant Health 的服務器配置錯誤,暴露了5.3 TB的敏感心理健康記錄,包括個人詳細信息、評估和醫(yī)療信息,給患者帶來了嚴重的隱私風險[2]等事件引發(fā)了患者和公眾對個人健康信息隱私和安全的深刻且合理的擔憂。 因此,在AI醫(yī)療發(fā)展的進程中,一方面是醫(yī)療行業(yè)需要海量、多樣化的高質量數(shù)據(jù)集以構建精準且可靠的AI模型,進而有效實現(xiàn)疾病的早期篩查、診斷與個性化治療等;另一方面是患者和公眾擔心數(shù)據(jù)可能被濫用、泄露或用于商業(yè)牟利的恐懼?;诖耍霈F(xiàn)了AI醫(yī)療中的“數(shù)據(jù)-隱私”困境。 當前圍繞AI醫(yī)療發(fā)展進程中的“數(shù)據(jù)-隱私”困境有著諸多爭議,并導致了一場曠日持久的辯論。“醫(yī)院應采集多少數(shù)據(jù)”恰恰是此中的一個關鍵問題,因為該問題是出現(xiàn)“數(shù)據(jù)-隱私”困境的緣起所在。 假設你是醫(yī)生或者醫(yī)療機構,你期望采集多少數(shù)據(jù)呢?假設你是患者,你期望醫(yī)療機構應當采集你的哪些數(shù)據(jù)呢? 那么,到底該如何看到這個問題呢? AI醫(yī)療中的應采集多少數(shù)據(jù) 是個怎樣的問題?
從個人信息保護的視角來看,過度數(shù)據(jù)采集顯然是既不合理更不應當。在知情同意的前提下,“按需收集、最小必要”的數(shù)據(jù)最小化原則是采集數(shù)據(jù)的有效措施,這種措施有利于降低數(shù)據(jù)泄露風險,保護患者隱私。 然而,不得不面對的情況是,若數(shù)據(jù)采集過少,雖然體現(xiàn)了采集過程中的隱私保護,但是卻會因數(shù)據(jù)不足或者代表性差而導致模型能力缺陷甚或偏見等,進而使得數(shù)據(jù)最小化原則在有些具體的技術研發(fā)與應用中,特別是某項技術本身所涉及的數(shù)據(jù)范圍尚未確定時,必將出現(xiàn)該原則落地難的現(xiàn)象。 因此,一種貌似零和博弈的僵局出現(xiàn),而這種僵局將限制AI賦能醫(yī)療的潛力。 事實上,這種僵局的出現(xiàn)至少可以從如下兩個方面進行解釋,一是源自將數(shù)據(jù)采集的“量”視為確保AI醫(yī)療有效性的預設。迄今為止,在AI醫(yī)療領域中,關于數(shù)據(jù)采集的“量”的多少往往很難形成共識;二是源自患者對于數(shù)據(jù)的共享意愿。肖納?卡爾克曼(Shona Kalkman)等通過定性和定量的研究發(fā)現(xiàn):信任的缺乏不利于數(shù)據(jù)共享的目標。 盡管參與者認識到數(shù)據(jù)研究的實際或潛在好處,但他們對違反保密性和可能濫用數(shù)據(jù)的情況表示擔憂,英國的 care.data 的失敗就是一個典型的警示[3]。 即,就數(shù)據(jù)共享而言,信任是患者是否愿意數(shù)據(jù)共享的關鍵所在。 因此,“AI醫(yī)療該采集多少數(shù)據(jù)是個怎樣的問題?”可被進一步轉化或者歸結為如何走出基于量的數(shù)據(jù)采集困擾,如何建立和維護信任。 超越數(shù)據(jù)采集 打造基于信任的AI醫(yī)療體系
長期以來,AI醫(yī)療的發(fā)展受制于高質量、大規(guī)模且合規(guī)的訓練數(shù)據(jù)。但事實上,伴隨技術的不斷發(fā)展,AI醫(yī)療的未來不應再糾纏于“采集多少數(shù)據(jù)”,真正的出路在于通過前瞻性的技術選擇與有效的AI醫(yī)療認知普及相融合,從根本上構建一個可信的AI醫(yī)療體系。 一 借助AI驅動的范式轉移,超越數(shù)據(jù)采集 在AI賦能的當下,對AI的充分理解是有效推進技術向善、為善的必要條件。面對數(shù)據(jù)采集的困境,不妨通過AI對人類科研、認知、生活方式的范式轉移的認知,來充分釋放已有數(shù)據(jù)的潛能。 如,使用生產對抗網絡(Generative Adversarial Networks, GANs)、變分自編碼器 (Variational Autoencoders, VAEs)、 擴散模型 (Diffusion Models)等技術將已有的數(shù)據(jù)進行合成,即合成數(shù)據(jù)生成(Synthetic Data Generation,SDG)來降低采集成本,以隱私保護技術的方式減少隱私泄露的風險,克服對于罕見病或特定少數(shù)族裔群體,現(xiàn)實世界中可供研究的數(shù)據(jù)樣本極其有限的數(shù)據(jù)稀缺性問題,進而提升AI醫(yī)療模型的公平性,縮短創(chuàng)新周期。 如,NVIDIA所的MAISI的醫(yī)療影像生成基礎模型,就是在通過提供一種可靠、高效的方式來生成可用于研究、臨床應用乃至外科機器人訓練的高質量合成圖像,從而克服數(shù)據(jù)稀缺和隱私限制的挑戰(zhàn)[4]。 但需要高度警惕的是,鑒于合成數(shù)據(jù)本質上依然是來自于真實記錄,進而仍然存在被重新識別的風險。因此,合成數(shù)據(jù)不是技術的肆意泛濫,而是重在對已有數(shù)據(jù)的高效使用,整個數(shù)據(jù)流程中的倫理監(jiān)管依然不能缺席,且需要重塑數(shù)據(jù)治理框架,務必注重源頭數(shù)據(jù)的倫理審查,特別是要高度重視合成數(shù)據(jù)過程中的知情同意。 二 以信任為基石,破解“數(shù)據(jù)-隱私”困境 破解“數(shù)據(jù)-隱私”困境的關鍵并非僅僅在于限制數(shù)據(jù)采集的多少,因為若醫(yī)患之間的關系是不信任的,若醫(yī)療機構本身不被信任,那么,患者對數(shù)據(jù)采集本身就很擔憂。 因此,不妨將破解的困境從數(shù)據(jù)采集本身的擔憂著手,打造一個AI驅動的、以信任為基石的醫(yī)療體系,在這里,技術創(chuàng)新與個人尊嚴不再對立,而是攜手并進,共同促進人類的健康與福祉。 具體而言,從引發(fā)該問題的相關因素來看,如,從與“數(shù)據(jù)-隱私”困境相關的利益群體來看,既需要通過對AI醫(yī)療技術的普及提升相關利益群體的信任度,也需要通過全民數(shù)字素養(yǎng)的倫理啟蒙來減少與預防數(shù)據(jù)生命周期中的潛在風險。 如,除了數(shù)據(jù)采集者與使用者、相關技術研發(fā)者的倫理意識需要加強之外,患者不能將數(shù)據(jù)采集中的知情同意僅僅視為默認式的或者無關緊要的“必選項”而流于形式化的“聽之任之”。 數(shù)據(jù)被采集者關于相關程序、條例等的認真審查與質疑等恰恰是發(fā)現(xiàn)問題的高效方式;從技術研發(fā)來看,提升技術的可信度是的信任的必要條件。 如,可以通過構建一個以合成數(shù)據(jù)保障模型訓練安全、以去中心化身份(Decentralized Identity, DID)與可驗證憑證(Verifiable Credentials, VCs)來提升個人數(shù)據(jù)安全,保護個人隱私進而構筑走向信任的技術屏障,以多方協(xié)同的方式形成以患者為中心的安全數(shù)據(jù)生態(tài),打造基于信任的AI醫(yī)療體系。 *參考文獻:
特別聲明:智慧醫(yī)療網轉載其他網站內容,出于傳遞更多信息而非盈利之目的,同時并不代表贊成其觀點或證實其描述,內容僅供參考。版權歸原作者所有,若有侵權,請聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網的內容為智慧醫(yī)療網原創(chuàng),轉載需獲授權。
智慧醫(yī)療網 ? 2022 版權所有 ICP備案號:滬ICP備17004559號-5