久久最新最好视频|精品福利视频在线|狠狠狠干在线播放|色尼玛亚洲综合网|日韩加勒比无码AV|亚洲AV人人澡人人爽人人爱|国产精品免费怡红院|婷婷一区二区XXX|日韩成人一区二区三|欧美熟妇另类AAAAAA

歡迎訪問智慧醫(yī)療網(wǎng) | 網(wǎng)站首頁
 

AI醫(yī)療與數(shù)據(jù)安全(一):AI醫(yī)療中的“數(shù)據(jù)-隱私”困境是什么?

發(fā)布時(shí)間:2025-06-29 來源:數(shù)字社會(huì)發(fā)展與研究 瀏覽量: 字號(hào):【加大】【減小】 手機(jī)上觀看

打開手機(jī)掃描二維碼
即可在手機(jī)端查看

文|閆宏秀

      上海交通大學(xué)科學(xué)史與科學(xué)文化研究院教授

數(shù)據(jù)作為一種新型生產(chǎn)要素所具有的基礎(chǔ)性戰(zhàn)略意義已經(jīng)被各界所認(rèn)可。


依據(jù)我國(guó)的《國(guó)家健康醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)、安全和服務(wù)管理辦法(試行)》《中共中央國(guó)務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》《數(shù)字中國(guó)建設(shè)整體布局規(guī)劃》等文件,技術(shù)賦能旨在人民幸福感的提升。


就AI醫(yī)療而言,數(shù)據(jù)是其必備條件。在我國(guó),醫(yī)療本身就在于增進(jìn)人民的福祉,且AI的發(fā)展本應(yīng)向善、為善。因此,AI醫(yī)療的宗旨也應(yīng)是以技術(shù)推進(jìn)福祉。


然而,由于技術(shù)的不確定性與監(jiān)管的不完善,AI醫(yī)療中的數(shù)據(jù)問題頻發(fā)。其中,與“數(shù)據(jù)-隱私”相關(guān)的問題更為密集且普遍。


AI醫(yī)療中的“數(shù)據(jù)-隱私”困境


數(shù)據(jù)的質(zhì)量、數(shù)量、獲取的正當(dāng)性、使用的邊界、泄露等問題是當(dāng)下全球數(shù)智化進(jìn)程的重點(diǎn)與難點(diǎn)所在,特別是醫(yī)療數(shù)據(jù)的高敏感性與高隱私性使得數(shù)據(jù)的安全性備受關(guān)注。這種安全性從技術(shù)的視角來看,至少包括獲取安全、使用安全與存儲(chǔ)安全。


從理論上來講,應(yīng)以合法合規(guī)和倫理的方式來釋放數(shù)據(jù)潛能,進(jìn)而推進(jìn)醫(yī)療創(chuàng)新。易言之,醫(yī)療數(shù)據(jù)應(yīng)確保患者的知情權(quán)和選擇權(quán),在數(shù)據(jù)流通的過程中應(yīng)遵循公益性原則,且應(yīng)確保數(shù)據(jù)的安全性和完整性。


然而,現(xiàn)實(shí)情況卻并非完全如此。如,存在不知情同意的數(shù)據(jù)獲取現(xiàn)象,存在即使患者是在知情同意的條件被獲取數(shù)據(jù),卻也并不一定能知曉數(shù)據(jù)未來可能會(huì)被如何使用的現(xiàn)象等。


2020年6月,英國(guó) Babylon Health 的 GP app 出現(xiàn)軟件缺陷導(dǎo)致患者數(shù)據(jù)泄露[1];2024年9月,美國(guó) AI 醫(yī)療保健公司 Confidant Health 的服務(wù)器配置錯(cuò)誤,暴露了5.3 TB的敏感心理健康記錄,包括個(gè)人詳細(xì)信息、評(píng)估和醫(yī)療信息,給患者帶來了嚴(yán)重的隱私風(fēng)險(xiǎn)[2]等事件引發(fā)了患者和公眾對(duì)個(gè)人健康信息隱私和安全的深刻且合理的擔(dān)憂。 


因此,在AI醫(yī)療發(fā)展的進(jìn)程中,一方面是醫(yī)療行業(yè)需要海量、多樣化的高質(zhì)量數(shù)據(jù)集以構(gòu)建精準(zhǔn)且可靠的AI模型,進(jìn)而有效實(shí)現(xiàn)疾病的早期篩查、診斷與個(gè)性化治療等;另一方面是患者和公眾擔(dān)心數(shù)據(jù)可能被濫用、泄露或用于商業(yè)牟利的恐懼?;诖?,出現(xiàn)了AI醫(yī)療中的“數(shù)據(jù)-隱私”困境。


當(dāng)前圍繞AI醫(yī)療發(fā)展進(jìn)程中的“數(shù)據(jù)-隱私”困境有著諸多爭(zhēng)議,并導(dǎo)致了一場(chǎng)曠日持久的辯論。“醫(yī)院應(yīng)采集多少數(shù)據(jù)”恰恰是此中的一個(gè)關(guān)鍵問題,因?yàn)樵搯栴}是出現(xiàn)“數(shù)據(jù)-隱私”困境的緣起所在。


假設(shè)你是醫(yī)生或者醫(yī)療機(jī)構(gòu),你期望采集多少數(shù)據(jù)呢?假設(shè)你是患者,你期望醫(yī)療機(jī)構(gòu)應(yīng)當(dāng)采集你的哪些數(shù)據(jù)呢?


那么,到底該如何看到這個(gè)問題呢?

AI醫(yī)療中的應(yīng)采集多少數(shù)據(jù)

是個(gè)怎樣的問題?


從個(gè)人信息保護(hù)的視角來看,過度數(shù)據(jù)采集顯然是既不合理更不應(yīng)當(dāng)。在知情同意的前提下,“按需收集、最小必要”的數(shù)據(jù)最小化原則是采集數(shù)據(jù)的有效措施,這種措施有利于降低數(shù)據(jù)泄露風(fēng)險(xiǎn),保護(hù)患者隱私。


然而,不得不面對(duì)的情況是,若數(shù)據(jù)采集過少,雖然體現(xiàn)了采集過程中的隱私保護(hù),但是卻會(huì)因數(shù)據(jù)不足或者代表性差而導(dǎo)致模型能力缺陷甚或偏見等,進(jìn)而使得數(shù)據(jù)最小化原則在有些具體的技術(shù)研發(fā)與應(yīng)用中,特別是某項(xiàng)技術(shù)本身所涉及的數(shù)據(jù)范圍尚未確定時(shí),必將出現(xiàn)該原則落地難的現(xiàn)象。


因此,一種貌似零和博弈的僵局出現(xiàn),而這種僵局將限制AI賦能醫(yī)療的潛力。


事實(shí)上,這種僵局的出現(xiàn)至少可以從如下兩個(gè)方面進(jìn)行解釋,一是源自將數(shù)據(jù)采集的“量”視為確保AI醫(yī)療有效性的預(yù)設(shè)。迄今為止,在AI醫(yī)療領(lǐng)域中,關(guān)于數(shù)據(jù)采集的“量”的多少往往很難形成共識(shí);二是源自患者對(duì)于數(shù)據(jù)的共享意愿。肖納?卡爾克曼(Shona Kalkman)等通過定性和定量的研究發(fā)現(xiàn):信任的缺乏不利于數(shù)據(jù)共享的目標(biāo)。


盡管參與者認(rèn)識(shí)到數(shù)據(jù)研究的實(shí)際或潛在好處,但他們對(duì)違反保密性和可能濫用數(shù)據(jù)的情況表示擔(dān)憂,英國(guó)的 care.data 的失敗就是一個(gè)典型的警示[3]。 即,就數(shù)據(jù)共享而言,信任是患者是否愿意數(shù)據(jù)共享的關(guān)鍵所在。


因此,“AI醫(yī)療該采集多少數(shù)據(jù)是個(gè)怎樣的問題?”可被進(jìn)一步轉(zhuǎn)化或者歸結(jié)為如何走出基于量的數(shù)據(jù)采集困擾,如何建立和維護(hù)信任。


超越數(shù)據(jù)采集

打造基于信任的AI醫(yī)療體系


長(zhǎng)期以來,AI醫(yī)療的發(fā)展受制于高質(zhì)量、大規(guī)模且合規(guī)的訓(xùn)練數(shù)據(jù)。但事實(shí)上,伴隨技術(shù)的不斷發(fā)展,AI醫(yī)療的未來不應(yīng)再糾纏于“采集多少數(shù)據(jù)”,真正的出路在于通過前瞻性的技術(shù)選擇與有效的AI醫(yī)療認(rèn)知普及相融合,從根本上構(gòu)建一個(gè)可信的AI醫(yī)療體系。


借助AI驅(qū)動(dòng)的范式轉(zhuǎn)移,超越數(shù)據(jù)采集


在AI賦能的當(dāng)下,對(duì)AI的充分理解是有效推進(jìn)技術(shù)向善、為善的必要條件。面對(duì)數(shù)據(jù)采集的困境,不妨通過AI對(duì)人類科研、認(rèn)知、生活方式的范式轉(zhuǎn)移的認(rèn)知,來充分釋放已有數(shù)據(jù)的潛能。


如,使用生產(chǎn)對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks, GANs)、變分自編碼器 (Variational Autoencoders, VAEs)、 擴(kuò)散模型 (Diffusion Models)等技術(shù)將已有的數(shù)據(jù)進(jìn)行合成,即合成數(shù)據(jù)生成(Synthetic Data Generation,SDG)來降低采集成本,以隱私保護(hù)技術(shù)的方式減少隱私泄露的風(fēng)險(xiǎn),克服對(duì)于罕見病或特定少數(shù)族裔群體,現(xiàn)實(shí)世界中可供研究的數(shù)據(jù)樣本極其有限的數(shù)據(jù)稀缺性問題,進(jìn)而提升AI醫(yī)療模型的公平性,縮短創(chuàng)新周期。


如,NVIDIA所的MAISI的醫(yī)療影像生成基礎(chǔ)模型,就是在通過提供一種可靠、高效的方式來生成可用于研究、臨床應(yīng)用乃至外科機(jī)器人訓(xùn)練的高質(zhì)量合成圖像,從而克服數(shù)據(jù)稀缺和隱私限制的挑戰(zhàn)[4]。


但需要高度警惕的是,鑒于合成數(shù)據(jù)本質(zhì)上依然是來自于真實(shí)記錄,進(jìn)而仍然存在被重新識(shí)別的風(fēng)險(xiǎn)。因此,合成數(shù)據(jù)不是技術(shù)的肆意泛濫,而是重在對(duì)已有數(shù)據(jù)的高效使用,整個(gè)數(shù)據(jù)流程中的倫理監(jiān)管依然不能缺席,且需要重塑數(shù)據(jù)治理框架,務(wù)必注重源頭數(shù)據(jù)的倫理審查,特別是要高度重視合成數(shù)據(jù)過程中的知情同意。


以信任為基石,破解“數(shù)據(jù)-隱私”困境


破解“數(shù)據(jù)-隱私”困境的關(guān)鍵并非僅僅在于限制數(shù)據(jù)采集的多少,因?yàn)槿翎t(yī)患之間的關(guān)系是不信任的,若醫(yī)療機(jī)構(gòu)本身不被信任,那么,患者對(duì)數(shù)據(jù)采集本身就很擔(dān)憂。


因此,不妨將破解的困境從數(shù)據(jù)采集本身的擔(dān)憂著手,打造一個(gè)AI驅(qū)動(dòng)的、以信任為基石的醫(yī)療體系,在這里,技術(shù)創(chuàng)新與個(gè)人尊嚴(yán)不再對(duì)立,而是攜手并進(jìn),共同促進(jìn)人類的健康與福祉。


具體而言,從引發(fā)該問題的相關(guān)因素來看,如,從與“數(shù)據(jù)-隱私”困境相關(guān)的利益群體來看,既需要通過對(duì)AI醫(yī)療技術(shù)的普及提升相關(guān)利益群體的信任度,也需要通過全民數(shù)字素養(yǎng)的倫理啟蒙來減少與預(yù)防數(shù)據(jù)生命周期中的潛在風(fēng)險(xiǎn)。


如,除了數(shù)據(jù)采集者與使用者、相關(guān)技術(shù)研發(fā)者的倫理意識(shí)需要加強(qiáng)之外,患者不能將數(shù)據(jù)采集中的知情同意僅僅視為默認(rèn)式的或者無關(guān)緊要的“必選項(xiàng)”而流于形式化的“聽之任之”。


數(shù)據(jù)被采集者關(guān)于相關(guān)程序、條例等的認(rèn)真審查與質(zhì)疑等恰恰是發(fā)現(xiàn)問題的高效方式;從技術(shù)研發(fā)來看,提升技術(shù)的可信度是的信任的必要條件。


如,可以通過構(gòu)建一個(gè)以合成數(shù)據(jù)保障模型訓(xùn)練安全、以去中心化身份(Decentralized Identity, DID)與可驗(yàn)證憑證(Verifiable Credentials, VCs)來提升個(gè)人數(shù)據(jù)安全,保護(hù)個(gè)人隱私進(jìn)而構(gòu)筑走向信任的技術(shù)屏障,以多方協(xié)同的方式形成以患者為中心的安全數(shù)據(jù)生態(tài),打造基于信任的AI醫(yī)療體系。


*參考文獻(xiàn):

[1] http://techworldbd24.com/index.php/techworld/1040


[2] AI Firm’s Misconfigured Server Exposed 5.3 TB of Mental Health Records參見:https://hackread.com/ai-firm-misconfigured-server-exposed-mental-health-data/#:~:text=A%20misconfigured%20server%20from%20a%20US-based%20AI%20healthcare,medical%20information%2C%20posing%20serious%20privacy%20risks%20for%20patients.


[3] Kalkman S, van Delden J, Banerjee A, et alPatients’ and public views and attitudes towards the sharing of health data for research: a narrative review of the empirical evidenceJournal of Medical Ethics 2022;48:3-13.


[4] Synthetic Data Generation for Healthcare Innovation | Use Case - NVIDIA, https://www.nvidia.com/en-us/use-cases/synthetic-data-generation-for-healthcare-innovation/



特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時(shí)并不代表贊成其觀點(diǎn)或證實(shí)其描述,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請(qǐng)聯(lián)系我們刪除。

凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。


智慧醫(yī)療網(wǎng) ? 2022 版權(quán)所有   ICP備案號(hào):滬ICP備17004559號(hào)-5