久久最新最好视频|精品福利视频在线|狠狠狠干在线播放|色尼玛亚洲综合网|日韩加勒比无码AV|亚洲AV人人澡人人爽人人爱|国产精品免费怡红院|婷婷一区二区XXX|日韩成人一区二区三|欧美熟妇另类AAAAAA

歡迎訪問智慧醫(yī)療網(wǎng) | 網(wǎng)站首頁
 
當(dāng)前位置:首頁 > 資訊 > 觀點(diǎn)

上海交大盛斌教授聯(lián)合多國學(xué)者聯(lián)合述評,解讀生成式AI數(shù)據(jù)對于醫(yī)學(xué)大模型的影響

發(fā)布時(shí)間:2025-06-03 來源:上海交大計(jì)算機(jī)學(xué)院 瀏覽量: 字號:【加大】【減小】 手機(jī)上觀看

打開手機(jī)掃描二維碼
即可在手機(jī)端查看

近日,上海交通大學(xué)計(jì)算機(jī)學(xué)院、人工智能教育部重點(diǎn)實(shí)驗(yàn)室盛斌教授聯(lián)合清華大學(xué)醫(yī)學(xué)院黃天蔭教授、英國倫敦大學(xué)學(xué)院(UCL)眼科研究所 Pearse Keane 教授、新加坡國立大學(xué)醫(yī)學(xué)院覃宇宗教授等多國學(xué)者,在Nature Biomedical Engineering期刊發(fā)表題為《合成數(shù)據(jù)助推醫(yī)學(xué)基座模型發(fā)展》(Synthetic Data Boosts Medical Foundation Models)的深度述評文章(DOI: https://doi.org/10.1038/s41551-025-01365-0)。

圖片1.png

生成式人工智能(如生成對抗網(wǎng)絡(luò)、擴(kuò)散模型等)通過合成高質(zhì)量、多樣化的醫(yī)學(xué)數(shù)據(jù),其科學(xué)價(jià)值體現(xiàn)在突破數(shù)據(jù)瓶頸、推動多模態(tài)融合與因果推理,而實(shí)際應(yīng)用則體現(xiàn)在提升診斷精度、加速個(gè)性化診療及優(yōu)化醫(yī)療資源分配等方面,正在推動醫(yī)學(xué)領(lǐng)域從數(shù)據(jù)驅(qū)動向知識驅(qū)動的范式轉(zhuǎn)型。這一技術(shù)創(chuàng)新不僅突破了醫(yī)學(xué)數(shù)據(jù)獲取與利用的核心瓶頸,為提升國家醫(yī)療科技競爭力、服務(wù)健康中國建設(shè)提供了關(guān)鍵支撐。

我國醫(yī)療數(shù)據(jù)體系長期受困于三大核心挑戰(zhàn):嚴(yán)格的隱私保護(hù)法規(guī)(《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》構(gòu)建的合規(guī)高墻)、高昂的標(biāo)注成本(單例醫(yī)學(xué)影像標(biāo)注需數(shù)小時(shí)專業(yè)人力)、嚴(yán)重的數(shù)據(jù)孤島(跨機(jī)構(gòu)數(shù)據(jù)共享率不足 30%),這些瓶頸讓 AI 模型訓(xùn)練陷入 “巧婦難為無米之炊” 的境地。在全球醫(yī)學(xué) AI 競爭轉(zhuǎn)向 “基座模型 + 大模型” 驅(qū)動的算力算法數(shù)據(jù)綜合比拼的當(dāng)下,生成式 AI 帶來了破局之道 — 通過精準(zhǔn)模擬真實(shí)數(shù)據(jù)分布特征,將單中心千級病例擴(kuò)展為百萬級訓(xùn)練集。這不僅為罕見病診療、兒科等數(shù)據(jù)稀缺領(lǐng)域提供 “數(shù)據(jù)造血” 能力,更在數(shù)據(jù)割裂、技術(shù)脫鉤風(fēng)險(xiǎn)加劇的國際環(huán)境下,為我國構(gòu)建自主可控的醫(yī)療數(shù)據(jù)生態(tài)提供了戰(zhàn)略級技術(shù)儲備,直接響應(yīng) “面向國家重大需求” 的核心訴求。

3月,復(fù)旦大學(xué)顏波教授團(tuán)隊(duì)在Nature Biomedical Engineering期刊發(fā)表了通過利用生成式AI數(shù)據(jù)構(gòu)建眼科基座模型的有益探索。針對這一突破性工作,盛斌教授聯(lián)合眾多學(xué)者發(fā)表題為《合成數(shù)據(jù)助推醫(yī)學(xué)基座模型發(fā)展》(Synthetic Data Boosts Medical Foundation Models)的深度述評文章。

述評中盛斌等學(xué)者提出,首先,盡管人工智能生成的數(shù)據(jù)可能會降低與真實(shí)世界醫(yī)療數(shù)據(jù)相關(guān)的隱私風(fēng)險(xiǎn),但它并不能完全消除這些風(fēng)險(xiǎn)。其次,基礎(chǔ)模型的黑箱性質(zhì)使得當(dāng)模型主要或僅在合成數(shù)據(jù)上進(jìn)行訓(xùn)練時(shí),性能惡化或失敗的原因變得模糊;這個(gè)缺點(diǎn)會讓開發(fā)者和用戶不確定人工智能生成數(shù)據(jù)的 “毒性” 程度。第三,用有限的真實(shí)世界疾病標(biāo)簽樣本指導(dǎo)合成數(shù)據(jù)生成可能會無意中強(qiáng)化小真實(shí)世界數(shù)據(jù)集中固有的偏差,從而損害模型的公平性、公正性和通用性,特別是對于罕見疾病或少數(shù)民族和其他代表性不足的群體。目前尚不清楚構(gòu)建一個(gè)強(qiáng)大的基礎(chǔ)模型需要多少真實(shí)世界數(shù)據(jù);實(shí)際上,完全在合成數(shù)據(jù)上訓(xùn)練的模型的性能仍然未知。此外,建立確保醫(yī)療人工智能中真實(shí)世界和合成數(shù)據(jù)的可追溯性和來源的指南和標(biāo)準(zhǔn)是當(dāng)務(wù)之急。

述評對復(fù)旦大學(xué)的研究成果予以高度肯定,同時(shí)也指出,該項(xiàng)研究引出了有關(guān)人工智能生成數(shù)據(jù)在構(gòu)建基礎(chǔ)模型過程中所起作用的一系列根本性問題。其中最為關(guān)鍵的一點(diǎn)在于,人工智能生成的數(shù)據(jù)對醫(yī)療基礎(chǔ)模型性能的影響具有兩面性,它既可能成為提升性能的強(qiáng)力催化劑,大幅優(yōu)化模型表現(xiàn);也可能淪為降低性能的污染物,給模型帶來難以預(yù)估的負(fù)面效應(yīng)。因此,必須在合成數(shù)據(jù)提供的機(jī)會與嚴(yán)格驗(yàn)證、倫理考慮以及對持續(xù)改進(jìn)真實(shí)世界數(shù)據(jù)收集的承諾之間找到微妙的平衡。

此外,當(dāng)前的人工智能模型距離能夠精準(zhǔn)捕捉人類健康復(fù)雜性、堪稱 “通用模型”或“世界模型” 的目標(biāo),仍存在著巨大的差距。人類健康所涵蓋的范疇極為廣泛,涉及到生物、心理、環(huán)境等諸多復(fù)雜因素,其內(nèi)在機(jī)制盤根錯(cuò)節(jié),絕非現(xiàn)有模型所能輕易駕馭。若要構(gòu)建針對普遍健康問題的基礎(chǔ)模型,絕不能僅僅依賴人工智能生成的數(shù)據(jù),而需采用一種更為全面、綜合的方法。在人類生物學(xué)與健康領(lǐng)域,尚有海量的未知等待我們?nèi)ヌ剿鳎缭S多罕見病的發(fā)病機(jī)制至今成謎,環(huán)境因素與慢性疾病之間的關(guān)聯(lián)也有待進(jìn)一步明確。在這樣的背景下,提升真實(shí)世界數(shù)據(jù)收集的效率與通用性,依舊是醫(yī)學(xué)研究與人工智能醫(yī)療應(yīng)用發(fā)展進(jìn)程中的重中之重。不可否認(rèn),合成數(shù)據(jù)在輔助真實(shí)世界數(shù)據(jù)方面具備一定的潛力,當(dāng)它與真實(shí)世界數(shù)據(jù)巧妙結(jié)合時(shí),能夠在數(shù)據(jù)擴(kuò)充、模型訓(xùn)練等方面發(fā)揮積極作用,助力研究工作的推進(jìn)。但必須清醒地認(rèn)識到,合成數(shù)據(jù)存在諸多局限性,它難以獨(dú)立成為解決人類健康問題的完整方案,無法完全替代真實(shí)世界數(shù)據(jù)所蘊(yùn)含的豐富信息與真實(shí)性價(jià)值。唯有將二者合理搭配,以真實(shí)世界數(shù)據(jù)為基石,以合成數(shù)據(jù)為補(bǔ)充,才能為構(gòu)建強(qiáng)大且實(shí)用的醫(yī)療基礎(chǔ)模型筑牢根基。

述評提出,生成式人工智能于醫(yī)學(xué)領(lǐng)域的應(yīng)用,絕非局限于技術(shù)層面的創(chuàng)新,實(shí)則掀起一場醫(yī)療服務(wù)模式的重大變革。這一前沿技術(shù)在醫(yī)學(xué) AI 領(lǐng)域意義非凡,有望推動我國醫(yī)學(xué) AI 實(shí)現(xiàn)科技自立自強(qiáng)。當(dāng)前,醫(yī)學(xué)AI領(lǐng)域國際競爭日趨激烈,生成式人工智能則為學(xué)術(shù)界突破這一技術(shù)壟斷提供了有力契機(jī),助力我國在醫(yī)療 AI 底層算法等關(guān)鍵領(lǐng)域?qū)崿F(xiàn)自主可控與創(chuàng)新發(fā)展。著眼未來,通過全方位完善制度,推動生成式 AI 順利從技術(shù)突破邁向規(guī)?;涞?,為實(shí)現(xiàn) “四個(gè)面向” 戰(zhàn)略目標(biāo)源源不斷地貢獻(xiàn)醫(yī)療科技力量,讓先進(jìn)技術(shù)切實(shí)惠及廣大民眾,提升我國整體醫(yī)療水平 。

計(jì)算機(jī)學(xué)院
計(jì)算機(jī)學(xué)院(網(wǎng)絡(luò)空間安全學(xué)院、密碼學(xué)院)


特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時(shí)并不代表贊成其觀點(diǎn)或證實(shí)其描述,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請聯(lián)系我們刪除。

凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。


智慧醫(yī)療網(wǎng) ? 2022 版權(quán)所有   ICP備案號:滬ICP備17004559號-5