久久最新最好视频|精品福利视频在线|狠狠狠干在线播放|色尼玛亚洲综合网|日韩加勒比无码AV|亚洲AV人人澡人人爽人人爱|国产精品免费怡红院|婷婷一区二区XXX|日韩成人一区二区三|欧美熟妇另类AAAAAA

歡迎訪問智慧醫(yī)療網(wǎng) | 網(wǎng)站首頁
 
當前位置:首頁 > 醫(yī)療人工智能

人工智能醫(yī)療臨床試驗,從循證醫(yī)學角度切入

發(fā)布時間:2022-05-30 來源:思宇MedTech 瀏覽量: 字號:【加大】【減小】 手機上觀看

打開手機掃描二維碼
即可在手機端查看


QQ瀏覽器截圖20220529222347.png

1

人工智能與醫(yī)療行業(yè)的結合


人工智能(artificial intelligence,AI)一詞源于1956 年的達特茅斯會議[1]。隨后很快便與醫(yī)療行業(yè)結緣。1966 年,美國麻省理工學院(MIT)推出了最早的自然語言聊天機器人ELIZA,能夠模仿臨床治療中的心理醫(yī)生,與患者進行人機對話;1972 年,英國利茲大學研發(fā)的AAPHelp系統(tǒng),能根據(jù)癥狀推斷可能產(chǎn)生患者腹部劇痛的原因;1974 年,美國匹茲堡大學研發(fā)的INTERNIST-I 系統(tǒng),主要用于輔助診斷內(nèi)科復雜疾??;1976 年,美國斯坦福大學研發(fā)的MYCIN 系統(tǒng),用于自動判斷患者所感染的細菌類別并提供相應的抗生素處方建議。

盡管20 世紀80 年代,AI 遭遇寒冬;但在進入21 世紀以后,隨著算法、算力和大數(shù)據(jù)三要素齊聚,再次引爆AI 熱潮[2]。醫(yī)療作為最具挑戰(zhàn)的行業(yè)之一,正是AI技術和應用的制高點。從近幾年的文獻可以看出[3-5],幾乎每種疾病都有其結合AI技術和應用的文章發(fā)表,如常見的腫瘤、眼部疾病、皮膚疾病、糖尿病、腎病、心腦血管疾病、神經(jīng)/ 精神相關疾病等。借助AI 加速挖掘這些醫(yī)學證據(jù),主要來源于5 大類技術。

(1)計算機視覺(computer vision,CV)。卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN) 在AI 醫(yī)學影像方面有出色表現(xiàn),如在糖尿病性視網(wǎng)膜病變的AI 篩查[6]、皮膚癌/ 黑素瘤的AI診斷[7]、肺部電子計算機斷層掃描(CT)圖像的AI 識別[8]、基于腦部磁共振成像(MRI)的阿爾茨海默病AI 分類[9] 等方面應用。值得一提的是,CV 是此次AI 熱潮中的“弄潮兒”,AI 醫(yī)學影像也被行業(yè)內(nèi)人士認為是最有可能率先實現(xiàn)商業(yè)化的AI 醫(yī)療領域[2]。

(2)自然語言處理(natural language processing,NLP)。如果說CV 是在近10年里縱向發(fā)展了各種不同的CNN 架構(從2012 年新鮮出爐不到10 層的AlexNet[10]到2015 年高達152 層的ResNet[11]),那么NLP 領域里最大的創(chuàng)新在于橫向提出了一套完整的方案去解決各種各樣的NLP任務,特別是2018 年提出的BERT[12] 模型在11 個NLP 任務上刷新了紀錄,可以做出問答、情感分析、命名實體識別、文檔聚類等任務。這些NLP 技術的發(fā)展無疑對富含文本數(shù)據(jù)的電子病歷(如病歷主訴、出院小結)帶來了新的價值,通過對醫(yī)療文本的分析和理解,可以構建疾病模型,以及提供AI 診療建議。

(3)序列數(shù)據(jù)分析(sequential data analysis)。以患者為中心的醫(yī)療數(shù)據(jù)是對患者全生命周期的記錄,因此從時間維度建?;颊邤?shù)據(jù),無論是長達多年的電子病歷或醫(yī)保記錄,還是數(shù)天內(nèi)在重癥監(jiān)護室(ICU)里的多維指標采集,都可以借助序列數(shù)據(jù)分析來構建復雜模型。特別是循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN),通過學習前面時間步而預測下一步事件的概率,因此常被用于AI 風險預測,如對糖尿病患者的慢性腎病預測[13]、對再入院的預測[14] 等。此外,信號相關的流數(shù)據(jù)也是序列數(shù)據(jù)分析的對象,如分析心電圖(ECG)檢測心律失常及其分類[15],又如分析腦電圖(EEG)預測癲癇[16],以及通過可穿戴式設備獲取姿態(tài)、步態(tài)數(shù)據(jù)流來預測帕金森病嚴重程度[17] 等。

(4)圖神經(jīng)網(wǎng)絡(graph neural network,GNN)。2019 年GNN 在各種AI 大會上刷榜,由此可見GNN 技術在近2 年的熱度非常高。GNN 里的“圖”,即為計算機科學“圖論”中稱為“圖”的數(shù)據(jù)結構,最簡單的形式化表示就是其由結點(node)和邊(edge)組成。在很多應用場景中,我們常常見到這樣的“圖”結構,如社交網(wǎng)絡(人是結點而社交關系是邊)、電子購物(用戶和商品是結點而購買關系是邊)。聚焦醫(yī)療行業(yè)里,AI 藥物研發(fā)正在擁抱GNN 新技術[18],如借助GNN 預測蛋白質- 蛋白質的相互作用、藥物- 藥物的相互作用,以及藥物- 靶標、藥物- 疾病、疾病- 蛋白質的相互作用,其中靶標是與某種疾病的發(fā)生和發(fā)展密切相關的生物分子(如蛋白質和核酸),對這種生物分子進行干預,能夠治愈或緩解與其相關的疾病。

(5)強化學習(reinforcement learning)。從2016 年阿爾法圍棋(AlphaGo)[19]以4 ∶ 1 的比分戰(zhàn)勝人類職業(yè)棋手,到2017 年AlphaGo Zero[20] 不再需要學習人類的棋譜,而是通過自我對弈提高棋力,其背后的深度強化學習算法備受業(yè)界關注。在醫(yī)療行業(yè)里,強化學習常被用于求解治療方案的最佳策略[21],其中目標函數(shù)是最大化預后的短期或長期效果。此外,考慮到這類技術在棋類和游戲類中應用效果明顯,而在醫(yī)療領域,更為接近的醫(yī)療場景當屬AI 醫(yī)護機器人。如機器人輔助手術[22](robotic-assisted surgery,RAS),通過感知環(huán)境狀態(tài),學習外科醫(yī)生的動作和相應的獎賞函數(shù),從而提供最優(yōu)的策略,增強RAS 的魯棒性和適應性。

綜合上述AI 技術,在不同的落地場景中分別賦能AI 醫(yī)療重要的2P 角色(圖1):AI 醫(yī)學影像助力醫(yī)生、AI 診療賦能患者。同時,圍繞這2 個角色,深度挖掘2D 概念:AI 風險預測理解疾病、AI 藥物研發(fā)挖掘藥物。不難看出,現(xiàn)行相對成熟的AI 技術(如CV 和NLP)已經(jīng)在不少應用場景中賦能予醫(yī)生和患者角色。而對于疾病和藥物,這些概念的研究本身就是亟待解決的科學論題,與之對應的AI 技術(序列數(shù)據(jù)分析和GNN)正分別在時間和空間上推出新算法。

微信圖片_20220529221623.png

2

AI 醫(yī)療的監(jiān)管問題


AI 無疑給醫(yī)療行業(yè)帶來了新技術、新應用,同時我們也逐漸意識到,AI 為醫(yī)療行業(yè)帶來了新問題、新挑戰(zhàn)。尤其是當我們把AI 在醫(yī)療行業(yè)的應用視為一種特殊的干預手段時,我們是否應該建立系統(tǒng)的方法來評價和監(jiān)管這些干預手段呢?這些AI 醫(yī)療技術和應用是否安全(safe)、有效(efficacy & effectiveness) 并值得信任(trustful)呢?類比于藥物,AI 醫(yī)療自身需要連續(xù)、長期且嚴格的研究,以產(chǎn)生科學有效的證據(jù),這些證據(jù)可隨時間推移在不同人群中被驗證。不同于藥物,AI 醫(yī)療更需要與用戶(包括但不限于醫(yī)生和患者)互動,成為用戶可理解、可信任的干預手段,通過將AI 醫(yī)療集成到現(xiàn)有的臨床環(huán)境里,來收集和分析這些新證據(jù)。

本文首先通過循證醫(yī)學的證據(jù)金字塔來看現(xiàn)有AI 醫(yī)療技術和應用的循證等級;然后從臨床試驗質量管理規(guī)范角度,討論AI 醫(yī)療的臨床試驗在不同階段該如何設計和評估;最后解讀最新的用于規(guī)范AI 臨床試驗報告的兩大指南[《人工智能干預試驗標準方案的推薦條目》(Standard Protocol Items:Recommendations for Interventional Trials-Artificial Intelligence,SPIRIT-AI[23] 和《人工智能試驗報告統(tǒng)一標準》(Consolidated Standards of Reporting Trials-Artificial Intelligence,CONSORT-AI )[24]],也是首個AI 臨床試驗國際標準。

(一) 循證醫(yī)學證據(jù)等級


循證醫(yī)學(evidence-based medicine)的證據(jù)金字塔的證據(jù)等級是自下向上逐漸升高(圖2)。其基本思想是從最基礎的證據(jù)出發(fā),不斷地驗證、推論、強化,最終積累出可以定性的證據(jù)為臨床所依循。從這個角度來審視AI 醫(yī)療技術和應用,我們不難發(fā)現(xiàn)很多機構推出的AI 與醫(yī)生同臺PK[25],其證據(jù)等級僅等同于專家經(jīng)驗。這往往是以新聞發(fā)表方式公布于世,但是這些并不是嚴謹?shù)呐R床研究結果。

微信圖片_20220529221626.png

通過對醫(yī)學期刊的搜索發(fā)現(xiàn),有數(shù)百篇病例報告均對AI 醫(yī)療技術和應用進行過專業(yè)的描述和分析,包括在多例病例中使用[26]。同時,這些病例報告也指出了AI 醫(yī)療技術和應用的缺點,如AI 模型在實際應用中往往達不到純實驗環(huán)境里的高性能??紤]到AI 醫(yī)療技術和應用目前尚未大范圍使用,且鮮有回顧性病例對照研究結果??梢灶A見的是,我們將對某些特定疾病結局的改善,由果尋因來觀察并檢驗AI 的使用是否與之存在著統(tǒng)計學上的關聯(lián)。我們通過檢索和分析,驚喜地發(fā)現(xiàn)數(shù)十項前瞻性隊列研究[27],對于使用AI 的干預組和不使用AI 的對照組由因尋果,觀察驗證其是否在臨床結局上有差異。此外,有7 項隨機對照試驗[27] 正在開展,其中6 項來自中國。這些醫(yī)學證據(jù)逐步開始被系統(tǒng)評價[28],并進行薈萃分析[29]

當然,我們也意識到現(xiàn)在絕大部分證據(jù)聚焦在AI 醫(yī)學影像的技術和應用。但是,我們相信并期待著基于循證醫(yī)學的方法論AI 和醫(yī)療的結合,以及各種技術和應用均將得到定性與定量的證據(jù),最終被納入臨床實踐指南。

(二) 臨床試驗各個階段


《藥物臨床試驗質量管理規(guī)范》(Good Clinical Practice, GCP[30] 指出:“臨床試驗,指以人體(患者或健康受試者)為對象的試驗,意在發(fā)現(xiàn)或驗證某種試驗藥物的臨床醫(yī)學、藥理學以及其他藥效學作用、不良反應,或者試驗藥物的吸收、分布、代謝和排泄,以確定藥物的療效與安全性的系統(tǒng)性試驗”。藥物臨床試驗分為Ⅰ ~ Ⅳ期,其中Ⅰ ~ Ⅲ期是上市前的臨床研究,而Ⅳ期是上市后的臨床研究。此外,還有臨床前研究和早期發(fā)現(xiàn)、發(fā)明階段研究(表1)。相比藥物研發(fā)的各個階段,AI 醫(yī)療的研發(fā)大多還停留在算法發(fā)現(xiàn)、發(fā)明和臨床前研究階段[31]。值得一提的是,AI 醫(yī)療大部分是數(shù)據(jù)驅動的學習算法,所以需要重點關注數(shù)據(jù)的因素,不能只停留在機器深度學習的算法層面指標(如AUC),需要更多地關注如實說明訓練時的數(shù)據(jù)質量問題(如數(shù)據(jù)缺失情況和數(shù)據(jù)異常情況等),以及訓練后的模型性能問題(如模型的可解釋性、偏差和漂移)。類比藥物說明書,一般包括以下內(nèi)容:藥品名稱、成份、性狀、適應證或者功能主治、用法用量、不良反應、禁忌、注意事項、規(guī)格、有效期、批準文號和生產(chǎn)企業(yè)等。在可預見的未來,將有AI 醫(yī)療說明書,包含AI 技術應用的數(shù)據(jù)適用性、安全性、有效性這些重要科學評價和結論,用以指導臨床的正確使用。

微信圖片_20220529221630.png

此外,AI 醫(yī)療的目標是賦能用戶(其中用戶可以是醫(yī)生、患者、臨床研究者等),所以在復雜度高且響應度強的醫(yī)療行業(yè),AI 醫(yī)療的技術和應用需要有專業(yè)的系統(tǒng)設計和量化評估。如互聯(lián)網(wǎng)公司常用A/B 測試對產(chǎn)品功能及內(nèi)容的優(yōu)化迭代,AI 醫(yī)療在評估用戶體驗和系統(tǒng)帶來的價值時,也可以借助這樣的方法,提高用戶滿意度。

(三) 臨床試驗指南規(guī)范


2020 年9 月《自然醫(yī)學》雜志推出了一系列文章,包括1 篇社論(editorial)呼吁對于AI 的使用制訂臨床試驗指南[32],1 篇專家評論(comment)建議規(guī)范基于AI 的臨床試驗[27],以及2 篇共識聲明(consensus statement)介紹了兩大指南SPIRIT-AI[23] 和CONSORT-AI[24], 用以規(guī)范AI 醫(yī)療的臨床試驗設計和匯報。其中,SPIRIT-AI 是《干預試驗標準方案的推薦條目》(Standard Protocol Items:Recommendations for Interventional Trials,SPIRIT)對于AI 模塊的擴展;CONSORTAI是《試驗報告統(tǒng)一標準》(Consolidated Standards of Reporting Trials, CONSORT)對于AI 模塊的擴展。簡而言之,如果臨床干預涉及AI 技術和應用,那么建議參考SPIRIT-AI,而相應的涉及統(tǒng)一標準建議參考CONSORT-AI。

具體而言,SPIRIT-AI 在現(xiàn)有的2013年版基礎上新增15 項,其中3 項是在原有清單上進行細化,另外12 項是在原有清單上進行擴展;CONSORT-AI 則在現(xiàn)有的2010 年版上新增14 項,這些新增項對于AI 干預的報告尤為重要。經(jīng)比較后不難發(fā)現(xiàn),CONSORT-AI 的14 項幾乎全在SPIRIT-AI 中,而SPIRIT-AI 僅多了1項對于AI 干預已有相關的臨床證據(jù),需要在背景和原理章節(jié)中進行介紹和描述。本文對AI 新增項進行了解讀 [23-24](表2)。

微信圖片_20220529221633.jpg

AI 醫(yī)療的臨床試驗才剛剛起步,國內(nèi)外產(chǎn)學研多方也在共同努力推進。除了科研機構引領并監(jiān)管AI 醫(yī)療的臨床試驗,產(chǎn)品部門也需盡快落實這些指南新增項,以便在AI 醫(yī)療的臨床試驗過程中能更有效地進行數(shù)據(jù)收集、管理和分析。如IBM?Clinical Development[33] 提供的臨床試驗解決方案,正在探索及支持AI 醫(yī)療的臨床試驗。

3

展  望


2017 年國務院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,該規(guī)劃提出了2020 年、2025 年、2030 年的戰(zhàn)略目標,醫(yī)療作為其中一個重要的應用領域受到了極高的重視。在這短短3 年里,人們已經(jīng)驚喜地看到了很多AI 與醫(yī)療結合的試用和試點。2020 年,我們展望未來,產(chǎn)學研相結合,能夠更健康、更長遠地發(fā)展。讓AI 醫(yī)療在前進的道路上有望有證可循、有據(jù)可依。

第一作者簡介

圖片
梅婧,博士,IBM 中國研究院,高級研究員。專業(yè)方向:人工智能醫(yī)療
楊曉棟,碩士,IBM Watson Health,業(yè)務拓展總監(jiān)。專業(yè)方向:數(shù)字化時代的智慧醫(yī)療

通訊作者簡介

圖片
李少春,碩士,IBM Watson Health,大中華區(qū)總經(jīng)理。專業(yè)方向:數(shù)字化時代的智慧醫(yī)療


智慧醫(yī)療網(wǎng) ? 2022 版權所有   ICP備案號:滬ICP備17004559號-5