面向醫(yī)療場景,人工智能作為新質(zhì)生產(chǎn)力的重點方向,已經(jīng)在很多醫(yī)療場景和診療方向提供了大量的產(chǎn)品,提高了效率,增加了醫(yī)療服務的精準性和可及性。尤其是隨著大模型的日益興起,涌現(xiàn)出來的能力已經(jīng)開始對醫(yī)療場景帶來改變。這些大模型在醫(yī)學影像分析、疾病診斷、個性化治療方案制定等方面展現(xiàn)出卓越的性能,不僅提高了醫(yī)療工作的效率,還極大地改善了診斷的準確性。大模型還能通過分析海量的醫(yī)學數(shù)據(jù),發(fā)現(xiàn)潛在的疾病關聯(lián)和新的治療方法,推動醫(yī)療研究的進步和創(chuàng)新。
大量的醫(yī)療人工智能涌現(xiàn)而出,這些人工智能應用需要從數(shù)據(jù)、算力、算法上提供系統(tǒng)性的平臺支持;另外一方面,大量的醫(yī)療場景需要人工智能的支持,需要有一套訓練、推理、應用構建的一體化平臺,加速人工智能的孵化。因此統(tǒng)籌建設醫(yī)療服務的人工智能中臺,成為了新質(zhì)生產(chǎn)力下的醫(yī)療服務的必須。應滿足自然語言處理NLP、語言識別、圖像識別、人臉識別、醫(yī)療服務智能機器人,提供AI支撐組件和機器識別和深度學習與算法訓練建模、具有數(shù)據(jù)標準和可視化建模能力。可實現(xiàn)模型管理和資源管理。建立人工智能醫(yī)療服務平臺,在醫(yī)療機構臨床工作流方面實現(xiàn)數(shù)字化、便捷化、智能化的全面升級,提升臨床影像病理診斷服務水平和工作效率。平臺及應用要求能同時覆蓋放射影像和數(shù)字病理圖像,且滿足覆蓋多個模態(tài)數(shù)據(jù)、多個AI功能、多個臨床科室、多個應用場景的要求。人工智能中臺體系設計,從五個維度上提供了核心能力:1、從基礎能力上,提供了:數(shù)據(jù)、算力、算法三象限的基礎支持2、從模型生命周期上,包含了模型的:標注、研發(fā)、訓練、推理、應用構建、模型-應用反饋的全流程3、從模型支持維度上,既支持了傳統(tǒng)的醫(yī)療影像、文本、醫(yī)療垂直領域的人工智能模型,更支持了文本大模型、圖像大模型、醫(yī)療混合模態(tài)大模型等4、從平臺管理上,提供了系統(tǒng)性觀測、資源調(diào)度運營管理、模型質(zhì)量監(jiān)管、運營監(jiān)管等5、從AI應用快速部署上,提供了靈活、適配性高的運行沙盒,用于多種類型的AI應用部署(1)多算力、多維度算力調(diào)度管理:統(tǒng)一管理和調(diào)度不同類型和規(guī)模的算力資源(2)多維度監(jiān)控報警:提供系統(tǒng)監(jiān)控和報警機制,確保系統(tǒng)高效穩(wěn)定的運行(3)潮汐調(diào)度、彈性調(diào)度:根據(jù)預設規(guī)則或者彈性自動規(guī)則,自動調(diào)度訓練-推理-人工智能應用之間的算力資源調(diào)度(1)數(shù)據(jù)管理:提供模型訓練、驗證所需的數(shù)據(jù)管理平臺,支持和數(shù)據(jù)中臺對接,進行合規(guī)安全的專用數(shù)據(jù)集的構建和管理(2)標注流程管理:提供基于醫(yī)療標注要求的全流程可追溯的管理(3)數(shù)據(jù)智能標注:提供內(nèi)置醫(yī)療影像、醫(yī)療文本模型、醫(yī)療大模型的全自動、半自動、全手動的標注工具,支持混合醫(yī)療模態(tài)數(shù)據(jù)集自動融合(1)模型研發(fā):提供從模型構建、訓練、調(diào)優(yōu)到評估的全流程研發(fā)支持(2)分布式訓練:支持超大規(guī)模、大模型的分布式訓練,支持數(shù)據(jù)并行、模型并行、復雜并行工作流的訓練模式(1)模型、數(shù)據(jù)集市:實現(xiàn)模型、數(shù)據(jù)到集市的發(fā)布,調(diào)用部署(2)MaaS服務能力:提供模型即服務的能力,通過平臺提供各種模型服務的接口(3)推理服務:優(yōu)化模型的推理過程,提供自動化的部署能力,提供模型推理的量化優(yōu)化工具(4)調(diào)度服務:提供基于模型推理過程中的并發(fā),進行多模型、彈性的調(diào)度(5)模型微調(diào):基于現(xiàn)有基礎模型的快速微調(diào)(3)AI數(shù)據(jù)、AI訪問的匯聚和訪問控制,AI數(shù)據(jù)的主動結構化(4)通過AI結果的指標,自動進行多場景、多應用的聯(lián)動計算,提高AI應用的自動化和智能化水平(5)檢索引擎,可以對歷史AI結果進行大規(guī)模檢索,幫助快速查找和分析,支持更明智的決策。(1)模型測試:提供模型測試環(huán)境和工具,確保模型質(zhì)量和性能
(2)運營管理:提供對模型質(zhì)量的反饋和收集,提供模型調(diào)用過程中的記錄和回顧反饋(1)提供信息采集內(nèi)置工具,支持對文本、網(wǎng)頁、數(shù)據(jù)中臺等系統(tǒng)中提取信息(2)支持基于大模型的文本向量化工具、醫(yī)療圖像向量化工具,向量數(shù)據(jù)庫、多維度的檢索功能(3)支持基于大模型的RAG模式的智能體構建、Agentic工作流構建輕代碼工具(4)支持通過服務接口、對話界面的方式提供給醫(yī)療場景應用使用。用戶通過填寫技能名稱、技能標識等完成技能創(chuàng)建,基于技能創(chuàng)建意圖,進行意圖編輯、測試驗證等功能應用;(1)可以從外部平臺或服務器上下載技能,批量導入到本地平臺;(2)支持技能編輯、技能刪除、單個技能下載和批量選中后下載等維護功能;(3)用戶通過填寫意圖名稱、意圖標識等完成創(chuàng)建,意圖標識不可更改,創(chuàng)建完成后即可基于意圖添加語料,進行語料結構化、技能構建、測試驗證等功能應用;(4)支持意圖的字段編輯、意圖刪除、單個意圖查詢功能;(5)支持讓機器理解用戶意圖的自然語言回答,具體包括:語料、實體、只能貼弧等功能;(6)支持提示意圖是否完成構建,待驗證語料是否包含非法字符,并對已完成構建的意圖進行驗證測試;(7)支持填寫實體名稱、實體標識、描述及內(nèi)容詞條來完成創(chuàng)建;(8)支持自建實體內(nèi)容的編輯、刪除、查詢;(9)支持病歷、報告、醫(yī)療文獻的自動摘要、關鍵詞提取、情感分析和主題建模;(10)支持理解復雜的醫(yī)學術語和上下文,支持醫(yī)生和患者的自然語言交互。(1)支持中文連續(xù)語音聽寫識別,標準或帶口音普通話、粵語的免切換;(2)支持中英文混合聽寫,提供中文中混讀少量的英文聽寫功能;(3)支持按數(shù)字串或數(shù)值讀多種方式的聽寫識別功能;(5)支持短語音(<60s)和連續(xù)超長語音(>3h)識別功能;(7)支持熱詞優(yōu)化,可在服務端添加個性化或全局熱詞,實時生效,提升專有詞匯的識別率;(8)支持對語音停止間隔進行參數(shù)配置,滿足不同場景需求;(10)支持文本規(guī)范化處理,如字母大小寫、數(shù)字串、醫(yī)學單位符號規(guī)整等;(11)支持服務端語音識別服務API和SDK調(diào)用,接口支持Android以及Windows系統(tǒng);(12)醫(yī)學AI中臺中文語音識別準確率達到96%及以上(第三方機構測試報告)。(1)實時將文字信息轉(zhuǎn)化為聲音信息;(2)支持多個醫(yī)療定制發(fā)音人,滿足多場景合成播報需要;(3)提供多檔語速配置,支持在語音合成時,靈活改變語音播放速度;(4)提供多檔音量配置,支持在語音合成時,靈活控制音量的大??;(5)支持中英文文本的混合播報,其中中文支持普通話和粵語和英語;(6)支持用戶自定義發(fā)音詞典、停頓優(yōu)化等參數(shù)設置的標記語言;(8)醫(yī)學AI中臺中英文語音合成自然度達到4.5分及以上。(1)使用圖像識別技術來自動檢測和分析醫(yī)療圖像,如X光片、CT掃描、MRI圖像和病理切片等,以輔助醫(yī)生進行疾病診斷和治療規(guī)劃。(2)利用卷積神經(jīng)網(wǎng)絡(CNNs)等模型,從圖像中自動學習到復雜的特征表示,用于疾病的識別和分類。;(3)對醫(yī)療圖像進行預處理,包括圖像增強、噪聲去除、對比度調(diào)整等,以提高圖像的質(zhì)量和特征的可辨識性;(4)結合如MRI和CT圖像等多種類型的圖像信息機型進行多模態(tài)融合,以獲得更全面的診斷依據(jù),提高檢測的準確性和可靠性;(5)利用圖像分割和三維重建技術進行可視化處理,幫助醫(yī)生更好地理解和展示病變的位置和范圍:(6)利用計算機分析人臉圖像,提取特征并與數(shù)據(jù)庫中存儲的模板比對,以確認個人身份的生物識別技術。應用于醫(yī)院的患者身份確認和重要區(qū)域的人員管理等安全驗證、訪問控制等領域。AI中臺基于資源進行建模和應用支撐,其支撐流程如下:(1)利用模型開發(fā)組件,notebook代碼式開發(fā)和工作流拖拉拽組件式,選擇機器學習框架的鏡像構建模型開發(fā)環(huán)境;(2)利用模型開發(fā)組件實現(xiàn)模型開發(fā),并設置模型訓練參數(shù),包括計算資源選擇,評估方法等實現(xiàn)模型訓練任務創(chuàng)建,并啟動模型訓練任務;(3)利用模型管理將模型訓練的模型進行統(tǒng)一管理,并設計模型對比、模型版本、模型評估等功能;(4)利用模型管理中抽象的模型將進行模型服務發(fā)布,選擇計算資源、模型路徑、啟動參數(shù)等,實現(xiàn)模型服務發(fā)布。在服務詳情內(nèi)創(chuàng)建模型接口,模型接口對應每一項模型服務的子功能,利用接口實現(xiàn)應用支持。考慮系統(tǒng)數(shù)據(jù)源的復雜性和來源多樣性,平臺支持訪問廣泛的數(shù)據(jù),包括:結構化數(shù)據(jù)、半結構化數(shù)據(jù)、非結構化數(shù)據(jù),內(nèi)部數(shù)據(jù)、外部數(shù)據(jù)。(1)為保證數(shù)據(jù)源對接操作的靈活、易用性,數(shù)據(jù)源對接提供圖形化參數(shù)置界面操作,無需掌握復雜的各種數(shù)據(jù)庫技術;(2)支持本地文件的數(shù)據(jù)源接入;(3)支持常見文件格式(txt、csv、Excel等)的數(shù)據(jù)源接入;(4)支持傳統(tǒng)關系型數(shù)據(jù)庫(至少支持Oracle、PostgreSQL、MYSQL)的數(shù)據(jù)源接入;(5)支持分布式數(shù)據(jù)存儲(HIVE、HDFS等)的數(shù)據(jù)源接入;(6)支持MPP數(shù)據(jù)庫(Greenplum、Teradata等)的數(shù)據(jù)源接入;(7)支持非結構化數(shù)據(jù)(文本、圖像、zip格式)的接入;(8)為方便數(shù)據(jù)分析人員進行快速的數(shù)據(jù)定位,針對接入的結構化數(shù)據(jù)需支持數(shù)據(jù)的預覽功能,圖表的形式展示數(shù)據(jù)樣本、字段、字段類型等內(nèi)容;(9)考慮到數(shù)據(jù)的安全性問題,需支持項目級別的數(shù)據(jù)隔離和授權管理。考慮到未來建模需求的普遍性,滿足更多數(shù)據(jù)分析人員甚至業(yè)務人員的建模需求,平臺需支持自動化建模能力,最大程度降低建模門檻,提高建模效率。(1)支持選擇數(shù)據(jù)集后一鍵自動化機器學習建模;(3)支持建模設計可視化,訓練過程可視化,建模成果可視化;(4)支持查看自動機器學習建模所得的機器學習模型的源代碼;(5)支持自動化選擇多種算法模型并調(diào)參優(yōu)化模型;(7)支持自動機器學習建模也一鍵生成可視化分析工作流,實現(xiàn)與拖拽式建模模塊的打通,以便用戶對其進行更加專業(yè)、靈活的優(yōu)化迭代。機器學習模型訓練的最終目標是為了滿足業(yè)務應用服務,平臺需提供模型由訓練環(huán)境到生產(chǎn)環(huán)境的一鍵式部署上線功能,降低模型上線的工程化難度,提高模型部署效率。在線模型服務支持在線部署應用,以API的形式面向上層業(yè)務提供服務。平臺支持多種調(diào)用方式,并提供相應的代碼樣例,包括但不限于同步API調(diào)用、消息隊列異步調(diào)用的實時模型應用方式以及批處理的非實時模型應用方式,從而滿足具有不同延時要求的場景的業(yè)務需求;模型生產(chǎn)化部署需包含特征工程,包含但不限于缺失值填充、歸一化、數(shù)值編碼、OneHot編碼、數(shù)據(jù)集拆分等方法,可以實現(xiàn)通過使用原始數(shù)據(jù)集進行模型調(diào)用;為保證業(yè)務安全、穩(wěn)定,需支持模型的上線審核;支持對模型的生命周期進行管理,提供包括部署、正式上線、灰度上線、影子上線、下線等操作。針對分析場景的多樣化需求和未來可能的數(shù)據(jù)建模需求,平臺需提高豐富的算法庫支持,要求包括:分類、聚類、回歸、關聯(lián)、時間序列、統(tǒng)計、推薦及文本挖掘等不同類型的算法,并支持開發(fā)人員進行自由擴展。支持包括Python2、Python3、PySpark等不同開發(fā)語言的算子。
特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時并不代表贊成其觀點或證實其描述,內(nèi)容僅供參考。版權歸原作者所有,若有侵權,請聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權。