久久最新最好视频|精品福利视频在线|狠狠狠干在线播放|色尼玛亚洲综合网|日韩加勒比无码AV|亚洲AV人人澡人人爽人人爱|国产精品免费怡红院|婷婷一区二区XXX|日韩成人一区二区三|欧美熟妇另类AAAAAA

歡迎訪問智慧醫(yī)療網(wǎng) | 網(wǎng)站首頁(yè)
 

臨床醫(yī)療大數(shù)據(jù)治理框架

發(fā)布時(shí)間:2024-01-29 來源: 古月言軒 瀏覽量: 字號(hào):【加大】【減小】 手機(jī)上觀看

打開手機(jī)掃描二維碼
即可在手機(jī)端查看

筆者從事醫(yī)療信息化多年,而今醫(yī)療大模型正當(dāng)風(fēng)頭無兩,而實(shí)際落地的應(yīng)用門可羅雀。無論如何,大模型將是未來的行業(yè)的重要方向,而沉淀在各大醫(yī)療機(jī)構(gòu)的臨床數(shù)據(jù)極有可能在未來發(fā)揮更大的價(jià)值,在此梳理醫(yī)療大數(shù)據(jù)治理體系,僅作學(xué)習(xí)記錄,歡迎同行專業(yè)人士閱后探討與指點(diǎn)。

筆者認(rèn)為醫(yī)療大數(shù)據(jù)治理分為以下4個(gè)方面:數(shù)據(jù)集成,數(shù)據(jù)存儲(chǔ),數(shù)據(jù)清洗,數(shù)據(jù)應(yīng)用,以下分別從這幾個(gè)方面分別進(jìn)行簡(jiǎn)要介紹。

1 數(shù)據(jù)集成

1.1 通用數(shù)據(jù)模型設(shè)計(jì)

由于國(guó)內(nèi)醫(yī)療信息化行業(yè)的廠商較多,醫(yī)院內(nèi)分散著眾多來自不同廠商的信息系統(tǒng),因此醫(yī)院的數(shù)據(jù)平臺(tái)建設(shè)首先要做的便是將不同系統(tǒng)中的數(shù)據(jù)進(jìn)行集成,包括HIS CIS RIS EMR LIS 等。數(shù)據(jù)集成過程是一個(gè)臟活、累活,原因是不同信息系統(tǒng)之間對(duì)于同一個(gè)字段的數(shù)據(jù)存儲(chǔ)格式可能不同,且業(yè)務(wù)系統(tǒng)的數(shù)據(jù)標(biāo)準(zhǔn)化程度不高,其設(shè)計(jì)本身只是為了滿足臨床的業(yè)務(wù)需求,可能根本不會(huì)關(guān)注數(shù)據(jù)質(zhì)量,因此數(shù)據(jù)模型設(shè)計(jì)的通用程度就顯得非常重要。OMOP針對(duì)臨床科研出了一份通用數(shù)據(jù)模型(CDM),但對(duì)于國(guó)內(nèi)的可適配性較差,因此需要結(jié)合國(guó)內(nèi)的實(shí)際情況,進(jìn)行通用數(shù)據(jù)模型的設(shè)計(jì)。
CDM的設(shè)計(jì)需要首先要考慮的問題是要集成哪些數(shù)據(jù),臨床業(yè)務(wù)數(shù)據(jù)庫(kù)中所有的表數(shù)據(jù)是否都要無腦接入,當(dāng)然不是!像業(yè)務(wù)系統(tǒng)的配置表信息、操作日志、操作過程記錄等一般不會(huì)關(guān)注,通用數(shù)據(jù)模型關(guān)注的是特定的時(shí)刻醫(yī)務(wù)人員出于對(duì)患者進(jìn)行健康關(guān)懷而進(jìn)行一系列操作的結(jié)果,例如翼醫(yī)生為患者開具處方,在通用數(shù)據(jù)模型中的體現(xiàn)是一張?zhí)幏降慕Y(jié)果,而對(duì)于審方的流程所涉及到過程不會(huì)關(guān)注。

1.2 數(shù)據(jù)集成方式

數(shù)據(jù)集成一般分為以下幾種方式:開庫(kù),接口,視圖
開庫(kù):即對(duì)方廠商提供生產(chǎn)庫(kù)或備份庫(kù)的只讀賬號(hào),直接對(duì)接數(shù)據(jù)庫(kù),通過ETL工具進(jìn)行數(shù)據(jù)抽取
接口或視圖:廠商本身有一套提供數(shù)據(jù)的接口、視圖 或 處于收費(fèi)目的而開發(fā)的
對(duì)接效率上,一般開庫(kù)的效率最高,視圖或接口調(diào)試周期相對(duì)較長(zhǎng)

2 數(shù)據(jù)存儲(chǔ)

2.1 業(yè)務(wù)數(shù)據(jù)庫(kù)

臨床業(yè)務(wù)數(shù)據(jù)庫(kù)通常采用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)來存儲(chǔ),如SQLSERVER,MySQL、ORACLE,這三種關(guān)系型數(shù)據(jù)庫(kù)語(yǔ)法區(qū)別不大,入門難度低,方便運(yùn)維,有較好的穩(wěn)定性。也有部分HIS廠商如某華用的是國(guó)外的一款數(shù)據(jù)庫(kù),在國(guó)內(nèi)比較小眾,這個(gè)對(duì)DBA不太友好,跳槽難度較大…
總而言之,臨床業(yè)務(wù)數(shù)據(jù)庫(kù)一般采用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù),穩(wěn)定性較好,基于關(guān)系模式進(jìn)行數(shù)據(jù)庫(kù)設(shè)計(jì)。為了提高查詢效率,對(duì)于一些大表會(huì)進(jìn)行分庫(kù)分表的操作,例如只存儲(chǔ)今年的數(shù)據(jù),往年的數(shù)據(jù)分開存儲(chǔ)。

2.2 數(shù)據(jù)倉(cāng)庫(kù)

很多人可能聯(lián)想到醫(yī)院的歷年來的數(shù)據(jù)量非常大,集成到一個(gè)地方傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)肯定hold不住。在筆者看來,基于單體醫(yī)院數(shù)據(jù)中心的數(shù)據(jù)庫(kù)選擇,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)完全可以cover。除卻影像文件之外,普通三甲醫(yī)院近10年的數(shù)據(jù)量,過濾掉一些配置數(shù)據(jù)、日志記錄、審計(jì)數(shù)據(jù),數(shù)據(jù)量在1-3T之間,部分大表完全可以采用分表的方式來解決,個(gè)人推薦PG。

3 數(shù)據(jù)清洗

數(shù)據(jù)清洗依然是一個(gè)比較耗費(fèi)精力的體力活,原因是數(shù)據(jù)清洗的標(biāo)準(zhǔn)往往是企業(yè)內(nèi)部制定的,尚未形成行業(yè)標(biāo)準(zhǔn)。而制定企業(yè)內(nèi)部的數(shù)據(jù)標(biāo)準(zhǔn)本身就是一件復(fù)雜且涉及到多方角色的事情,需要讓研發(fā)、產(chǎn)品、數(shù)據(jù)治理團(tuán)隊(duì)之間的達(dá)成共識(shí),在共識(shí)的標(biāo)準(zhǔn)基礎(chǔ)上進(jìn)行產(chǎn)品設(shè)計(jì)、產(chǎn)品研發(fā)和數(shù)據(jù)清洗才會(huì)讓各個(gè)角色工作開展的更加順暢。但現(xiàn)實(shí)往往為了趕進(jìn)度,產(chǎn)品研發(fā)或者數(shù)據(jù)清洗工作在沒有形成標(biāo)準(zhǔn)的時(shí)候已經(jīng)開始,當(dāng)產(chǎn)品正式上線時(shí),產(chǎn)研團(tuán)隊(duì)和數(shù)據(jù)治理團(tuán)隊(duì)就開始上演“誰(shuí)是大廚”的戲碼。
筆者認(rèn)為,數(shù)據(jù)清洗主要包含以下幾個(gè)部分:數(shù)據(jù)維度清洗(患者維度,就診維度)、數(shù)據(jù)類型統(tǒng)一(數(shù)據(jù)類型轉(zhuǎn)換、臟數(shù)據(jù)過濾)、小字典映射(例如 性別,婚姻狀態(tài)等)、大字典映射(如診斷、檢驗(yàn)等字典)。
數(shù)據(jù)清洗不是一次性工作,清洗到何種程度沒有標(biāo)準(zhǔn),會(huì)隨著產(chǎn)品需求或認(rèn)知的變化而迭代,前期需要把數(shù)據(jù)維度統(tǒng)一、類型統(tǒng)一、基本的編碼名稱映射做完。

4 數(shù)據(jù)應(yīng)用

當(dāng)下醫(yī)療數(shù)據(jù)的主要應(yīng)用于臨床科研、醫(yī)療質(zhì)控、統(tǒng)計(jì)報(bào)表。
講真,由于數(shù)據(jù)質(zhì)量問題,臨床數(shù)據(jù)應(yīng)用于科研還有很長(zhǎng)的路要走,需要醫(yī)生、信息化廠商共同重視數(shù)據(jù)質(zhì)量,才能發(fā)揮醫(yī)療數(shù)據(jù)的價(jià)值。


智慧醫(yī)療網(wǎng) ? 2022 版權(quán)所有   ICP備案號(hào):滬ICP備17004559號(hào)-5