近年來,隨著醫(yī)療衛(wèi)生信息化的迅速發(fā)展,大數(shù)據(jù)在醫(yī)藥研發(fā)、疾病管理、公共衛(wèi)生和健康管理等方面逐漸突顯出優(yōu)勢。
對于研究型醫(yī)院而言,對已有的臨床數(shù)據(jù)的回顧性研究,是分析研究疾病最基本、最重要的研究方法之一。依托院內(nèi)的臨床大數(shù)據(jù)平臺和臨床數(shù)據(jù)中心,對歷史數(shù)據(jù)進行回顧性統(tǒng)計分析,分析結(jié)果將為醫(yī)生臨床診療全過程提供疾病共享的發(fā)病及治療總體情況信息,幫助醫(yī)生科學(xué)決策,提高診療水平。
1、數(shù)據(jù)標準化與一致性:考察對應(yīng)評價項目中關(guān)鍵數(shù)據(jù)項內(nèi)容與字典數(shù)據(jù)內(nèi)容的一致性。以數(shù)據(jù)字典項目為基準內(nèi)容值,考察實際數(shù)據(jù)記錄中與基準一致內(nèi)容所占的比例。一致性系數(shù)=數(shù)據(jù)記錄對應(yīng)的項目中與字典內(nèi)容一致的記錄數(shù)/數(shù)據(jù)記錄項的總記錄數(shù)。
2、數(shù)據(jù)完整性:考察對應(yīng)項目中必填項數(shù)據(jù)的完整情況、常用項數(shù)據(jù)的完整情況。必填項是記錄電子病歷數(shù)據(jù)時必須有的內(nèi)容。常用項是電子病歷記錄用于臨床決策支持、質(zhì)量管理應(yīng)用時所需要的內(nèi)容。以評價項目列出的具體項目清單為基準,考察項目清單所列實際數(shù)據(jù)記錄中空項(或內(nèi)容少于合理字符)項所占的比例。完整性系數(shù)=(1 - 項目空值(或內(nèi)容少于合理字符)記錄數(shù))/項目總記錄數(shù)。對于結(jié)構(gòu)化數(shù)據(jù),直接用數(shù)據(jù)項目的內(nèi)容進行判斷;對于文件數(shù)據(jù),可使用文件內(nèi)容字符數(shù)、特定的結(jié)構(gòu)化標記要求內(nèi)容進行判斷。
3、數(shù)據(jù)整合性能:考察對應(yīng)項目中的關(guān)鍵項數(shù)據(jù)與相關(guān)項目(或系統(tǒng))對應(yīng)項目可否對照或關(guān)聯(lián)。按照列出的兩個對應(yīng)考察項目相關(guān)的數(shù)據(jù)記錄中匹配對照項的一致性或可對照性,需要從兩個層次評估:是否有對照項;對照項目數(shù)據(jù)的一致性。數(shù)據(jù)整合性系數(shù)=對照項可匹配數(shù)/項目總記錄數(shù)??罩担ɑ蚩崭裰担┳鳛椴豢善ヅ漤椞幚怼?/span>
4、數(shù)據(jù)及時性:考察對應(yīng)項目中時間相關(guān)項完整性、邏輯合理性。根據(jù)列出時間項目清單內(nèi)容進行判斷,主要看時間項是否有數(shù)值,按照內(nèi)容是否符合時間順序關(guān)系。數(shù)據(jù)及時性系數(shù)=數(shù)據(jù)記錄內(nèi)容符合邏輯關(guān)系時間項數(shù)量/考察記錄時間項目總數(shù)量。針對每個項目,需要列出進行考察的時間項目清單以及這些項目之間的時間順序、時間間隔等邏輯關(guān)系。
回答:在國家大力發(fā)展區(qū)域醫(yī)聯(lián)體的前提下,醫(yī)院作為區(qū)域醫(yī)療的一部分,原則上標準體系應(yīng)符合上級部門的管理要求。
3、如何協(xié)調(diào)統(tǒng)計不同廠商直接因為數(shù)據(jù)接口不規(guī)范產(chǎn)生的報表與HIS不一致問題?
回答:在醫(yī)院上新系統(tǒng)前,由信息中心主導(dǎo)自上而下,先建立起院內(nèi)的標準規(guī)范體系,以此體系來規(guī)范各系統(tǒng)開發(fā)廠商的開發(fā)行為,保證院內(nèi)數(shù)據(jù)接口的規(guī)范性及標準性。
回答:通過建立院內(nèi)的數(shù)據(jù)標準和質(zhì)量體系,可以幫助醫(yī)院梳理出符合醫(yī)院實際的診療數(shù)據(jù),舉例來說,對門診診療過程的相關(guān)數(shù)據(jù)進行規(guī)范化后,可以建立院內(nèi)的就診知識庫,結(jié)合歷史的患者主訴和對應(yīng)診療方案,可以幫助醫(yī)院建立起符合醫(yī)院實際的導(dǎo)診模型,為患者就醫(yī)提供便利。
回答:幫助串聯(lián)起完整的就診數(shù)據(jù),關(guān)聯(lián)其他業(yè)務(wù)系統(tǒng)的數(shù)據(jù),以患者為中心將檢驗和檢查業(yè)務(wù)數(shù)據(jù)整合到患者的就診數(shù)據(jù)集中,同時也為檢驗檢查業(yè)務(wù)提供個性化的決策支持。
回答:數(shù)據(jù)質(zhì)量是重要的量化指標之一,相比于其他主觀評價,數(shù)據(jù)質(zhì)量更能從數(shù)據(jù)上反映醫(yī)院電子病歷的實際應(yīng)用情況,建立數(shù)據(jù)質(zhì)量體系,針對院內(nèi)數(shù)據(jù)進行數(shù)據(jù)治理勢在必行。
回答:數(shù)據(jù)元標準可以參考2011年8月國家衛(wèi)生計生委統(tǒng)計信息中心編制頒布的《衛(wèi)生信息數(shù)據(jù)元目錄》;數(shù)據(jù)集標準可參考2014年5月30日國家衛(wèi)生計生委統(tǒng)計信息中心頒布的《WS 445-2014 電子病歷基本數(shù)據(jù)集》;其他衛(wèi)生行業(yè)的業(yè)務(wù)標準與規(guī)范主要包括《病歷書寫規(guī)范(2010)》、《電子病歷基本規(guī)范(2010)》、《中醫(yī)電子病歷基本規(guī)范 (2010)》、《住院病案首頁 (2011)》、《中醫(yī)住院病案 首頁 (2011)》等衛(wèi)生行業(yè)規(guī)范。2016年國家衛(wèi)生計生委統(tǒng)計信息中心頒布《WS/T-500電子病歷共享文檔規(guī)范》,在結(jié)構(gòu)上遵循《衛(wèi)生信息共享文檔編制規(guī)范》,并結(jié)合業(yè)務(wù)實際進行了細化和應(yīng)用落地。該標準使用可擴展標記語言(Extensible MarkupLanguage,XML),遵循HL7 RIM模型,借鑒了國際上已有的成熟文檔架構(gòu)標準ISO/HL7 CDA R2三層架構(gòu),同時結(jié)合我國醫(yī)療衛(wèi)生業(yè)務(wù)需求,進行本土化約束和適當擴展,以適合我國衛(wèi)生信息共享文檔共享與交換。
回答一:例如區(qū)域臨床醫(yī)療數(shù)據(jù)可形成區(qū)域臨床醫(yī)療數(shù)據(jù)中心、以數(shù)據(jù)挖掘為技術(shù)核心為衛(wèi)生宏觀決策提供支持。基于真實醫(yī)療環(huán)境的大數(shù)據(jù)研究會給出真實的衛(wèi)生經(jīng)濟學(xué)指標,為政府部門決策提供客觀的數(shù)據(jù)支持,以更好地利用現(xiàn)有資源保障人民群眾的健康,指導(dǎo)醫(yī)生和患者選擇適宜的治療方案。
回答二:基于患者全診療流程數(shù)據(jù)的專病科研數(shù)據(jù)庫平臺。
回答:
1、數(shù)據(jù)的完整性,表述數(shù)據(jù)是否完整,有無缺失和漏項;
2、數(shù)據(jù)的一致性,表述同一數(shù)據(jù)的同一屬性在數(shù)據(jù)系統(tǒng)或數(shù)據(jù)集內(nèi)是否一致;
3、數(shù)據(jù)的關(guān)聯(lián)性,表述數(shù)據(jù)系統(tǒng)或數(shù)據(jù)集內(nèi)數(shù)據(jù)間是否存在邏輯、數(shù)值、應(yīng)用等方面的關(guān)聯(lián);
4、數(shù)據(jù)的有效性,表述數(shù)據(jù)是否滿足應(yīng)用系統(tǒng)定義的條件;
5、數(shù)據(jù)的唯一性,表述數(shù)據(jù)在數(shù)據(jù)系統(tǒng)或數(shù)據(jù)集內(nèi)是否存在重復(fù)記錄。
回答:舉例來說,一般臨床大數(shù)據(jù)分析包括幾個步驟:第一步對來自不同醫(yī)院信息系統(tǒng)的病人數(shù)據(jù)進行數(shù)據(jù)集成。第二步基于CDR構(gòu)造專題庫,確定:符合疾病特征的病例;確定需要的病例字段,對于結(jié)構(gòu)化的字段,需要從原始的電子病歷庫中抽取,例如年齡與性別,對于半結(jié)構(gòu)化或非結(jié)構(gòu)化字段,需要使用文本抽取等技術(shù),結(jié)合知識庫對其進行結(jié)構(gòu)化。在這個過程中,需要建立知識圖譜,以方便自動化的病例數(shù)據(jù)抽取。第三步需要對病例庫進行數(shù)據(jù)質(zhì)量評估,評估其是否適用于挖掘。評估指標包括數(shù)據(jù)完整性、一致性、醫(yī)療實體及其編碼的一致性、數(shù)據(jù)精確性等。若病歷庫達到評估要求,即可進行第四步的數(shù)據(jù)挖掘,如果不能,則需要回到前面步驟,重新抽取和整理數(shù)據(jù)。第四步,確定挖掘目標,選擇合適的模型,設(shè)計并實施實驗。如果實驗發(fā)生問題,可能需要改進算法,也有可能是數(shù)據(jù)質(zhì)量緣故,需要回到前面步驟,重新抽取和整理數(shù)據(jù)。
回答:建立質(zhì)量體系主要應(yīng)集中在數(shù)據(jù)質(zhì)量問題和數(shù)據(jù)質(zhì)量評估方法的研究,不同的應(yīng)用場景對數(shù)據(jù)質(zhì)量要求應(yīng)該不相同,步驟通常包括以下:
1、收集評估需求。根據(jù)臨床醫(yī)生定義、疾病的診療指南、相關(guān)文獻等多個來源的需求,明確用戶使用數(shù)據(jù)的目的和重點關(guān)注的數(shù)據(jù)。
2、確定和采集評估數(shù)據(jù)。根據(jù)評估需求,明確所評估的數(shù)據(jù)范圍,抽取出待評估數(shù)據(jù)集。
3、建立評估需求與評估數(shù)據(jù)之間的映射關(guān)系。
4、提出質(zhì)量評估指標。根據(jù)用戶使用數(shù)據(jù)的目的選擇評估度量或自定義評估度量。
5、執(zhí)行數(shù)據(jù)質(zhì)量評估,針對以上每個評估度量通過自動執(zhí)行或人工評估進行數(shù)據(jù)質(zhì)量評估,根據(jù)評分標準得到評估結(jié)果。
6、分析評估結(jié)果。根據(jù)評估結(jié)果分析數(shù)據(jù)集的質(zhì)量問題,判定是否適合于研究目的。
回答:隨著醫(yī)療信息化的發(fā)展,各地醫(yī)療信息系統(tǒng)產(chǎn)生的數(shù)據(jù)不斷積累,已形成規(guī)模較大的數(shù)據(jù),是一筆寶貴的財富,其巨大價值亟待挖掘利用。然而,由于EMR數(shù)據(jù)來源于多個不同的信息系統(tǒng),經(jīng)歷了多次版本變化,數(shù)據(jù)的統(tǒng)一表示、關(guān)聯(lián)和集成存在各種問題。同時,醫(yī)生錄入缺乏語義規(guī)范,同一診斷與治療方案,不同醫(yī)生的錄入結(jié)果會不同。另外,EMR數(shù)據(jù)產(chǎn)生于病人真實的診療情況記錄,目的并不直接面向科學(xué)研究。一個診療質(zhì)量良好的病人記錄,未必可以產(chǎn)生滿足科研需求的數(shù)據(jù)記錄。因此,為了掌握EMR數(shù)據(jù)是否能夠或是多大程度上能夠支撐某一類臨床科研,需要在做科研之前,對數(shù)據(jù)進行質(zhì)量評估。評估結(jié)果可以用于設(shè)計與細化實驗分析過程,或是未來用于改造醫(yī)學(xué)系統(tǒng),建立院內(nèi)的數(shù)據(jù)質(zhì)量體系。
回答:數(shù)據(jù)質(zhì)量核心問題主要有3種,第一是數(shù)據(jù)輸入性錯誤,雖然輸入是符合邏輯的,但數(shù)據(jù)內(nèi)容無法保證真實性;第二是數(shù)據(jù)一致性問題,即數(shù)據(jù)庫保存的數(shù)據(jù)與實際不符,原因包括工作人員違規(guī)操作、數(shù)據(jù)轉(zhuǎn)換錯誤等;第三是數(shù)據(jù)顆粒度太粗,數(shù)據(jù)無法反映現(xiàn)實情況。
通過建立數(shù)據(jù)質(zhì)量體系可以解決上述問題。具體內(nèi)容包括:
(1)建立保證數(shù)據(jù)質(zhì)量的工作流程;
(2)對提高數(shù)據(jù)錄入的環(huán)境和系統(tǒng)進行投資,如更新現(xiàn)有系統(tǒng),降低界面錄入的出錯率,培訓(xùn)錄入人員,增加新的技術(shù)和設(shè)備提高錄入效率;
(3)制定元數(shù)據(jù)和標準化規(guī)范化的術(shù)語庫,提高數(shù)據(jù)的準確性,便于檢索和統(tǒng)計。
(4)建立數(shù)據(jù)質(zhì)量監(jiān)控指標,隨時監(jiān)測和管理醫(yī)療數(shù)據(jù)的質(zhì)量;
(5)數(shù)據(jù)清洗維護。
智慧醫(yī)療網(wǎng) ? 2022 版權(quán)所有 ICP備案號:滬ICP備17004559號-5