醫(yī)療行業(yè)的健康醫(yī)療數(shù)據(jù)一方面為智慧醫(yī)院建設提供重要支撐,蘊含著巨大價值,另一方面也包含了大量的個人隱私,隱藏著巨大的數(shù)據(jù)安全風險。如何在充分釋放健康醫(yī)療數(shù)據(jù)價值的同時,開展數(shù)據(jù)安全治理工作,防范健康醫(yī)療數(shù)據(jù)泄露、保護患者個人隱私,是健康醫(yī)療大數(shù)據(jù)時代的重中之重。
醫(yī)療機構在進行數(shù)據(jù)安全治理工作時,首先需要梳理現(xiàn)有數(shù)據(jù)資產(chǎn)、對數(shù)據(jù)資產(chǎn)進行分類分級工作,按照國家、行業(yè)、地方的政策、標準、要求等進行歸類、確定等級,基于數(shù)據(jù)的分類分級給予數(shù)據(jù)不同的安全保護措施,以實現(xiàn)數(shù)據(jù)的開放利用和數(shù)據(jù)安全之間的平衡,切實提高數(shù)據(jù)安全保護的效率和效果。
安華金和數(shù)據(jù)安全評估系統(tǒng)(簡稱:DSAS)針對醫(yī)療數(shù)據(jù)應用場景、實現(xiàn)電子病歷數(shù)據(jù)分類分級推出全新版本,助力醫(yī)療行業(yè)數(shù)據(jù)安全治理第一步——醫(yī)療數(shù)據(jù)分類分級工作的有序開展。
\ | /
第一步:預置規(guī)則
HIPPA《健康保險可攜性和責任法案》、《中華人民共和國個人信息保護法》、《信息安全技術 個人信息安全規(guī)范》(GB/T 35273-2020)都提出了個人信息保護要求,特別是保護個人可識別信息。因此在龐雜的醫(yī)療數(shù)據(jù)中,同樣需將“個人可識別信息”作為敏感數(shù)據(jù)類別之一,并對患者和醫(yī)護的個人信息加以分別。其中“患者個人信息”根據(jù)標識性強弱分為以下四類:
01 個人身份標識性信息(A4數(shù)據(jù)) 屬于個人信息的強標識數(shù)據(jù),能夠唯一關聯(lián)到個人,包括:證件號碼、電話號碼、健康卡號、城鄉(xiāng)居民健康檔案編號、地址 ( 詳細到門牌號 )、電子郵件地址等。 02 個人間接標識性信息(A3數(shù)據(jù)) 屬于個人信息的標識數(shù)據(jù),能夠間接關聯(lián)到個人,包括:姓名、生物標識(如基因)、(個人手機 / 設備)設備標識符和序列號、IP 地址(個人設備地址)、全臉攝影圖像和任何類似的圖像等。 03 個人弱標識性信息(A2數(shù)據(jù)) 能夠確定較小范圍的個人弱標識數(shù)據(jù),包括:出生日期、所屬行政區(qū)域、郵政編碼、單位電話號碼、單位名稱等。 04 個人特征性(統(tǒng)計)信息(A1數(shù)據(jù)) 包括:年齡、血型、性別、學歷、籍貫等,以及相應的代碼。
“醫(yī)護個人信息”同樣根據(jù)個人信息的標識性強弱分為:B4數(shù)據(jù)、B3數(shù)據(jù)、B2數(shù)據(jù)、B1數(shù)據(jù)四類。
“電子病歷診療數(shù)據(jù)”是體現(xiàn)患者就醫(yī)過程的完整數(shù)據(jù),可以結合診療過程對收集、產(chǎn)生、處理的數(shù)據(jù)進行分類,包括:掛號、處方、用藥、健康狀況(病史、過敏史等)、醫(yī)囑信息、檢查檢驗信息、手術麻醉信息、助產(chǎn)信息、護理信息、出入院記錄信息等,覆蓋完整的電子病歷診療過程,并根據(jù)患者電子病歷診療數(shù)據(jù)的隱私程度進行分級。
(1)C4數(shù)據(jù) 門診號、處方號、住院號等可以檢索到患者的整個診療記錄的強標識數(shù)據(jù)。 (2)C3數(shù)據(jù) 病癥、用藥、醫(yī)囑、檢驗等反映患者的病情和身體特征的隱私數(shù)據(jù)、臨床數(shù)據(jù)等。 (3)C2數(shù)據(jù) 麻醉、測量、護理、耗材等診療的過程產(chǎn)生的數(shù)據(jù),不體現(xiàn)患者診療隱私信息等。 (4)C1數(shù)據(jù) 醫(yī)院的設備、藥品等診療無關的醫(yī)院基礎資源和管理信息數(shù)據(jù)等。
安華金和數(shù)據(jù)安全評估系統(tǒng)(簡稱:DSAS)新版本中預置電子病歷分類分級落地指南,定義了“患者個人信息”、“醫(yī)護個人信息”、“電子病歷診療數(shù)據(jù)”等類別和級別,并預置500余自動分類分級規(guī)則。
第二步:資產(chǎn)梳理
基于網(wǎng)絡嗅探技術,自動發(fā)現(xiàn)指定網(wǎng)段范圍下活躍或靜默的數(shù)據(jù)庫資產(chǎn);支持國內(nèi)外主流數(shù)據(jù)庫、大數(shù)據(jù)生態(tài)系統(tǒng)的數(shù)據(jù)掃描,梳理醫(yī)療數(shù)據(jù)資產(chǎn)清單,為分類分級、精細化管控奠定數(shù)據(jù)基礎。
第三步:分類分級
通過DSAS預置的500余醫(yī)療數(shù)據(jù)自動分類分級規(guī)則進行自動分類分級,標識“患者個人信息”、“醫(yī)護個人信息”、“電子病歷診療數(shù)據(jù)”等類別和級別。
同時也支持通過關鍵字智能分析技術,將電子病歷元數(shù)據(jù)中的表名、字段名進行自動拆解和自然語言分詞,提取其中有業(yè)務含義的關鍵字,并通過關鍵字的統(tǒng)計、聯(lián)動,形成電子病歷數(shù)據(jù)圖譜,快速獲得和關鍵字有關的所有字段,輔助人工核實分類分級。
數(shù)據(jù)不斷的產(chǎn)生、加工轉換、流轉,因此數(shù)據(jù)分類分級不是“一次性”的工作,而是需要建立策略化、自動化、流程化的分類分級系統(tǒng)實現(xiàn)“持續(xù)”的數(shù)據(jù)分類分級。DSAS基于長短期記憶網(wǎng)絡(LSTM,Long Short-Term Memory)時間循環(huán)神經(jīng)網(wǎng)絡機器學習算法,助力大規(guī)模、可持續(xù)分類分級。對已經(jīng)完成的“分類分級”數(shù)據(jù)作為樣本進行自動學習,建立醫(yī)院電子病歷分類分級模型。再對新的數(shù)據(jù)通過模型完成自動分類分級工作,形成可滿足大規(guī)模數(shù)據(jù)分類分級和持續(xù)變化數(shù)據(jù)分類分級的能力,實現(xiàn)數(shù)據(jù)分類分級自動化、可持續(xù)。
第四步:場景化數(shù)據(jù)集合分級
對電子病歷中“個人信息”和“診療數(shù)據(jù)”的字段進行分類分級是數(shù)據(jù)安全治理的第一步。在實際業(yè)務場景中,所有對數(shù)據(jù)的存儲和數(shù)據(jù)的訪問都將以數(shù)據(jù)集合的形式存在,單一字段的數(shù)據(jù)通常不會泄露患者的隱私數(shù)據(jù)。因此,對數(shù)據(jù)集合的定級是促進數(shù)據(jù)的開放利用和數(shù)據(jù)安全之間平衡的重要措施。
L4級數(shù)據(jù)集合 L4級屬于高敏感數(shù)據(jù)集合,會直接泄露患者的個人隱私數(shù)據(jù)(A3 及以上數(shù)據(jù))和個人診療敏感數(shù)據(jù)(C3 數(shù)據(jù));例如:電話號碼+姓名、電話號碼+現(xiàn)病史等。 L3級數(shù)據(jù)集合 L3級屬于敏感數(shù)據(jù)集合,會對個人隱私數(shù)據(jù)(A3 及以上)和個人診療敏感數(shù)據(jù)(C3 數(shù)據(jù))提供較為直接的引導;例如:IP+生物標識、姓名+門診號等。 L2級數(shù)據(jù)集合 L2級屬于弱敏感數(shù)據(jù)集合,直接或間接地泄露患者的就診過程數(shù)據(jù)(C2 數(shù)據(jù))或者個人一般數(shù)據(jù) (A2 及以下 ),會引起對患者某方面病癥的猜測;或者會對發(fā)現(xiàn)個人高度隱私數(shù)據(jù)(A3 及以上)和個人診療敏感數(shù)據(jù)(C3 數(shù)據(jù))提供較為間接的引導;例如:姓名+出生日期、姓名+護理記錄。 L1級數(shù)據(jù)集合 L1級屬于非敏感數(shù)據(jù)集合,不會泄露個人隱私和患者隱私;例如:出生日期+性別、年齡+病癥。
基于業(yè)務場景所需的字段進行場景化數(shù)據(jù)集合分級,不僅能夠?qū)⑨t(yī)療數(shù)據(jù)的分類分級結果切實地應用到實際業(yè)務場景當中;同時也是對每一個業(yè)務場景的數(shù)據(jù)集合交易,明確標識其敏感級別,為數(shù)據(jù)、數(shù)據(jù)集合的應用提供安全管控依據(jù);是“讓安全‘懂’業(yè)務、讓業(yè)務‘知’安全”的關鍵。
\ | /
智慧醫(yī)療網(wǎng) ? 2022 版權所有 ICP備案號:滬ICP備17004559號-5