應(yīng)用需求決定平臺架構(gòu),平臺架構(gòu)決定基礎(chǔ)架構(gòu)。三甲醫(yī)院大數(shù)據(jù)應(yīng)用場景主要分成臨床、運營、科研三大類,分別對應(yīng)臨床數(shù)據(jù)中心(CDR),運營數(shù)據(jù)中心(ODR)和科研數(shù)據(jù)中心(RDR),臨床數(shù)據(jù)以電子病歷為核心,目前隨著結(jié)構(gòu)化電子病歷的普及,純文本的數(shù)據(jù)越來越少,NLP的技術(shù)依然適合,運營數(shù)據(jù)則大多數(shù)為結(jié)構(gòu)化數(shù)據(jù),科研數(shù)據(jù)則在臨床數(shù)據(jù)的基礎(chǔ)上有更多的多媒體數(shù)據(jù)(多數(shù)為影像數(shù)據(jù))、實驗數(shù)據(jù)和隨訪數(shù)據(jù)。大數(shù)據(jù)平臺基礎(chǔ)架構(gòu)設(shè)計需要支撐上述需求的實現(xiàn),計算能力、存儲能力和安全是基礎(chǔ)架構(gòu)建設(shè)的三個重要方面。計算能力主要在數(shù)據(jù)采集、預(yù)處理、實時計算和分析階段進(jìn)行支持。存儲能力則是支持分析數(shù)據(jù)所需要存儲資源和存儲空間的支持。三甲醫(yī)院大數(shù)據(jù)平臺大多數(shù)基于Hadoop等分布式平臺,采用內(nèi)存數(shù)據(jù)庫或圖數(shù)據(jù)庫進(jìn)行數(shù)據(jù)存儲。
為幫助三甲醫(yī)院用戶更好地建設(shè)大數(shù)據(jù)平臺基礎(chǔ)架構(gòu),專家與醫(yī)院同行一起從四個角度出發(fā)交流,供更多同行參考,包括:基于臨床、運營和科研大數(shù)據(jù)平臺的內(nèi)容和要求角度、基于醫(yī)院大數(shù)據(jù)平臺建設(shè)的技術(shù)架構(gòu)角度、基于大數(shù)據(jù)平臺建設(shè)標(biāo)準(zhǔn)和目標(biāo)角度、基于大數(shù)據(jù)的存儲規(guī)劃角度,以及交流達(dá)成的共識總結(jié)。
通過本場醫(yī)院同行的交流活動達(dá)成了一些交流共識如下,僅供參考:
(1)從大數(shù)據(jù)平臺建設(shè)內(nèi)容方面來說,醫(yī)院大數(shù)據(jù)平臺圍繞臨床、運營以及科研等三個主要層面進(jìn)行,新技術(shù),新手段也都需要圍繞這三個方面,因此,CDR、ODR、RDR的建設(shè)應(yīng)該說是囊括了醫(yī)院信息化大數(shù)據(jù)平臺的主要內(nèi)容。(2)從技術(shù)架構(gòu)角度來說,基于分布式存儲的架構(gòu)平臺似乎成為主流,但是目前正在逐步從分布式過渡到云,主要以醫(yī)院的私有云+公有云的混合模式出現(xiàn)。(3)從建設(shè)標(biāo)準(zhǔn)和目標(biāo)角度,大數(shù)據(jù)平臺應(yīng)具有異構(gòu)數(shù)據(jù)的標(biāo)準(zhǔn)化,數(shù)據(jù)處理流程,分析過程標(biāo)準(zhǔn)化的功能,同時,數(shù)據(jù)可視化也應(yīng)是目標(biāo)之一。(4)從數(shù)據(jù)存存儲選型角度,混合SSD和傳統(tǒng)SATA的存儲器搭建SAN網(wǎng)絡(luò)是一種路線,分布式存儲的效果主要體現(xiàn)在不少醫(yī)院早些年建成的基于Hadoop架構(gòu)。從科研平臺未來的發(fā)展看,采用支持Hadoop的分布式存儲,實現(xiàn)計算與存儲的分離,是未來的一個趨勢。一、基于臨床、運營和科研大數(shù)據(jù)平臺的內(nèi)容和要求角度
1、三甲醫(yī)院大數(shù)據(jù)平臺如何建設(shè),才能滿足具有多模態(tài),異構(gòu)化,海量化的臨床、運營以及科研數(shù)據(jù)的整合?
【問題描述】眾所周知,三級醫(yī)院經(jīng)過十幾年、幾十年的信息化建設(shè),已經(jīng)建設(shè)成為具有臨床數(shù)據(jù)支撐,科研支撐,以及運營支撐的全方位信息化應(yīng)用的場景,但是隨著大數(shù)據(jù)分析廣泛應(yīng)用,海量數(shù)據(jù)的整合挖掘及再利用也提上日程,部分醫(yī)院走在了前列,但是在開展的過程中遇到了不少問題,比如,數(shù)據(jù)的模式的多樣性造成了對數(shù)據(jù)使用的難點。醫(yī)療數(shù)據(jù)中包含了文本,圖像,視頻等,還有不同模式的數(shù)據(jù)。如何將這些數(shù)據(jù)整合利用,以便發(fā)揮數(shù)據(jù)的最大利用價值成為目前醫(yī)療大數(shù)據(jù)平臺的研究方向之一?@zyp8365 廣東省中醫(yī)院 高級工程師:數(shù)據(jù)的多模態(tài)、異構(gòu)化、海量化必然導(dǎo)致其支撐架構(gòu)的多樣性。哪些數(shù)據(jù)適合關(guān)系型數(shù)據(jù)庫,哪些數(shù)據(jù)適合分布式數(shù)據(jù)庫,存儲的選擇亦是如此,也要結(jié)合數(shù)據(jù)類型,數(shù)據(jù)的重要性、時效性要求以及業(yè)務(wù)的實際要求等因素綜合考慮。數(shù)據(jù)的整合利用離不開如下幾個方面的工作:
1、大數(shù)據(jù)平臺需求與多元化采集數(shù)據(jù)源的梳理;2、數(shù)據(jù)的標(biāo)準(zhǔn)化規(guī)范化治理;4、數(shù)據(jù)的知識化社會化的應(yīng)用。@spgoall 和祐國際醫(yī)院 信息管理部部長:可以考慮先建立數(shù)據(jù)湖,把數(shù)據(jù)整合后,再按主題做篩選和清洗。
2、信息部門該如何規(guī)劃CDR、ODR、RDR的裸金層?
【問題描述】當(dāng)前建設(shè)CDR、ODR、RDR數(shù)據(jù)中心是醫(yī)療圈熱門的話題,信息部門該如何規(guī)劃CDR、ODR、RDR的裸金層,一次把基礎(chǔ)架構(gòu)搭建立起來,避免重復(fù)建設(shè)?@zyp8365 廣東省中醫(yī)院 高級工程師:目前,CDR、ODR、RDR的定位和作用醫(yī)療圈是有共識的,但是其建設(shè)方式、模式及數(shù)據(jù)交互方式尚處于百花齊放的階段。不同的公司有各自的解決方案,不同的醫(yī)院和機(jī)構(gòu)也根據(jù)自己實際業(yè)務(wù)的需求和特點進(jìn)行著有針對性的建設(shè),所以我理解因為其建設(shè)的非標(biāo)準(zhǔn)化特性,希望有一種規(guī)劃、或者一種模式把基礎(chǔ)架構(gòu)搭建起來,然后后續(xù)不再變動,不再調(diào)整,從而避免重復(fù)建設(shè),這種本身是與信息化技術(shù)與發(fā)展的日新月異的特性和特點相違背的。當(dāng)下,數(shù)字中國日益提上日程、物聯(lián)網(wǎng)、5G的快速應(yīng)用、區(qū)塊鏈、數(shù)字孿生、人工智能等新技術(shù)與醫(yī)療的融合也將日益緊密,數(shù)據(jù)中臺的討論也不絕于耳。所以CDR、ODR、RDR這種適合當(dāng)下的數(shù)據(jù)層架構(gòu)和方法論是否適合未來3-5年的技術(shù)發(fā)展尚不可知,所以其基礎(chǔ)架構(gòu)的不確定性也更加不能形成定論。目前就CDR、ODR、RDR的建設(shè)而言,個人覺得,應(yīng)該把握幾個建設(shè)原則:(1)分類原則。不管技術(shù)如何發(fā)展,架構(gòu)如何調(diào)整,數(shù)據(jù)的分類應(yīng)該是不會有太大的調(diào)整。結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化,其適宜的存儲架構(gòu)是有明確的規(guī)范和要求的,數(shù)據(jù)的重要性與否,數(shù)據(jù)的響應(yīng)時效要求,數(shù)據(jù)容災(zāi)要求,這些都是數(shù)據(jù)分類的具體指標(biāo),也為我們底層架構(gòu)的建設(shè)提供指引,避免低需高配和高需低配的情況出現(xiàn),保證需求和配置的相適宜;所以針對不同數(shù)據(jù)類型和數(shù)據(jù)要求,要有與之相適應(yīng)的存儲底層,故數(shù)據(jù)中心的裸金層也是存在多種架構(gòu)存在的。(2)可擴(kuò)展原則。CDR、ODR和RDR,在建設(shè)初期,因為需求的不明確、中心數(shù)據(jù)的磨合、與各業(yè)務(wù)系統(tǒng)的交互和上層應(yīng)用的梳理等原因,前期數(shù)據(jù)體量不會太大,隨著業(yè)務(wù)的推進(jìn),技術(shù)、流程和方法的日趨成熟,需求也會處于井噴期,其數(shù)據(jù)增長也會指數(shù)型增長,原來的架構(gòu)應(yīng)該要充分考慮其可擴(kuò)展性,以及擴(kuò)展后保證數(shù)據(jù)性能、數(shù)據(jù)時效響應(yīng)等方面不會下降。
3、醫(yī)療大數(shù)據(jù)方面如何解決數(shù)據(jù)孤島和數(shù)據(jù)安全問題?
【問題描述】在醫(yī)療數(shù)據(jù)收集方面存在很多檢查設(shè)備,例如:纖支鏡 等單設(shè)備無法提取數(shù)據(jù)的問題。大數(shù)據(jù)處理過程中,如何保障數(shù)據(jù)的安全,以及隱私隱私問題?@zyp8365 廣東省中醫(yī)院 高級工程師:目前,的確存在很多單體設(shè)備的數(shù)據(jù)提取、存儲的問題,尤其是對一些專有設(shè)備如 纖支鏡 、腦電圖等,這些數(shù)據(jù)的采集要相應(yīng)的設(shè)備廠家能開放相應(yīng)的數(shù)據(jù)接口,目前很多這些設(shè)備的廠家基本都會有自己開發(fā)的系統(tǒng),也有一些廠家會開發(fā)相應(yīng)的系統(tǒng),對市面上的比較高占有率的產(chǎn)品類型進(jìn)行數(shù)據(jù)的提取開發(fā)。所以建議在采購該類設(shè)備的時候,一定要注意關(guān)注數(shù)據(jù)提取這塊,數(shù)據(jù)接口是否開放?通過特定數(shù)據(jù)線抑或是網(wǎng)絡(luò)傳輸?是否要專有信息系統(tǒng)抑或是市面上有可以統(tǒng)一匯集提取的軟件?這些都要考慮并且也要寫入采購合同中。大數(shù)據(jù)處理要嚴(yán)格執(zhí)行等保2.0的相關(guān)要求,數(shù)據(jù)的處理可以通過堡壘機(jī)等安全措施進(jìn)行操作,另外可以通過脫敏設(shè)備對敏感數(shù)據(jù)進(jìn)行脫敏,并且形成相應(yīng)的規(guī)范流程便于操作。數(shù)據(jù)安全要重視設(shè)備的投入、人員的管理、技術(shù)的提升,也要關(guān)注架構(gòu)的合理、流程的規(guī)范、舉措的到位。@spgoall 和祐國際醫(yī)院 信息管理部部長:檢查設(shè)備數(shù)據(jù)傳輸問題還是設(shè)備本身是否支持?jǐn)?shù)據(jù)輸出接口,這個需要聯(lián)合設(shè)備科在購買設(shè)備的時候就要把數(shù)據(jù)傳輸接口需求寫入招標(biāo)文件。大數(shù)據(jù)處理過程中的數(shù)據(jù)安全也應(yīng)該基于三級等保2.0的要求嚴(yán)格執(zhí)行,隱私問題還要增加動態(tài)脫敏、數(shù)據(jù)庫防火墻等設(shè)備
4、關(guān)于科研大數(shù)據(jù)平臺底層基礎(chǔ)架構(gòu)
【問題描述】科研大數(shù)據(jù)平臺現(xiàn)在發(fā)展方向主要有四個方向:影像,大樣本分析,多模態(tài),真實世界研究,目前以真實世界研究居多,但是趨勢是往多模態(tài)方向發(fā)展,這就要求傳統(tǒng)的文本,結(jié)構(gòu)化數(shù)據(jù)處理外,還需要結(jié)合影像圖片,甚至是超聲之類的視頻,對于這類數(shù)據(jù)處理,底層基礎(chǔ)架構(gòu)如何支撐?@zyp8365 廣東省中醫(yī)院 高級工程師:存儲層面可以考慮分布式存儲、對象存儲等方式;數(shù)據(jù)層面可以考慮分布式數(shù)據(jù)庫、圖數(shù)據(jù)庫等方式。
5、三甲醫(yī)院科研大數(shù)據(jù)平臺應(yīng)該具備哪些主要功能?
【問題描述】結(jié)合現(xiàn)今人工智能,數(shù)據(jù)科學(xué)的流行,三甲醫(yī)院對科研的發(fā)展愈加的重視,對于一個能夠完美支撐三甲醫(yī)院科研的數(shù)據(jù)平臺是非常必要的,但是從業(yè)務(wù)和建設(shè)者角度來看,臨床科研的需求和計算機(jī)專業(yè)從業(yè)者之間對于技術(shù)平臺的理解還有一定的差異,那么科研平臺應(yīng)該具有什么樣的功能,才能滿足或推動臨床科研的進(jìn)一步發(fā)展十分重要,這也是具備信息技術(shù)的從業(yè)人員需要搞清楚的問題。@zyp8365 廣東省中醫(yī)院 高級工程師:科研平臺作為醫(yī)院科研領(lǐng)域重要的業(yè)務(wù)平臺,要結(jié)合科研業(yè)務(wù)的特點進(jìn)行功能的設(shè)計。因為科研業(yè)務(wù)的復(fù)雜性和多樣性,所以也就導(dǎo)致科研平臺的功能是十分復(fù)雜、十分多樣的成體系的存在。但是幾個大的功能科研平臺還是應(yīng)該具備的:1、數(shù)據(jù)的查詢和提取功能。科研業(yè)務(wù)的重要對象就是對數(shù)據(jù)的分析,針對某一科研項目需求,能從平臺中查詢并提取出研究所需要的數(shù)據(jù),這個應(yīng)該是平臺必備的功能;2、科研信息圖譜的查詢??蒲袠I(yè)務(wù)在開展前,需要進(jìn)行回顧性分析,對前人類似的科研業(yè)務(wù)、文獻(xiàn)、網(wǎng)絡(luò)資源等進(jìn)行綜合性查詢和分析,能讓研究者了解該研究的整體的信息圖譜,為本次科研項目研究提供有效信息支撐;3、科研人員圖譜查詢。要做好科研,要有合適的對的人參與進(jìn)來或者進(jìn)行相關(guān)業(yè)務(wù)的合作,科研平臺能全方位的展示相關(guān)人員的科研信息,為科研人員提供選擇參考將有利于科研項目的推進(jìn)。
6、醫(yī)院科研大數(shù)據(jù)平臺,如何對臨床醫(yī)生真正有所幫助,無論是數(shù)據(jù)還是圖像?
@zyp8365 廣東省中醫(yī)院 高級工程師:任何技術(shù)手段、架構(gòu)、方法、系統(tǒng)抑或是平臺,包括醫(yī)院科研大數(shù)據(jù)平臺也是如此,其目標(biāo)都是結(jié)合業(yè)務(wù)對數(shù)據(jù)、流程、模式等進(jìn)行再組織,從而實現(xiàn)用戶既定目標(biāo)。系統(tǒng)平臺的建設(shè),表面看是信息化層面的建設(shè),但是其實質(zhì)是業(yè)務(wù)流程的再造、知識的再重組梳理、數(shù)據(jù)的再組織,結(jié)合技術(shù)的特點和優(yōu)勢,從而實現(xiàn)業(yè)務(wù)自動化乃至智能化。所以如果系統(tǒng)和平臺要建的好,相應(yīng)用戶如臨床醫(yī)生的深度參與是密不可分,需求目標(biāo)要能明確提出、功能體系要充分驗證,數(shù)據(jù)質(zhì)量要監(jiān)控把關(guān),只有這樣,醫(yī)院科研大數(shù)據(jù)平臺的建設(shè)才能實現(xiàn)為臨床醫(yī)生提供真正意義上,有感的幫助。二、基于醫(yī)院大數(shù)據(jù)平臺建設(shè)的技術(shù)架構(gòu)角度
1、互聯(lián)網(wǎng)醫(yī)院的建設(shè)中,如何規(guī)劃大數(shù)據(jù)平臺的架構(gòu)?
@zyp8365 廣東省中醫(yī)院 高級工程師:按照衛(wèi)健委發(fā)布的《互聯(lián)網(wǎng)醫(yī)院管理辦法(試行)》,互聯(lián)網(wǎng)醫(yī)院包括作為實體醫(yī)療機(jī)構(gòu)第二名稱的互聯(lián)網(wǎng)醫(yī)院,以及依托實體醫(yī)療機(jī)構(gòu)獨立設(shè)置的互聯(lián)網(wǎng)醫(yī)院?;ヂ?lián)網(wǎng)醫(yī)院作為互聯(lián)網(wǎng)+醫(yī)療的組織表現(xiàn)形式,不管是哪種形式的互聯(lián)網(wǎng)醫(yī)院,其業(yè)態(tài)是目前為止是一定的,如我們熟知的預(yù)約掛號、在線繳費、在線查詢檢驗檢查報告、在線入出院等。隨著互聯(lián)網(wǎng)+醫(yī)療的深入結(jié)合,其服務(wù)模式等也會有相應(yīng)創(chuàng)新性的發(fā)展。規(guī)劃互聯(lián)網(wǎng)醫(yī)院的大數(shù)據(jù)平臺架構(gòu)時,要充分考慮互聯(lián)網(wǎng)醫(yī)院現(xiàn)有業(yè)務(wù)模式下的數(shù)據(jù)概況,也要充分預(yù)留未來互聯(lián)網(wǎng)+醫(yī)療業(yè)務(wù)爆炸式、井噴式發(fā)展時,基礎(chǔ)架構(gòu)的可擴(kuò)展性、靈活度要能與之適配。
2、基礎(chǔ)架構(gòu)與醫(yī)院信息系統(tǒng)的融合問題?
【問題描述】如果醫(yī)院已經(jīng)建立集成平臺,但缺乏專業(yè)的臨床科研數(shù)據(jù)平臺,怎樣將科研,管理,臨床平臺與現(xiàn)有集成平臺融合?;A(chǔ)架構(gòu)與新建信息平臺的融合!@zyp8365 廣東省中醫(yī)院 高級工程師:首先,應(yīng)該要先理清各平臺的定位和作用,以及我們需要實現(xiàn)的目標(biāo)。集成平臺是為了解決醫(yī)院系統(tǒng)間星狀交互導(dǎo)致的各類問題而提出來的系統(tǒng)交互平臺,其目標(biāo)在于實現(xiàn)系統(tǒng)間的互聯(lián)互通,系統(tǒng)間的互聯(lián)互通主要是通過平臺的標(biāo)準(zhǔn)化接口實現(xiàn)。科研、管理、臨床作為醫(yī)院不同的業(yè)務(wù)領(lǐng)域,其實際業(yè)務(wù)目標(biāo)是不相同的。又因為這三大業(yè)務(wù)領(lǐng)域中的具體業(yè)務(wù)各式各樣,所以業(yè)務(wù)系統(tǒng)數(shù)量和種類也是多而雜。集成平臺可以解決臨床、科研和管理等業(yè)務(wù)領(lǐng)域各類系統(tǒng)互聯(lián)、數(shù)據(jù)交互共享的問題,但是如果是臨床、科研、管理等業(yè)務(wù)系統(tǒng)的數(shù)據(jù)的融合利用,則需要通過CDR、ODR、RDR等各類數(shù)據(jù)中心去實現(xiàn),通過對邏輯數(shù)據(jù)的治理、存儲、利用,充分發(fā)揮數(shù)據(jù)資源的價值。
3、大數(shù)據(jù)平臺底層架構(gòu)規(guī)劃?
【問題描述】大數(shù)據(jù)平臺架構(gòu)需要數(shù)據(jù)存儲和計算能力。醫(yī)療數(shù)據(jù)是多源異構(gòu)的,有結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化,同時隨著未來物聯(lián)網(wǎng)、設(shè)備等數(shù)據(jù)的增長,對大數(shù)據(jù)平臺的數(shù)據(jù)存儲要求會更高;大數(shù)據(jù)平臺需要滿足各種AI能力,這部分體現(xiàn)在算力上,算力需要的軟件和硬件兩個層面的支撐。綜上,在建設(shè)大數(shù)據(jù)平臺的時候,做好應(yīng)用的規(guī)劃的同時,也需要充分規(guī)劃好底層基礎(chǔ)架構(gòu),底層基礎(chǔ)架構(gòu)需要滿足先進(jìn)性、成熟性、使用性、開放性、和擴(kuò)充性。問題:如何做好這部分規(guī)劃?@zyp8365 廣東省中醫(yī)院 高級工程師:個人覺得對于大數(shù)據(jù)平臺的底層基礎(chǔ)架構(gòu),也應(yīng)該根據(jù)其上層的應(yīng)用類型、數(shù)據(jù)類型、時效要求、容災(zāi)要求等綜合考慮選取合適的,與之相適應(yīng)的底層架構(gòu)。籠統(tǒng)的把整個大數(shù)據(jù)平臺放在某一種架構(gòu)中,不考慮其實際情況,將容易導(dǎo)致資源利用與實際需求的不相符。大數(shù)據(jù)平臺的數(shù)據(jù)類型及業(yè)務(wù)場景都是多種多樣的,與之相適應(yīng)的,底層基礎(chǔ)架構(gòu)也應(yīng)該進(jìn)行分類討論。就存儲底層而言,存儲IO要求高的,結(jié)構(gòu)化的數(shù)據(jù)則應(yīng)該用ssd全閃乃至NVMe全閃,要求不高,數(shù)據(jù)量較大,非結(jié)構(gòu)化的數(shù)據(jù),則應(yīng)該考慮其他類型的存儲、分布式存儲乃至對象存儲架構(gòu)。@陳建 武漢市中心醫(yī)院 系統(tǒng)運維工程師: 大數(shù)據(jù)平臺的底層架構(gòu)主要是3個方面:數(shù)據(jù)的存儲、算力和算法,在這之上來支撐數(shù)據(jù)的應(yīng)用,反哺業(yè)務(wù)。
4、三甲醫(yī)院大數(shù)據(jù)平臺基礎(chǔ)架構(gòu)?
【問題描述】應(yīng)用需求決定平臺架構(gòu),平臺架構(gòu)決定基礎(chǔ)架構(gòu),說明醫(yī)院尤其是大型三甲醫(yī)院大數(shù)據(jù)平臺基礎(chǔ)架構(gòu)是很重要的,我的問題是針對醫(yī)院不同類型的數(shù)據(jù)類型,要充分考慮醫(yī)院數(shù)據(jù)的存儲方式和存儲能力,同時還要考慮系統(tǒng)的計算能力,這是建設(shè)基礎(chǔ)架架的前提,希望有這方面建設(shè)的實例針對性的分析,謝謝。@zyp8365 廣東省中醫(yī)院 高級工程師:目前很多醫(yī)院在建設(shè)基礎(chǔ)架構(gòu)時,正在逐步云化過渡,有些在建自己的私有云,有一些會將一些業(yè)務(wù)放在公有云,都在做相應(yīng)的積極探索,當(dāng)然有利有弊。在醫(yī)院基礎(chǔ)架構(gòu)云化的大背景下,我們在建設(shè)時應(yīng)該要以池的概念去綜合考慮計算、存儲以及業(yè)務(wù)的問題?,F(xiàn)在很多醫(yī)院都是區(qū)分內(nèi)外網(wǎng),并且系統(tǒng)都做了不同程度的容災(zāi),還有很多系統(tǒng)正在上線開發(fā),需要大量的測試環(huán)境,還有很多對外交互的業(yè)務(wù)需要在DMZ區(qū),如醫(yī)保、支付寶、銀聯(lián)支付等。所以從業(yè)務(wù)層面來劃分,可以分為內(nèi)網(wǎng)云、外網(wǎng)云、對外交互云、測試云、容災(zāi)云。而針對不同云的特點要求,可以選取不同級別、不同性能、不同容量的設(shè)備和技術(shù)體系進(jìn)行支撐,重要的、穩(wěn)定性要求高的、時延要求小的用高性能高可靠的架構(gòu)體系,非結(jié)構(gòu)化、數(shù)據(jù)量大,訪問頻率低的,可以考慮分布式存儲或?qū)ο蟠鎯?,以此類推。另外計算和存儲能力,在云化下,針對性的進(jìn)行池化分析,計算池是否滿足計算要求,是否有GPU計算需求等,都要結(jié)合業(yè)務(wù)去具體分析,容量池亦是如此,在此不再贅述。
5、醫(yī)療大數(shù)據(jù)平臺不同的建設(shè)路線底層基礎(chǔ)架構(gòu)設(shè)計時有什么要求?
【問題描述】目前醫(yī)療大數(shù)據(jù)平臺大多采用HADOOP+MapReduce、內(nèi)存數(shù)據(jù)庫(以SAP HANA為代表的)以及圖數(shù)據(jù)庫(GP為代表),這幾種模式在底層基礎(chǔ)架構(gòu)構(gòu)設(shè)計時有何區(qū)別?@zyp8365 廣東省中醫(yī)院 高級工程師:底層基礎(chǔ)架構(gòu)設(shè)計不僅要考慮技術(shù)因素(性能、一致性要求、SQL兼容性要求),也要考慮包括架構(gòu)產(chǎn)品的生態(tài)成熟度、應(yīng)用架構(gòu)適配度、團(tuán)隊適應(yīng)度等非技術(shù)因素。Hadoop+MapReduce是典型的分布式文件系統(tǒng)+分布式計算的技術(shù)框架,其組件HDFS就是典型的分布式存儲架構(gòu),分布式存儲架構(gòu)更為適合其技術(shù)體系。內(nèi)存數(shù)據(jù)庫其主要的設(shè)計目標(biāo)是為了解決高并發(fā)低時延的數(shù)據(jù)管理需求,依靠內(nèi)存來存儲數(shù)據(jù)。從存儲速度來說,CPU寄存器>CPU緩存>DDR DRAM>持久型內(nèi)存>NAND SSD>磁盤驅(qū)動器(HDD)>磁帶,內(nèi)存數(shù)據(jù)應(yīng)該使用DDR DRAM或持久型存儲,區(qū)別在于DRAM目前為易失性存儲,使用時速度較高,但是應(yīng)該要充分考慮業(yè)務(wù)類型和備份容災(zāi)方案,保證在極端情況下業(yè)務(wù)業(yè)務(wù)連續(xù)性,持久型內(nèi)存相對來說速度較慢,但是非易失,容量和價格也占優(yōu)勢。圖數(shù)據(jù)庫根據(jù)其圖存儲和處理方式分為不同類型,其底層的存儲架構(gòu)也要視圖數(shù)據(jù)庫采用的技術(shù)類型而選擇與之適應(yīng)的存儲類別。另外,值得提出的是,不管是何種存儲架構(gòu),要注意存儲的物理塊要與文件系統(tǒng)或數(shù)據(jù)庫中的邏輯塊大小上要適配,減少同一數(shù)據(jù)操作頻次。而且在基礎(chǔ)架構(gòu)設(shè)計時,也要關(guān)注業(yè)務(wù)類型、成本和投入的影響。
6、醫(yī)療大數(shù)據(jù)平臺在做存儲容量的規(guī)劃時應(yīng)考慮哪些因素?
@zyp8365 廣東省中醫(yī)院 高級工程師:(1)業(yè)務(wù)的需求及增長預(yù)期:要考慮現(xiàn)存數(shù)據(jù)的體量以及未來3-5年業(yè)務(wù)數(shù)據(jù)的增長量;(2)數(shù)據(jù)的保存周期:數(shù)據(jù)保存期限多久,基礎(chǔ)數(shù)據(jù),過程數(shù)據(jù)、結(jié)果數(shù)據(jù)等類型數(shù)據(jù)的比例如何?保存周期的要求如何?(3)架構(gòu)及容災(zāi)要求:是集中式架構(gòu)?還是分布式架構(gòu)?選擇的存儲產(chǎn)品的存儲內(nèi)部組織方式如何?集中式架構(gòu)是否包括RAID抑或是全局打散?RAID的劃分要求、熱備盤的要求如何?分布式架構(gòu)高可用要求如何?副本如何配置?容災(zāi)要求如何,備份方式如何選擇?全備、差異,備份的方式、頻率及備份的保存周期如何?(一)推算業(yè)務(wù)系統(tǒng)的容量需求(1)業(yè)務(wù)的數(shù)據(jù)量預(yù)估,比如每周、每月、每年數(shù)據(jù)增量。(3)數(shù)據(jù)分析需要多少個副本,全量的還是差異量的副本。(4)是否有備份、容災(zāi)的需求,備份頻率、保存周期等。(1)硬盤的進(jìn)制一般是1000進(jìn)制,操作系統(tǒng)是1024,需要折算一下單盤容量。(2)存儲設(shè)備的數(shù)據(jù)冗余方式,多副本還是EC/RAID?根據(jù)校驗盤的比例來算裸盤數(shù)量。(3)還要查看所選中的存儲系統(tǒng)自己存儲元數(shù)據(jù)會消耗多少硬盤空間,把這部分扣除才是系統(tǒng)可用容量。(4)算了RAID/EC以后存儲可提供的容量以后,一般還要考慮加一個經(jīng)驗系數(shù),比如10%或者20%的余量,作為風(fēng)險余量。主要是小文件一般都有寫放大。三、基于大數(shù)據(jù)平臺建設(shè)標(biāo)準(zhǔn)和目標(biāo)角度
1、醫(yī)療大數(shù)據(jù)團(tuán)隊如何建設(shè)?
【問題描述】對于醫(yī)院建立醫(yī)療大數(shù)據(jù),如何組建團(tuán)隊,需要哪些方面的人,如何建立標(biāo)準(zhǔn)操作規(guī)范,如何確定目標(biāo)方向?如何考核和推進(jìn)工作?@zyp8365 廣東省中醫(yī)院 高級工程師:團(tuán)隊的建設(shè)要包含如下類型的人才:(1)管理人才:有較高的管理素養(yǎng),熟悉醫(yī)療大數(shù)據(jù)的業(yè)務(wù)方向和發(fā)展趨勢,能團(tuán)結(jié)團(tuán)隊人員朝著目標(biāo)努力和推進(jìn)工作;(2)技術(shù)人才:包括懂標(biāo)準(zhǔn)規(guī)范方面、大數(shù)據(jù)技術(shù)能力(架構(gòu)的設(shè)計、搭建、開發(fā)、應(yīng)用等)等多方面大數(shù)據(jù)所需人才。(3)數(shù)據(jù)治理人才:包括了解業(yè)務(wù),有較強(qiáng)的數(shù)據(jù)治理能力、數(shù)據(jù)處理能力和分析挖掘能力等的人才;標(biāo)準(zhǔn)操作規(guī)范的確立要結(jié)合業(yè)務(wù)流,形成本團(tuán)隊操作SOP,結(jié)合行業(yè)的研究熱點、技術(shù)趨勢以及本單位醫(yī)療數(shù)據(jù)、人員等優(yōu)勢,確立目標(biāo)方向,目標(biāo)的確定可以分為近期目標(biāo)和遠(yuǎn)期目標(biāo),通過目標(biāo)的逐步實現(xiàn)慢慢積累經(jīng)驗,逐步深入,進(jìn)而確定遠(yuǎn)期及戰(zhàn)略性目標(biāo)??己斯ぷ鲬?yīng)該以人為主體維度,推進(jìn)工作應(yīng)以事或項目為主體維度,形成行之有效的績效考核目標(biāo)、成立項目推進(jìn)工作組等相關(guān)臨時組織,制定任務(wù)明晰、目標(biāo)明確的責(zé)任任務(wù)清單,將任務(wù)具體分解,落實到人,進(jìn)而形成合理共同推進(jìn)相關(guān)工作。
2、臨床數(shù)據(jù)中心必須符合醫(yī)院的數(shù)據(jù)管理規(guī)范?
@zyp8365 廣東省中醫(yī)院 高級工程師:無規(guī)不成方圓,標(biāo)準(zhǔn)化、規(guī)范化將極大促進(jìn)數(shù)據(jù)交互共享及后期的分析挖掘利用。所以臨床數(shù)據(jù)中心的建設(shè)必須要符合數(shù)據(jù)管理規(guī)范,不僅要符合醫(yī)院層面的數(shù)據(jù)管理規(guī)范,還要參考遵循國家、行業(yè)等層面的相關(guān)標(biāo)準(zhǔn)規(guī)范。但是值得提出的是,目前很多醫(yī)院重系統(tǒng)建設(shè),輕標(biāo)準(zhǔn)建設(shè)。信息系統(tǒng)的建設(shè)和運維已經(jīng)讓醫(yī)院的信息部門不堪重負(fù),極少會開展相應(yīng)數(shù)據(jù)標(biāo)準(zhǔn)的研究,也極少有醫(yī)院會成立相應(yīng)的數(shù)據(jù)管理部門,專責(zé)于開展數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)治理及數(shù)據(jù)利用。@spgoall 和祐國際醫(yī)院 信息管理部部長:答案是肯定的,臨床數(shù)據(jù)中心的數(shù)據(jù)也在醫(yī)院管理范疇內(nèi),必須遵從管理規(guī)范。
3、臨床大數(shù)據(jù)中心,怎樣將臨床醫(yī)生和護(hù)士的結(jié)構(gòu)化電子病歷數(shù)據(jù)直觀顯示在臨床科室?
【問題描述】臨床數(shù)據(jù)中心的數(shù)據(jù)應(yīng)該是醫(yī)院最核心的數(shù)據(jù),怎樣從結(jié)構(gòu)化電子病歷中提取醫(yī)生和管理部門所需要的數(shù)據(jù),保障從數(shù)據(jù)到轉(zhuǎn)化,應(yīng)該是關(guān)鍵問題。@zyp8365 廣東省中醫(yī)院 高級工程師:目前,臨床數(shù)據(jù)中心的利用有很多方式,包括360患者全息視圖、臨床決策支持系統(tǒng)等,都可以基于數(shù)據(jù)中心中匯集的各業(yè)務(wù)系統(tǒng)(包括HIS、LIS、PACS等)的數(shù)據(jù),提供利用轉(zhuǎn)化。臨床數(shù)據(jù)中心的利用,取決于醫(yī)院醫(yī)生和管理部門數(shù)據(jù)需求的明晰化,這個是利用的目標(biāo),前提則是業(yè)務(wù)系統(tǒng)中有相關(guān)的數(shù)據(jù)源,而重點在于數(shù)據(jù)源提供的數(shù)據(jù)有較高的數(shù)據(jù)質(zhì)量。不然數(shù)據(jù)的轉(zhuǎn)化利用效果則會大打折扣。圍繞上面幾點,臨床數(shù)據(jù)中心要扎實持續(xù)做好數(shù)據(jù)需求的分析,保障數(shù)據(jù)源的穩(wěn)定,形成規(guī)范的數(shù)據(jù)治理體系,為后續(xù)數(shù)據(jù)的利用提供基礎(chǔ)。
4、醫(yī)院各部門數(shù)據(jù)歸口不一致,如何解決?
@zyp8365 廣東省中醫(yī)院 高級工程師:醫(yī)院部門間的數(shù)據(jù)歸口不一致是業(yè)務(wù)使然,是正常狀態(tài),如醫(yī)務(wù)部門的數(shù)據(jù)統(tǒng)計口徑和統(tǒng)計部門的數(shù)據(jù)統(tǒng)計口徑往往是不一樣的,如就診人次數(shù)的統(tǒng)計,他們各自取的有可能是不同業(yè)務(wù)表的數(shù)據(jù),醫(yī)務(wù)部門可能統(tǒng)計掛號人次數(shù)作為就診人次數(shù),而統(tǒng)計部門統(tǒng)計的是醫(yī)生看診人次數(shù)作為就診人次數(shù)。面對這樣的問題,個人理解應(yīng)該從如下方面解決:
(1)統(tǒng)一數(shù)據(jù)口徑。要梳理醫(yī)院現(xiàn)有各部門數(shù)據(jù)需求,充分分析研究各部門的數(shù)據(jù)需求所對應(yīng)的業(yè)務(wù)目標(biāo),充分溝通協(xié)商,形成有效的、統(tǒng)一規(guī)范的統(tǒng)計數(shù)據(jù)集;(2)統(tǒng)一數(shù)據(jù)來源。業(yè)務(wù)數(shù)據(jù)統(tǒng)一匯聚在數(shù)據(jù)中心中,所有數(shù)據(jù)需求應(yīng)從數(shù)據(jù)中心中獲取,從而避免從不同業(yè)務(wù)系統(tǒng)獲取數(shù)據(jù)導(dǎo)致的不一致情況。@陳建 武漢市中心醫(yī)院 系統(tǒng)運維工程師: 這個問題現(xiàn)在是絕大部分醫(yī)院面臨的問題,我個人建議是劃分業(yè)務(wù)域,建立指標(biāo)庫。業(yè)務(wù)域:就診、計費,業(yè)務(wù)活動:門診就診、門診結(jié)算,原子指標(biāo):門診就診人次、門診計算金額,派生指標(biāo):月度門診就診人次、月度門診藥品結(jié)算金額,復(fù)合指標(biāo):月度門診藥品均次費用。針對這個例子結(jié)合業(yè)務(wù)域?qū)⒃又笜?biāo)歸口科室:門辦和財務(wù)科,那么通過原子指標(biāo)衍生的派生指標(biāo)和復(fù)合指標(biāo)口徑就可以保持一致。需要注意的是:建立指標(biāo)庫的前提是要建立醫(yī)院的數(shù)據(jù)資產(chǎn),關(guān)鍵就是元數(shù)據(jù)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)血緣等。現(xiàn)在很多行業(yè)做大數(shù)據(jù)都會面臨這種問題,各部門分屬不同的領(lǐng)域,所以在構(gòu)建大數(shù)據(jù)之前,首先我覺得要明確的就是項目的架構(gòu),信息化逐漸的已經(jīng)不再是企業(yè)的輔助系統(tǒng),而是逐漸成為決策系統(tǒng),要做大數(shù)據(jù),那么首先要做的就是把信息化做到一定的高度。底層的數(shù)據(jù)如病例,患者信息,醫(yī)院信息還有綜合的財務(wù)等信息要打通,這部分需要多個部門來配合,并且由獨立的信息化部門來牽頭完成的,梳理出數(shù)據(jù)的共性和特點,然后建立公共的數(shù)據(jù)倉庫,再根據(jù)業(yè)務(wù)的特點梳理出哪些信息是需要進(jìn)行挖掘的。很多時候,大數(shù)據(jù)平臺的邏輯構(gòu)建要比物理建設(shè)更重要,要綜合現(xiàn)有的數(shù)據(jù)資源,共同分析才能形成更好的思路。
5、CDR、ODR、RDR三者的邊界怎么劃分?面向臨床醫(yī)療醫(yī)生的數(shù)據(jù)呈現(xiàn)方式是什么?
【問題描述】臨床數(shù)據(jù)中心(CDR),運營數(shù)據(jù)中心(ODR)和科研數(shù)據(jù)中心(RDR),三者存在交集,那么他們的邊界怎么劃分?面向臨床醫(yī)療醫(yī)生的數(shù)據(jù)呈現(xiàn)方式是什么?@spgoall 和祐國際醫(yī)院 信息管理部部長:三大數(shù)據(jù)中心實際上就是三個業(yè)務(wù)主題,邊界取決于業(yè)務(wù)數(shù)據(jù)屬于哪個主題類別,但由于業(yè)務(wù)數(shù)據(jù)也存在多個類別,所以存在交集,特別是臨床和科研,數(shù)據(jù)交集比較多。面向醫(yī)療臨床醫(yī)生的數(shù)據(jù)呈現(xiàn)方式主要還是患者360視圖,也就是基于一個患者的全生命周期的診療數(shù)據(jù),如果數(shù)據(jù)能打通院外,那就可以以電子健康檔案的方式呈現(xiàn)。@zyp8365 廣東省中醫(yī)院 高級工程師:CDR、ODR和RDR都是基于業(yè)務(wù)領(lǐng)域進(jìn)行的邏輯層面的數(shù)據(jù)劃分和再組織,而實際業(yè)務(wù)數(shù)據(jù)的產(chǎn)生也就是數(shù)據(jù)源是相同的,都是基于實際的業(yè)務(wù)系統(tǒng),如HIS、LIS、PACS、HRP等。這三類數(shù)據(jù)中心的目標(biāo)都是為了其相應(yīng)領(lǐng)域的上層業(yè)務(wù)應(yīng)用的需求,在對實際業(yè)務(wù)數(shù)據(jù)多元化采集加工基礎(chǔ)上,進(jìn)行的主題化匯聚,進(jìn)而知識化應(yīng)用。三大數(shù)據(jù)中心基于的業(yè)務(wù)領(lǐng)域分別為臨床、管理和科研,雖然使用的數(shù)據(jù)源和維度可能有時相同,但是其基于此服務(wù)的應(yīng)用目標(biāo)是不一樣的。舉個例子,急診就診人員信息表,在CDR和ODR都可能有這部分?jǐn)?shù)據(jù),但是CDR中可能服務(wù)的上層應(yīng)用是為某個急診醫(yī)生查詢本人看診人員數(shù)量或者查詢剩余就診人數(shù),ODR中該部分?jǐn)?shù)據(jù)主要是為醫(yī)務(wù)管理人員查詢某天、某月乃至某年急診人次數(shù)抑或是通過可視化的方式展現(xiàn)急診就診人數(shù)的趨勢圖,或者結(jié)合時間、職業(yè)等進(jìn)行關(guān)聯(lián)分析得出相關(guān)的趨勢分析。所以我個人認(rèn)為三者的邊界是模糊的,要基于業(yè)務(wù)領(lǐng)域和場景具體情況具體分析。面向臨床醫(yī)療醫(yī)生的數(shù)據(jù)展現(xiàn)方式有十分多的類型和方式,可視化、多維度,相關(guān)的技術(shù)和工具以及相關(guān)的人員及業(yè)務(wù)都是相對較為成熟和成體系的。重點不在于有哪些類型和方式,重點在于展現(xiàn)的需求是否明確,展現(xiàn)的數(shù)據(jù)是否有來源,展現(xiàn)的數(shù)據(jù)質(zhì)量是否足夠高,這三個是對臨床醫(yī)療醫(yī)生的數(shù)據(jù)呈現(xiàn)問題需要解決的三大問題。四、基于大數(shù)據(jù)的存儲規(guī)劃角度1、如何處理數(shù)據(jù)的存儲問題,尤其是影像數(shù)據(jù)?【問題描述】建設(shè)科研大數(shù)據(jù)平臺,一般都是將各個業(yè)務(wù)系統(tǒng)的數(shù)據(jù)重新收集整理,結(jié)構(gòu)化的數(shù)據(jù)也還好,并不占用空間,而非結(jié)構(gòu)化的數(shù)據(jù)例如影像數(shù)據(jù),一個大型三甲醫(yī)院的增量是非常大的,如果這些數(shù)據(jù)都抽取到科研大數(shù)據(jù)平臺醫(yī)院相當(dāng)于又要重新建設(shè)存儲,如何平衡這些非結(jié)構(gòu)化的數(shù)據(jù)的存儲?@zyp8365 廣東省中醫(yī)院 高級工程師:對于這類數(shù)據(jù),應(yīng)該要做好統(tǒng)籌規(guī)劃,醫(yī)院的數(shù)據(jù)都是會做容災(zāi)備份的,所以一般醫(yī)院存放同類數(shù)據(jù)基本都是2份或2份以上,在業(yè)務(wù)系統(tǒng)、科研大數(shù)據(jù)平臺或者別的其他應(yīng)用系統(tǒng)對某個非結(jié)構(gòu)化數(shù)據(jù)有讀取或使用需求的時候,應(yīng)該充分利用容災(zāi)備份環(huán)境中的同類數(shù)據(jù)。另外,在軟件設(shè)計和數(shù)據(jù)庫存放時,該類增量較大的非結(jié)構(gòu)化數(shù)據(jù)以地址指針的方式存放,如需要調(diào)用時再通過地址調(diào)轉(zhuǎn)到實際的數(shù)據(jù)存放路徑。這樣將極大的緩解該部分?jǐn)?shù)據(jù)的讀寫壓力。
2、醫(yī)院大數(shù)據(jù)平臺、科研平臺等推薦什么存儲架構(gòu)?
【問題描述】醫(yī)院大數(shù)據(jù)平臺、科研平臺等平臺,推薦存儲架構(gòu)是?除了分布式架構(gòu)的分布式存儲,能否做個分析,用哪種類型的存儲適合非特大型三甲醫(yī)院呢?@zyp8365 廣東省中醫(yī)院 高級工程師:醫(yī)院大數(shù)據(jù)平臺、科研平臺等平臺,鑒于其數(shù)據(jù)的多模態(tài)、異構(gòu)化、海量化,建議存儲架構(gòu)也是混合多樣的,要針對數(shù)據(jù)類型、業(yè)務(wù)需求、性能要求等綜合考慮,結(jié)合分析。即使是非特大型三甲醫(yī)院,其基本業(yè)務(wù)也是和三家醫(yī)院相差無幾的,只是同樣的系統(tǒng),體量不同而已。如果體量不大、增量不高,為了方便維護(hù),可以考慮超融合的架構(gòu)體系也可以考慮一體化存儲的方式,存儲中涵蓋了閃存等高速盤,也有SAS、SATA等低速盤,支持NFS、ISCSI等協(xié)議方式,但是值得提出的是這類存儲雖然支持容量的擴(kuò)展,但是存儲機(jī)頭的緩存、性能等可能會成為后續(xù)擴(kuò)容、擴(kuò)展的瓶頸,所以要對這方面特別關(guān)注。避免后續(xù)成為性能瓶頸。
3、關(guān)系型數(shù)據(jù)庫,非關(guān)系型數(shù)據(jù)庫還是分布式數(shù)據(jù)庫,醫(yī)療大數(shù)據(jù)平臺基礎(chǔ)架構(gòu)如何考慮?大型的數(shù)據(jù)整合平臺如何將異構(gòu)化數(shù)據(jù)統(tǒng)一整合,是使用傳統(tǒng)數(shù)據(jù)庫技術(shù)還是采用其他方案?
@zyp8365 廣東省中醫(yī)院 高級工程師:要考慮數(shù)據(jù)類型、業(yè)務(wù)場景、時效要求、性能要求等因素。因為數(shù)據(jù)的多樣性必然導(dǎo)致基礎(chǔ)架構(gòu)的復(fù)雜性、差異性和多樣性。多種類型的數(shù)據(jù)庫、存儲架構(gòu)并存應(yīng)該是醫(yī)療大數(shù)據(jù)平臺的常態(tài),鑒于底層架構(gòu)對數(shù)據(jù)及應(yīng)用上層的透明性特點,結(jié)構(gòu)化關(guān)系型數(shù)據(jù)雖然也能存放在分布式或?qū)ο蟠鎯χ?,但是其性能必然大打折扣,不同的?shù)據(jù)庫設(shè)計是,其適宜存儲和處理的數(shù)據(jù)對象是一定的,所以我們在考慮醫(yī)療大數(shù)據(jù)平臺基礎(chǔ)架構(gòu)是,要結(jié)合業(yè)務(wù)場景、數(shù)據(jù)類型、以及各類數(shù)據(jù)庫、存儲架構(gòu)的技術(shù)特點綜合去考慮。
4、如何解決存儲擴(kuò)容時不同廠商技術(shù)之間差異化問題?
@zyp8365 廣東省中醫(yī)院 高級工程師:可以通過云存儲的方式去解決。其中有兩種比較常見的方式:(1)網(wǎng)關(guān)的方式。如IBM的SVC,EMC的Vplex,通過存儲網(wǎng)關(guān)將不同廠家的存儲匯集起來再對外開放;(2)外接存儲的方式。通過某一高性能的存儲其自帶的虛擬化套件,然后將其他存儲外接到其上面,相當(dāng)于外置硬盤一樣,統(tǒng)一由該高端存儲匯集后對外開放。
5、對于醫(yī)院各種類型的數(shù)據(jù),分別用什么方式、什么設(shè)備存儲最適合?
@zyp8365 廣東省中醫(yī)院 高級工程師:不僅要根據(jù)數(shù)據(jù)類型如結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化來區(qū)分存儲的選擇,而且還要根據(jù)數(shù)據(jù)的重要性、時效性、數(shù)據(jù)量大小、成本投入等來區(qū)分存儲的選擇。一般來說重要的、時效性要求高的結(jié)構(gòu)化數(shù)據(jù),一般采用高端的全閃存儲或同類級別的存儲,并且配以雙活等高可用手段;重要性一般的非結(jié)構(gòu)化數(shù)據(jù)可以采用分布式存儲或者對象存儲;重要性一般,共享需求較高的,則可以采用NFS類型的存儲。當(dāng)然上述存儲選擇的建議也非絕對的,還是要根據(jù)具體的業(yè)務(wù)情況具體分析。
6、醫(yī)院大數(shù)據(jù)平臺數(shù)據(jù)是如何備份的?
【問題描述】醫(yī)院大數(shù)據(jù)平臺數(shù)據(jù)是如何備份的?環(huán)境是非hadoop環(huán)境,是基于數(shù)據(jù)庫環(huán)境做的大數(shù)據(jù)平臺,怎么備份呢?推薦規(guī)劃備份頻率是??@zyp8365 廣東省中醫(yī)院 高級工程師:備份方式建議分類備份。針對大數(shù)據(jù)平臺的應(yīng)用部分,一般體量較小,建議是根據(jù)更新頻率進(jìn)行,每次更新后進(jìn)行全量備份。針對大數(shù)據(jù)平臺的數(shù)據(jù)部分,因為是數(shù)據(jù)庫,建議可以采用數(shù)據(jù)庫專有技術(shù)做實時容災(zāi),如oracle的dataguard,sqlserver的mirror等。除了實時容災(zāi)外,在數(shù)據(jù)庫建立后做一次全量備份,并且可以根據(jù)數(shù)據(jù)增長情況及數(shù)據(jù)恢復(fù)時限要求做每周、每2周或每月一次的全量備份,中間時間輔以差異備份。