“醫(yī)院系統(tǒng)為什么又出問題了?”
“為什么平臺(tái)用起來這么卡?”
......
越來越多醫(yī)院建設(shè)了集成平臺(tái)后,會(huì)出現(xiàn)以上的抱怨和困惑。有的醫(yī)院發(fā)現(xiàn),平臺(tái)搭建完成后時(shí)常出現(xiàn)問題,三日一小補(bǔ),五日一大修,運(yùn)維人員的主要工作變成了“修平臺(tái)”而非“用平臺(tái)”。如果把醫(yī)院平臺(tái)比成一輛車,那么數(shù)據(jù)就是車上貨物,道路就是承載平臺(tái)運(yùn)行的軟硬件環(huán)境和網(wǎng)絡(luò)。道路維護(hù)和車修“人員”就像運(yùn)維人員,他們不僅要保持“道路”(軟硬件環(huán)境、網(wǎng)絡(luò)情況)通暢和“車輛”(平臺(tái)運(yùn)行)完好,還要在出現(xiàn)問題時(shí),能夠迅速采取措施,進(jìn)行調(diào)度和修復(fù),以確?!斑\(yùn)輸”(集成業(yè)務(wù))通暢平穩(wěn)。
這里重點(diǎn)提到的三個(gè)要素:軟硬件和網(wǎng)絡(luò)環(huán)境、平臺(tái)運(yùn)維和集成平臺(tái)自身能力,是醫(yī)院從頻繁“修平臺(tái)”邁向真正“用平臺(tái)”的關(guān)鍵因素。
“......醫(yī)院里不曉得哪個(gè)災(zāi)舅子昨天下午把網(wǎng)線拔了,然后插回去又沒插好,導(dǎo)致網(wǎng)絡(luò)一卡一卡的,今天好多系統(tǒng)都出問題了......”這是發(fā)生在一家醫(yī)院中,運(yùn)維人員花了數(shù)天確定集成平臺(tái)異常的原因后,在群里發(fā)的一句話。盡管只是調(diào)侃,但背后的原因值得思考。
良好的軟硬件配套以及穩(wěn)定高效的網(wǎng)絡(luò)環(huán)境是集成業(yè)務(wù)構(gòu)建的“基石”。如果說集成平臺(tái)能穩(wěn)定運(yùn)行,有一半的功勞歸功于平臺(tái)自身,另一半則取決于軟硬件環(huán)境的可靠性。在醫(yī)院的集成過程中,頻繁出現(xiàn)的通常是一些“小問題”,但這些“小問題”可能會(huì)引發(fā)“大情況”,以下列舉了幾個(gè)例子供參考:
由于虛擬機(jī)設(shè)置不當(dāng),出現(xiàn)內(nèi)存資源競(jìng)爭(zhēng)問題,導(dǎo)致平臺(tái)異常;
因?yàn)槭褂玫目煺哲浖?dǎo)致每天高峰期出現(xiàn)業(yè)務(wù)異常;
安裝的殺毒軟件沒有進(jìn)行優(yōu)化和設(shè)置影響平臺(tái)進(jìn)程,導(dǎo)致CPU占用率極高,引起平臺(tái)運(yùn)行卡頓;
硬件存儲(chǔ)IO問題使虛擬機(jī)出現(xiàn)卡頓,進(jìn)而導(dǎo)致集成平臺(tái)無法使用,并且多個(gè)系統(tǒng)出現(xiàn)不定時(shí)卡頓故障;
......
隨著平臺(tái)在醫(yī)院信息化中的核心地位不斷上升,它對(duì)環(huán)境的敏感度也顯著增強(qiáng)。因此,醫(yī)院必須努力提供更高質(zhì)量、更干凈、更可靠的軟硬件設(shè)施和網(wǎng)絡(luò)環(huán)境,以確保平臺(tái)在復(fù)雜的醫(yī)療信息化場(chǎng)景中能夠穩(wěn)定運(yùn)行,并保障醫(yī)院的正常運(yùn)營(yíng)。為實(shí)現(xiàn)這一目標(biāo),平臺(tái)的運(yùn)維團(tuán)隊(duì)必須規(guī)范流程,提高運(yùn)維能力,建立有效的風(fēng)險(xiǎn)預(yù)警機(jī)制。
百度百科中對(duì)運(yùn)維的釋義如下:“運(yùn)維,本質(zhì)上是對(duì)網(wǎng)絡(luò)、服務(wù)器、服務(wù)的生命周期各個(gè)階段的運(yùn)營(yíng)與維護(hù),在成本、穩(wěn)定性、效率上達(dá)成一致可接受的狀態(tài)”。在醫(yī)院信息化集成中,集成平臺(tái)的運(yùn)維是確保平臺(tái)能持續(xù)穩(wěn)定運(yùn)行,實(shí)現(xiàn)集成業(yè)務(wù)的順暢平穩(wěn)作業(yè)的“根本”保障。在這一過程中,建立合理的管理機(jī)制和適當(dāng)?shù)娜藛T配套至關(guān)重要。
1.管理機(jī)制:主要是對(duì)運(yùn)維工作的組織和規(guī)劃,重點(diǎn)是定期觀察業(yè)務(wù)高峰期的運(yùn)行狀態(tài)、軟硬件配套和網(wǎng)絡(luò)的情況、平臺(tái)上集成業(yè)務(wù)的異常和未解決狀態(tài)等,并檢查是否做好故障預(yù)警等措施,包括:
巡檢監(jiān)控:運(yùn)維人員需要定期進(jìn)行系統(tǒng)巡檢,檢查硬件設(shè)備的狀態(tài)、網(wǎng)絡(luò)連接是否正常以及軟件是否運(yùn)行順暢。同時(shí),建立有效的監(jiān)控系統(tǒng),能夠?qū)崟r(shí)監(jiān)測(cè)平臺(tái)的各項(xiàng)指標(biāo),以便及時(shí)發(fā)現(xiàn)潛在問題。Odin的一體化界面能夠?qū)崿F(xiàn)對(duì)平臺(tái)所有下屬服務(wù)器的核心數(shù)據(jù)進(jìn)行監(jiān)控和查詢,包括CPU使用率、內(nèi)存利用率以及事件異常等信息,并將這些數(shù)據(jù)按照事件類型(一般、警告、錯(cuò)誤)進(jìn)行匯總,便于后續(xù)的處理分析。
預(yù)警機(jī)制:運(yùn)維團(tuán)隊(duì)需要建立有效的預(yù)警機(jī)制,以便在問題發(fā)生之前就能夠提前預(yù)警。這包括設(shè)置閾值,當(dāng)系統(tǒng)指標(biāo)達(dá)到或超過這些閾值時(shí),自動(dòng)觸發(fā)警報(bào),使運(yùn)維人員能夠及時(shí)采取措施。Odin具備態(tài)勢(shì)感知功能,結(jié)合自動(dòng)預(yù)警機(jī)制,能及時(shí)發(fā)現(xiàn)并監(jiān)測(cè)平臺(tái)潛在問題。此外,Odin還為常見問題提供了包括熔斷、降級(jí)、限流等在內(nèi)的多種解決措施,從技術(shù)上為醫(yī)療機(jī)構(gòu)的預(yù)警機(jī)制提供支持。
故障處理:當(dāng)平臺(tái)出現(xiàn)異?;蚬收蠒r(shí),運(yùn)維人員的首要任務(wù)是快速恢復(fù)日常生產(chǎn),最小化平臺(tái)停機(jī)時(shí)間,再進(jìn)行故障處理。Odin獨(dú)特的統(tǒng)一界面管理能力讓運(yùn)維人員能通過統(tǒng)一的界面對(duì)于工作實(shí)例運(yùn)行狀態(tài)以及其中各業(yè)務(wù)情況進(jìn)行瀏覽查看,避免了對(duì)服務(wù)器一一排查或頻繁切換服務(wù)器管理界面的繁瑣操作,大幅降低異常發(fā)生時(shí)集成平臺(tái)容災(zāi)恢復(fù)的時(shí)間和工作量,這是多臺(tái)服務(wù)器二次開發(fā)后搭建的 “集群”難以具備的能力。
性能優(yōu)化:運(yùn)維團(tuán)隊(duì)還需要不斷優(yōu)化系統(tǒng)性能,以應(yīng)對(duì)日益復(fù)雜的應(yīng)用場(chǎng)景和高并發(fā)的業(yè)務(wù)需求。這可能包括資源分配的調(diào)整、軟件升級(jí)和配置的優(yōu)化等工作。根據(jù)Intel官網(wǎng)發(fā)布的《ODIN 引擎全場(chǎng)景一體化集群版基于第三代英特爾? 至強(qiáng)? HCI 平臺(tái)優(yōu)化方案白皮書》,Intel和Odin進(jìn)行了深入的聯(lián)合測(cè)試和調(diào)優(yōu),Odin集群版的平均每秒事務(wù)處理量(TPS)可達(dá)30000以上,相當(dāng)于每分鐘處理180萬次事務(wù),充分滿足醫(yī)療集團(tuán)、醫(yī)聯(lián)體/醫(yī)共體以及區(qū)域醫(yī)療等大規(guī)模醫(yī)療衛(wèi)生機(jī)構(gòu)的平臺(tái)需求。
2.人員配套:建議有專人負(fù)責(zé)平臺(tái)運(yùn)維,同時(shí)運(yùn)維人員需具備一定的集成技術(shù)知識(shí),可以對(duì)生產(chǎn)環(huán)境中出現(xiàn)的問題給到及時(shí)的應(yīng)對(duì)方案,并能落實(shí)好相應(yīng)的運(yùn)維機(jī)制。如果平臺(tái)自身能力比較強(qiáng)、功能比較全面和易用,那么運(yùn)維人員1到2人即可,反之可能會(huì)需要更多的人員以及對(duì)人員能力要有更高要求。
Odin針對(duì)醫(yī)院的本土化需求進(jìn)行大量開發(fā),增加國(guó)內(nèi)常用而國(guó)際著名品牌不具備的易用性功能,例如內(nèi)置API網(wǎng)關(guān)、鑒權(quán)管理、各種標(biāo)準(zhǔn)化定義、數(shù)據(jù)處理轉(zhuǎn)換工具、PDF導(dǎo)出等各類組件,并兼容國(guó)產(chǎn)服務(wù)器和操作系統(tǒng),實(shí)現(xiàn)開箱即用。同時(shí)Odin全程中文支持,純Web操作界面和可視化工具等,使操作運(yùn)維更簡(jiǎn)單,一目了然,降低學(xué)習(xí)使用門檻,快速上手操作。
有的醫(yī)院通過努力打造堅(jiān)實(shí)的硬性和軟性基礎(chǔ),解決了頻繁“修平臺(tái)”的問題。然而,在醫(yī)療機(jī)構(gòu)中,尤其是大型三級(jí)醫(yī)院,信息化建設(shè)已步入復(fù)雜的“深水區(qū)”。醫(yī)院不僅需要確保平臺(tái)的穩(wěn)定高可用,還需要將平臺(tái)真正用起來,滿足“深度”業(yè)務(wù)需求,如閉環(huán)管理、跨院區(qū)的實(shí)時(shí)交互、互聯(lián)網(wǎng)醫(yī)院的業(yè)務(wù)協(xié)同、T+0的數(shù)據(jù)主題庫建設(shè)和業(yè)務(wù)中臺(tái)建設(shè)等高級(jí)別測(cè)評(píng)要求和著眼全局的建設(shè)規(guī)劃。
如果集成平臺(tái)日常運(yùn)維仍處于“補(bǔ)丁式”開發(fā)和“碎片化”應(yīng)用的階段,缺乏一體化、全局化的建設(shè)流程來實(shí)現(xiàn)相應(yīng)需求,將難以滿足這些復(fù)雜多樣的集成需求,或者實(shí)際使用過程非常繁瑣復(fù)雜,導(dǎo)致醫(yī)院難以充分發(fā)揮平臺(tái)的潛力,那么平臺(tái)本身的價(jià)值將受到限制,距離真正“用平臺(tái)”仍有一定距離。
Odin突破了傳統(tǒng)堆砌功能“授人以魚”的方式,而是通過“授人以漁”形成了一套DevOps規(guī)范化管理的方法論,并為該管理流程搭建了扎實(shí)的環(huán)境基礎(chǔ),例如生產(chǎn)/開發(fā)雙環(huán)境隔離、開發(fā)/測(cè)試/審核/管理人員不同權(quán)限的分離,通過熟練運(yùn)用上述環(huán)境進(jìn)行開發(fā),自然而然能引導(dǎo)醫(yī)院形成一套規(guī)范化、全局化的開發(fā)、運(yùn)維、管理流程,助力醫(yī)院應(yīng)對(duì)“碎片化”集成需求,實(shí)現(xiàn)對(duì)集成平臺(tái)的“深層次”運(yùn)用。
環(huán)境為基、運(yùn)維為本、平臺(tái)為用,通過將這三者有機(jī)結(jié)合,實(shí)現(xiàn)更穩(wěn)定、更可靠、更高效的信息化集成,走出頻繁“修平臺(tái)”的困境,助力醫(yī)院邁上真正“用平臺(tái)”的新臺(tái)階。
智慧醫(yī)療網(wǎng) ? 2022 版權(quán)所有 ICP備案號(hào):滬ICP備17004559號(hào)-5