新聞中心
當前位置:網(wǎng)站首頁 > 新聞中心
改進數(shù)據(jù)中心風險管理的三個步驟
數(shù)據(jù)中心在現(xiàn)代企業(yè)運營的業(yè)務中仍然至關(guān)重要,因此企業(yè)需要識別和降低數(shù)據(jù)中心運營風險的方法。隨著云計算的興起,一些IT傳道者、首席信息官和大型技術(shù)研究公司在5年前預言數(shù)據(jù)中心即將消亡。行業(yè)專家Mark Settle當時提出建議,企業(yè)關(guān)閉內(nèi)部部署數(shù)據(jù)中心需要深思熟慮,并預測數(shù)據(jù)中心的業(yè)務將隨著數(shù)據(jù)量的增長而繼續(xù)增長。如今,數(shù)據(jù)中心不僅繼續(xù)存在,而且在與混合云和多云的市場競爭中蓬勃發(fā)展。不僅如此,數(shù)據(jù)中心還可以滿足與邊緣計算、物聯(lián)網(wǎng)和5G等新興技術(shù)相關(guān)的服務需求。由于這些新的應用程序以及終端用戶計算(EUC)和移動解決方案中的新興需求,數(shù)據(jù)中心的運營變得越來越復雜,導致出現(xiàn)更多的內(nèi)部和外部風險。停機是一種持續(xù)性風險,每次停機事件的平均損失高達每分鐘11000美元。以下是企業(yè)識別和降低數(shù)據(jù)中心運營風險的三個步驟。1.采用綜合方法進行風險管理2021年2月,德克薩斯州遭遇的冬季風暴以及隨后導致的大面積停電,對該州的數(shù)據(jù)中心來說是一次嚴峻的考驗。雖然沒有發(fā)生大規(guī)模故障,但電氣故障切換系統(tǒng)存在重大問題。從功能的角度來看,數(shù)據(jù)中心是運行業(yè)務關(guān)鍵型應用程序的物理設施;而從業(yè)務的角度來看,它們是需要進行預算和管理的不動產(chǎn)或資本資產(chǎn)。關(guān)鍵是,單點故障可能(而且經(jīng)常會)導致數(shù)據(jù)中心的運營中斷,從而導致收入損失。這就是需要一個適用于整個企業(yè)的普遍風險管理計劃和政策的原因。這也是綜合風險管理(IRM)發(fā)揮重要作用的地方。調(diào)研機構(gòu)Gartner公司將綜合風險管理(IRM)定義為“由風險意識文化和支持技術(shù)支持的一組實踐和流程,通過對企業(yè)如何管理其獨特風險的綜合視圖來改進決策制定和性能?!痹诤笠咔闀r代,實施遠程工作、BYOD、CYOD和其他工作場所實踐變革的企業(yè)正在將其數(shù)字化轉(zhuǎn)型戰(zhàn)略與IT基礎設施升級相結(jié)合,以識別和緩解自然災害、供應鏈、數(shù)據(jù)處理以及商業(yè)模式所固有的風險。如果企業(yè)正在實施數(shù)字化轉(zhuǎn)型,則需要監(jiān)控可能影響數(shù)據(jù)中心的每個流程和因素(外部或內(nèi)部),并準備好應對由一個或多個事件同時發(fā)生的多重風險。數(shù)字化轉(zhuǎn)型不僅適用于嚴重依賴數(shù)據(jù)或技術(shù)的企業(yè)——它同樣適用于疫情之后開展遠程工作的中小企業(yè),包括那些開始使用公有云替代數(shù)據(jù)中心的企業(yè)。甚至政府部門也在認真對待數(shù)字化轉(zhuǎn)型——利用云計算技術(shù)改造數(shù)據(jù)中心基礎設施是他們的兩個中心目標之一(改善在線用戶體驗是另一個目標)。Jeff Shupack說:“數(shù)據(jù)中心優(yōu)化是《美國聯(lián)邦信息技術(shù)收購改革法案》中記分卡的一個關(guān)鍵衡量指標。該衡量指標部分反映了政府機構(gòu)基礎設施利用云計算的程度?!?Jeff Shupack是一名數(shù)字化轉(zhuǎn)型專家,在通過精益敏捷實施降低全球資本計劃風險方面具有15年的實踐經(jīng)驗。很多企業(yè)正在認識到,敏捷方法、大數(shù)據(jù)分析、移動解決方案和DevOps與可靠的、升級的數(shù)據(jù)中心協(xié)同工作,可以有效地預防風險、充分地應對風險和快速地恢復災難。因此,他們正在轉(zhuǎn)向能夠在混合IT基礎設施中實施這些最佳實踐的框架,以確保業(yè)務連續(xù)性、減少運營成本,并改善數(shù)字客戶體驗。2.了解風險無論企業(yè)的風險管理計劃多么全面,其發(fā)展速度永遠不會超過技術(shù)進步。新技術(shù)和新的工作方式正在創(chuàng)造前所未有的復雜性。以下是數(shù)據(jù)中心面臨的不同類型的風險。(1)IT安全性不足可以說,如今數(shù)據(jù)中心面臨的最大風險是網(wǎng)絡安全漏洞,從DoS攻擊、社交工程到數(shù)據(jù)盜竊,都有可能發(fā)生。2021年,每個數(shù)據(jù)泄露事件造成的平均損失為424萬美元,這是17年來最高的記錄。應用程序和系統(tǒng)故障也會對物理安全方面產(chǎn)生影響,導致身份無法驗證、網(wǎng)絡連接中斷、授權(quán)人員無法進入特定區(qū)域等情況。(2)系統(tǒng)故障沒有彈性架構(gòu)以及沒有連續(xù)的、冗余的、高帶寬的網(wǎng)絡連接,數(shù)據(jù)中心的運營注定要失敗。服務器、網(wǎng)絡設備和相關(guān)設備都需要集群、鏡像和復制等功能,以減少停機的機會。應用程序或軟件(如管理程序) 有時會發(fā)生故障,導致服務器或網(wǎng)絡癱瘓。因此需要確保所有應用程序在混合基礎設施上無縫工作,并與云原生應用程序進行對話。(3)電源故障盡管這種情況極其罕見,但電力故障確實會發(fā)生——主要是自然災害帶來的后果。需要為數(shù)據(jù)中心的所有機架和冷卻系統(tǒng)配備UPS電源或備用發(fā)電機路。數(shù)據(jù)中心與多個變電站的直接連接有助于防止受到本地變電站停電的影響。(4)漏水洪水或滲水可能會給數(shù)據(jù)中心帶來災難。然而,維護良好的管路和排水系統(tǒng)對消防控制和冷卻系統(tǒng)至關(guān)重要。(5)噪音數(shù)據(jù)中心面臨的一個鮮為人知但卻十分嚴重的風險是長期暴露在高頻噪音中,這會降低存儲系統(tǒng)的效率,降低讀/寫性能,并最終影響數(shù)據(jù)完整性。數(shù)據(jù)中心應該建在遠離運動場、消防站、機場等地方,并部署在使用聲學抑制技術(shù)的建筑物內(nèi)。(6)火災電源尖峰和電氣短路是數(shù)據(jù)中心火災的常見原因。如果不迅速控制,火災可以在幾分鐘內(nèi)摧毀數(shù)據(jù)中心IT硬件。具有諷刺意味的是,空調(diào)和冷卻系統(tǒng)將會消散火災產(chǎn)生的煙霧,使火災早期探測變得更加困難。因此需要使用帶有光電傳感器的煙霧探測系統(tǒng),以持續(xù)監(jiān)測數(shù)據(jù)中心的空氣中是否有煙霧。(7)糟糕的災難恢復規(guī)劃雖然數(shù)據(jù)備份目前是一個非常簡單的過程,但出于安全性和性能的綜合考慮,數(shù)據(jù)中心比公有云更受歡迎——希望在系統(tǒng)故障時能夠立即恢復事務性數(shù)據(jù)。當然,這取決于業(yè)務的性質(zhì)和監(jiān)管框架等因素。所以更有理由為每個不同的故障事件制定明確的恢復計劃;計算、存儲或網(wǎng)絡資源也是如此。大多數(shù)先進的災難恢復計劃都有監(jiān)控系統(tǒng),可以跟蹤影響數(shù)據(jù)中心的風險因素,并在超過關(guān)鍵閾值時發(fā)出警報。3.在管理風險之前評估風險所有的風險并不都是相同的。雖然數(shù)據(jù)中心面臨著各種風險,特別是不同的垂直領域,但最終使用的風險緩解技術(shù)不一定需要針對數(shù)據(jù)中心環(huán)境進行定制。因此,數(shù)據(jù)中心運營商需要制定風險管理計劃,列出數(shù)據(jù)中心可能面臨的所有風險,并指定對每種風險事件的響應。首先進行風險審計——對所有擁有和運營的數(shù)據(jù)中心設施進行全面評估。評估影響設施設計、IT基礎設施和運營流程的因素。如果過去發(fā)生過重大事故或中斷,那么可以進行根本原因分析來解決沒有解決的問題??梢宰鲂┦裁磥泶_保在類似的情況下不會再次出現(xiàn)停機。此外,如果使用具有多個數(shù)據(jù)中心和云計算系統(tǒng)的混合架構(gòu),需要單獨審核每個數(shù)據(jù)中心以及它們之間的數(shù)據(jù)路徑和連接。如果在金融和醫(yī)療保健等監(jiān)管嚴格的行業(yè)中運營,則需要將定期數(shù)據(jù)中心風險評估和災難測試作為日常運營的一部分。與其他事項一樣,需要創(chuàng)建框架、政策或備忘單提供適用于數(shù)據(jù)中心運營商的風險類別、每個類別影響的系統(tǒng)、估算損壞和恢復成本,以及發(fā)生事故或災難時應遵循協(xié)議的現(xiàn)成參考。例如,IT咨詢機構(gòu)凱捷公司采用了一種不斷發(fā)展的風險管理方法,該方法識別并量化風險及其緩解成本。凱捷公司高級交付中心經(jīng)理Kevin Read表示:“我們已經(jīng)建立了一個月度風險管理系統(tǒng),記錄所有風險和問題,并制定行動計劃。如果需要更改,將提供投資預算?!比绾蜗C時間數(shù)據(jù)中心(甚至是企業(yè)的整個IT基礎設施)永遠不會孤立地運行,數(shù)據(jù)中心大量組件正在全天候運轉(zhuǎn)。IT基礎設施的風險緩解是一個共同的責任,而不僅僅是首席信息官或首席技術(shù)官的責任。企業(yè)需要有足夠數(shù)量的受過培訓的IT人員,他們愿意盡一切可能掌握數(shù)據(jù)中心的運營。Tenable公司產(chǎn)品營銷副總裁Gavin Millard給大家的建議是:“沖突的目標可能很難解決,最有效的方法之一是建立一個高效的流程,持續(xù)識別風險所在。還需要一個可預測、可靠的方法來更新系統(tǒng),而不會影響企業(yè)的總體業(yè)務目標。”
上一篇 企業(yè)郵箱哪個品牌的好 下一篇 云中端點安全的最佳實踐
|