新聞中心
當(dāng)前位置:網(wǎng)站首頁 > 新聞中心
如何通過規(guī)劃避免云服務(wù)中斷
盡管云計(jì)算為IT部門帶來了驚人的效益,但它始終只是個(gè)技術(shù)平臺。由于管理的不完美,問題總會發(fā)生。宕機(jī)事件提醒大家,實(shí)踐證明IT可以提供幫助,但在一些情況下,也可能會擴(kuò)大人為失誤的影響。因此,改變管理手段和持續(xù)監(jiān)控等基本的IT規(guī)劃是必要的。那么,如何通過規(guī)劃避免云服務(wù)中斷呢?添加特定警報(bào):用少量的投資為重要基礎(chǔ)設(shè)施安裝特定警報(bào),添加警報(bào)系統(tǒng)升級通知,確保在問題影響關(guān)鍵業(yè)務(wù)之前得到解決。
每天檢查數(shù)據(jù)表:即使擁有最先進(jìn)的報(bào)警和報(bào)告系統(tǒng),“經(jīng)驗(yàn)”仍然是最優(yōu)秀的管理工具,尤其是當(dāng)大量數(shù)據(jù)被雜亂混合時(shí)。定期觀察設(shè)備內(nèi)存、CPU和接口使用的歷史性能數(shù)據(jù)表。允許管理員建立、調(diào)整性能數(shù)據(jù)表,以確保用戶受到影響前主動(dòng)解決報(bào)警閾值。
控制人為錯(cuò)誤:迄今為止最嚴(yán)重的宕機(jī)始發(fā)于人為錯(cuò)誤,而事件的發(fā)生只是由于很常見的網(wǎng)絡(luò)問題引起。一天輸入大量的神秘命令行接口(CLI)命令數(shù)百次,遲早會發(fā)生意外的災(zāi)難。配置錯(cuò)誤問題很難解決,所以請確保進(jìn)行夜間設(shè)備配置備份工作。
創(chuàng)建問題解決方案:你不需要為每一個(gè)可能出現(xiàn)的問題列出詳細(xì)的處理方案,但你至少需要準(zhǔn)備一個(gè)簡潔的電子表格。合理地列舉可能出現(xiàn)的問題,這可以幫助你確定風(fēng)險(xiǎn)領(lǐng)域,并加快團(tuán)隊(duì)成員的初始故障排除步驟。同時(shí),列表上還要包括團(tuán)隊(duì)成員的緊急聯(lián)系方式。不管怎么說,凌晨2點(diǎn)在VPN將問題解決總比第二天8點(diǎn)在辦公室解決要好。
預(yù)防問題擴(kuò)大:即使你已經(jīng)做好萬全準(zhǔn)備,有時(shí)宕機(jī)事件還是會不可抑制的發(fā)生。為了防止問題的擴(kuò)大,你需要合理的報(bào)警管理系統(tǒng),借此保證合適的團(tuán)隊(duì)能被及時(shí)通知。例如,如果一個(gè)文件被錯(cuò)誤刪除,IT生產(chǎn)人員將被及時(shí)通知解決問題,這會讓你體驗(yàn)到意想不到的改變。
|