新聞中心
當前位置:網站首頁 > 新聞中心
阿里云宕機,服務商承諾99.99%的安全性有多可靠?
阿里云又宕機了,這一次發(fā)生在午夜。3月2日23時55分左右,阿里云開始出現(xiàn)大規(guī)模故障,位于華北地區(qū)的多家互聯(lián)網公司的IT運維人員發(fā)現(xiàn)多個APP和網站開始陷入卡頓。隨后一批程序員趕往公司加班。58高級架構師沈劍在針對此次宕機的回憶文章中稱,這場事故持續(xù)了三個小時左右,事后觀察了兩個小時。
3月3日早間,阿里云發(fā)布公告,開始全面排查。截至目前披露的結果是,華北2地域可用區(qū)C部分的ECS服務器(云服務器)等實例出現(xiàn)IO HANG(IO不響應),經緊急排查處理后已全部恢復。阿里云方面向記者證實了這一結果,并表示其他區(qū)域未發(fā)現(xiàn)此類情況。
針對故障,阿里云表示,將根據SLA協(xié)議(服務合同),盡快處理賠償事宜。但阿里云并未公開詳細的賠償細節(jié)。而根據阿里云開發(fā)者論壇上的網友說法,賠償通常是按照故障時間的100倍進行的,而方案則根據包年包月預付費模式和按量付費模式有所不同,但總額不超過支付的單臺云服務器費用總額。這是一場發(fā)生在周末的宕機時間,因微博的傳播而備受關注。第三方機構Forrester分析師戴鯤告訴記者,華北2地域是阿里云最早開通服務的華北地域之一,而ECS服務器又是阿里云最為核心的IaaS(基礎設施即服務)之一,影響程度應當是相對較大的。
2018年6月,阿里云曾出現(xiàn)技術故障。盡管官方最終給出的故障時間僅為30分鐘,而恢復時間需要1小時。但阿里云最終仍將其定義為S1級別事故,即核心業(yè)務重要功能不可用,影響了部分用戶,造成了一定損失。
2019年1月,第三方機構IDC報告數(shù)據顯示,2018年上半年中國公有云廠商中,阿里云以43%的市場占有率排名第一,相當于第二名至第九名的總和;騰訊排名第二,市場占有率為11.2%。99.99%的安全性有多可靠?事實上,宕機事件頻繁發(fā)生。僅2018年一年,全球主流云計算廠商曾發(fā)生數(shù)十起宕機事故。對于宕機的原因,亞馬遜AWS稱因數(shù)據中心硬件問題,微軟Azure數(shù)據中心則因高溫和打雷,騰訊云因運營和硬盤故障,谷歌則因自動化失效。
但與此同時,多家云服務商仍在承諾99.99%的安全可靠性。對此,有技術專家表示,這一數(shù)字是經過驗證的,而且通過部署反饋,故障率的確在0.01%以下。并且,一旦出現(xiàn)故障,云服務商也都有相應的容災方案,可以及時解決問題。
沈劍在上述文章中表示,更換其他方案,也會遇到其他的問題,而自建機房,更是沒有信心比阿里云更好。目前大多數(shù)公司仍在業(yè)務階段,考慮投入產出比,所以多機房模式并不適合所有公司。
如何避免宕機事故造成重大損失?有業(yè)內人士稱,需要將重要業(yè)務分別放在不同的“籃子”里,也就是選擇多個供應商,進行“多云”部署。負責運營微軟云服務落地的世紀互聯(lián)藍云首席執(zhí)行官柯文達表示,真正的企業(yè)級市場中,用戶一定是希望“多云”部署。
不過,也有行業(yè)人士認為,“多云”部署,會帶來管理、開發(fā)、人員培訓的復雜性,也可以選擇多區(qū)域部署的方式。市場對云計算的需求仍在增長云計算取代舊有IT部署的趨勢已不可逆。Gartner數(shù)據顯示,云計算占全球總IT支出的規(guī)模正在不斷增加。從2010年的1.99%,上升到2018年的8%,而未來幾年向云轉移將會直接或間接影響超過1萬億美元的IT支出。
這一切變化發(fā)生在過去十年中。十多年前,無論是跨國巨頭,還是創(chuàng)業(yè)公司,部署IT架構的思路都是相同的,即購買服務器,部署一套系統(tǒng),支撐公司業(yè)務和戰(zhàn)略。此時,IT只是一項運營成本。
但現(xiàn)在這些企業(yè),尤其是初創(chuàng)公司通過租用云服務的方式,就能獲取IT能力。
在中國市場,阿里云就提供這種服務。與此同時,騰訊、百度、電信運營商等紛紛進入這一市場。2015年中國云計算市場爆發(fā)后,多家公司曾以年增長率超過三位數(shù)的速度增長。不僅如此,從2015年下半年開始,云計算服務商已經將客戶瞄向大型企業(yè)和政府機關。
從整體來看,云計算取代舊有IT部署模式已成為產業(yè)共識,尤其是按需付費的公有云更是對IT成本最有效的節(jié)省。Gartner研究報告預計,2017年到2020年公有云行業(yè)增速將維持在15%以上,2020年將達到3834億美元的規(guī)模,而云代替的總規(guī)模也將達到2160億美元。
一位行業(yè)分析師告訴記者,對于如電信、金融等一些關鍵領域的巨頭公司,這類宕機事件仍將是影響其快速轉向云計算隊伍的阻礙,他們可能拿出一些非核心業(yè)務在云計算上嘗試,但很難馬上全部轉向云計算。
|