新聞中心
當(dāng)前位置:網(wǎng)站首頁(yè) > 新聞中心
云存儲(chǔ)性能:可用性和持久性之間的差異
當(dāng)你打開(kāi)汽車(chē)點(diǎn)火開(kāi)關(guān),把電器插到墻上的插座上,或者雙擊硬盤(pán)上的文件時(shí),你就知道接下來(lái)會(huì)發(fā)生什么了。這些東西都會(huì)帶來(lái)你想要的結(jié)果。但在云端,你寶貴的文件卻掌握在別人手中。你確定每次都能指望有結(jié)果嗎?在將控制權(quán)移交給對(duì)象存儲(chǔ)之前,潛在的云存儲(chǔ)提供者應(yīng)該回答幾個(gè)問(wèn)題。您能確定您的業(yè)務(wù)所依賴的IT基礎(chǔ)得到了良好的保護(hù)嗎?您的數(shù)據(jù)意外不可用的可能性有多大?
持久性:宣傳的非常好,但幾乎只是學(xué)術(shù)性的
硬盤(pán)驅(qū)動(dòng)器會(huì)死,而在一個(gè)裝載了硬盤(pán)驅(qū)動(dòng)器的數(shù)據(jù)中心中,它們更是經(jīng)常會(huì)死。根據(jù)云存儲(chǔ)提供商Backblaze最新發(fā)布的硬盤(pán)數(shù)據(jù),其108,461塊硬盤(pán)中有474塊在2019年第二季度出現(xiàn)故障,年化故障率為1.8%。但是這些失敗都沒(méi)有影響到客戶,因?yàn)槌志眯曰驍?shù)據(jù)的健康狀況對(duì)于Backblaze、Microsoft、Amazon和谷歌這樣的公司來(lái)說(shuō)至關(guān)重要。它們采取極端措施來(lái)防止托管文件丟失或損壞。每個(gè)主要的云服務(wù)提供商都使用一種稱為擦除編碼的正向糾錯(cuò)技術(shù),該技術(shù)將一個(gè)文件分成許多塊。然后,它計(jì)算額外的奇偶校驗(yàn)塊,用于在任何原始文件丟失的情況下重建文件。Backblaze營(yíng)銷(xiāo)副總裁Ahin Thomas表示,該公司基于reed solom的Java庫(kù)將每個(gè)文件分成17個(gè)碎片,然后計(jì)算另外3個(gè)碎片以保持奇位。這些碎片然后分布在20個(gè)不同的驅(qū)動(dòng)器上。
Thomas 表示:“在任何時(shí)候,我們可能會(huì)丟失三個(gè)硬盤(pán),但一切仍然很好。那么問(wèn)題是,你能在失去第四個(gè)驅(qū)動(dòng)器之前,替換并重建丟失的三個(gè)驅(qū)動(dòng)器嗎?”
Facebook也在它的冷庫(kù)架上使用Reed-Solomon擦除代碼,而Microsoft Azure Storage有自己的本地重構(gòu)代碼,據(jù)稱可以減少重構(gòu)所需的擦除代碼片段的數(shù)量。有了硬盤(pán)驅(qū)動(dòng)器故障率統(tǒng)計(jì)數(shù)據(jù)、對(duì)給定云提供商的擦除編碼體系結(jié)構(gòu)的深入了解,以及故障后重建所需時(shí)間的一般概念,我們可以使用一些復(fù)雜的數(shù)學(xué)計(jì)算數(shù)據(jù)持久性。不過(guò),云服務(wù)商(Backblaze除外)通常不會(huì)共享這些信息,因此我們只能依賴于它們?cè)诎俜直戎蟹从车某志眯月暶?。在微軟的地理冗余Azure存儲(chǔ)計(jì)劃中,經(jīng)常可以看到使用多少個(gè)9來(lái)衡量持久性。我們看到的11個(gè)9字通常翻譯為99.9999999%的持久性。在這個(gè)層次上,關(guān)于多一個(gè)9個(gè)甚至更少9的辯論從實(shí)用轉(zhuǎn)向了學(xué)術(shù)。
“任何云服務(wù)丟失數(shù)據(jù)的可能性都非常低,”Backblaze的 Thomas 繼續(xù)說(shuō)道?!翱赡艿那闆r是,你的信用卡出了問(wèn)題,你沒(méi)有查看電子郵件,也沒(méi)有收到賬戶通知。”
事實(shí)上,下個(gè)世紀(jì)地球被危險(xiǎn)的小行星撞擊的可能性,比大型云提供商隨機(jī)丟失數(shù)據(jù)的可能性更大。關(guān)鍵是提供者知道他們的硬件最終會(huì)失敗,并且他們?cè)谠O(shè)計(jì)時(shí)考慮到了失敗。在任何嚴(yán)肅的云存儲(chǔ)供應(yīng)商那里,您的數(shù)據(jù)的持久性幾乎都得到了保證。
但是,請(qǐng)注意,持久性計(jì)算沒(méi)有考慮到人的因素。通過(guò)錯(cuò)誤的代碼行引入一個(gè)bug可以徹底清除整個(gè)系統(tǒng)。武裝沖突可能導(dǎo)致數(shù)據(jù)中心的丟失?;蛘咭幌盗械淖匀粸?zāi)害理論上可能影響多個(gè)數(shù)據(jù)中心的位置,這些數(shù)據(jù)中心使您的文件在地理上分散。這些都是持久性計(jì)算范圍之外的因素,這就是為什么IT經(jīng)理需要考慮它們的原因。
Backblaze的 Thomas 說(shuō):“我們最大的客戶之一是一家基因組公司,該公司在網(wǎng)站上保存了一份數(shù)據(jù)副本,一份保存在東海岸的Amazon S3,一份保存在西海岸的Backblaze B2。通過(guò)這樣做,他們實(shí)現(xiàn)了供應(yīng)商和地理多樣性?!?
不管您所引用的持久性規(guī)范是什么,維護(hù)三個(gè)重要數(shù)據(jù)副本都是最佳實(shí)踐。雖然大多數(shù)組織都沒(méi)有達(dá)到這個(gè)理想,但是CIO們和家庭用戶都應(yīng)該考慮所有影響持久性的變量。
你的文件會(huì)在你需要的時(shí)候出現(xiàn)嗎?
所以,知道您的數(shù)據(jù)在云中是安全的就放心了。但是你是否從云供應(yīng)商那里對(duì)于數(shù)據(jù)的可訪問(wèn)性得到了同樣的保證?雖然現(xiàn)代數(shù)據(jù)中心可以接近無(wú)所不在的正常運(yùn)行時(shí)間,但情況并非如此??捎眯粤炕藬?shù)據(jù)可訪問(wèn)的時(shí)間量。它不考慮影響您與云存儲(chǔ)提供商連接的任何其他變量,比如ISP問(wèn)題、網(wǎng)絡(luò)硬件故障或斷電。但是,它仍然比持久性規(guī)范低很多。99%、99.9%或99.99%的可用性保證是常見(jiàn)的,允許偶爾進(jìn)行數(shù)據(jù)中心維護(hù)。
您想要的可用性級(jí)別由您對(duì)數(shù)據(jù)的操作和您愿意支付的金額決定。在99%的情況下,你可以接受每年3.65天的停機(jī)時(shí)間。繁忙的電子商務(wù)網(wǎng)站不會(huì)容忍這些銷(xiāo)售損失。添加一個(gè)9(99.9%)可以使您每年的空閑時(shí)間達(dá)到8.75小時(shí),而99.99%可以將停機(jī)時(shí)間限制在53分鐘左右。
云服務(wù)提供者在其服務(wù)級(jí)別協(xié)議(SLA)中發(fā)布并保證可用性。如果供應(yīng)商未能履行此承諾,它可以以適用于下個(gè)月賬單的服務(wù)積分的形式退還一定比例的費(fèi)用。通常,這些都是分層的,以便在服務(wù)失誤時(shí)更加積極主動(dòng)。例如,Amazon S3標(biāo)準(zhǔn)對(duì)象存儲(chǔ)類(lèi)為99.99%的可用性設(shè)計(jì),如果每月正常運(yùn)行時(shí)間在99.9%到99.0%之間,則授予10%的服務(wù)信用。如果一個(gè)月的可用性低于99.0%,但超過(guò)95.0%,則該值將增加到25%。如果服務(wù)低于95%,它將提供100%的信用額度。
當(dāng)然,你肯定不是為了這些額度。您需要滿足SLA中規(guī)定的可用性的提供者。該協(xié)議只是說(shuō)明了供應(yīng)商對(duì)其交付能力的信心。
二者兼有還是都沒(méi)有?
很多時(shí)候,你不一定要購(gòu)買(mǎi)最好的可用性或防故障持久性。云存儲(chǔ)已經(jīng)發(fā)展到可以指定存儲(chǔ)類(lèi)、動(dòng)態(tài)確定每月的可用性,或者縮減使用少于11個(gè)9的非關(guān)鍵數(shù)據(jù)的持久性。
谷歌云存儲(chǔ)可以分為標(biāo)準(zhǔn)存儲(chǔ)類(lèi)、近線存儲(chǔ)類(lèi)和冷線存儲(chǔ)類(lèi)。標(biāo)準(zhǔn)適用于短時(shí)間內(nèi)頻繁訪問(wèn)(或熱)數(shù)據(jù)的存儲(chǔ)。該公司允許您進(jìn)一步深入并定義單區(qū)域、雙區(qū)域或多區(qū)域,以微調(diào)性能和地理冗余。當(dāng)然,將數(shù)據(jù)存儲(chǔ)在不同的位置使谷歌能夠靈活地將SLA從99.0%提高到99.95%,典型的月可用性大于99.99%,這一點(diǎn)也不奇怪。對(duì)于計(jì)劃每月讀取或修改一次或更少的數(shù)據(jù)(如備份、歸檔和長(zhǎng)尾多媒體內(nèi)容),近線存儲(chǔ)更好。同時(shí),coldline存儲(chǔ)被描述為由于法律或監(jiān)管原因以及災(zāi)難恢復(fù)而保存的不常訪問(wèn)的數(shù)據(jù)。Coldline的成本要低得多,但它提供的可用性稍微低一些,受90天的最低存儲(chǔ)時(shí)間限制,并且會(huì)產(chǎn)生數(shù)據(jù)訪問(wèn)成本。
Amazon的Simple Storage Service (S3)有自己的存儲(chǔ)類(lèi),可以滿足不同的用例。一方面,S3標(biāo)準(zhǔn)為頻繁訪問(wèn)的數(shù)據(jù)提供了高持久性、可用性和性能。另一方面,S3 One zone infrequency Access (IA)減少了地理上的冗余,并在存儲(chǔ)費(fèi)用上提供了很大的折扣,但對(duì)數(shù)據(jù)檢索要求更高的價(jià)格。
亞馬遜、谷歌和微軟為配置定制云存儲(chǔ)解決方案提供了足夠的靈活性,這既好又有挑戰(zhàn)性。當(dāng)您構(gòu)建基于存儲(chǔ)、請(qǐng)求、管理、傳輸、加速和跨區(qū)域復(fù)制的服務(wù)時(shí),很容易在解析它們同樣復(fù)雜的定價(jià)表時(shí)迷失。像Backblaze這樣的提供商比三巨頭中的任何一家都更簡(jiǎn)單、更實(shí)惠,只要你在尋找一個(gè)純粹的云存儲(chǔ)游戲,它有11個(gè)9級(jí)的耐用性和99.9%的可用性。當(dāng)您進(jìn)入更多計(jì)算密集型工作負(fù)載或毫秒級(jí)災(zāi)難恢復(fù)點(diǎn)時(shí),探索對(duì)象存儲(chǔ)之外的服務(wù)是有意義的,這些服務(wù)可能更適合于邊緣計(jì)算、高端人工智能或機(jī)器學(xué)習(xí)。
對(duì)持久性和可用性的概念有了堅(jiān)實(shí)的了解,就更容易信任云存儲(chǔ)提供商提供的服務(wù)。在保護(hù)組織最有價(jià)值的文件時(shí),減少與內(nèi)部存儲(chǔ)相關(guān)的設(shè)備、維護(hù)、電源和人員成本可能是節(jié)省組織資金的關(guān)鍵。
作者:張?zhí)K月來(lái)源:T媒體
|