新聞中心
當(dāng)前位置:網(wǎng)站首頁 > 新聞中心
用云存儲進行歸檔:改善數(shù)據(jù)保護能力
當(dāng)歸檔工作意味著把磁帶上的數(shù)據(jù)轉(zhuǎn)移至遠程設(shè)施中供長期保存時,這項技術(shù)已與其早期形式之間產(chǎn)生了巨大的變化。如今的歸檔技術(shù),既可以如同自動歸檔電子郵件信息一樣輕松,又可以如同在一個外場存儲站點中放置傳統(tǒng)物理存儲磁帶一樣負擔(dān)沉重。
其中,云歸檔是一個特別具有吸引力的選擇,因為這項技術(shù)提供了可訪問功能和數(shù)據(jù)保護功能,而其成本僅為構(gòu)建一個現(xiàn)場歸檔基礎(chǔ)設(shè)施的一小部分。我們將討論評估基于云計算技術(shù)歸檔時需考慮的關(guān)鍵因素,其中包括:價格與性能、云計算歸檔的優(yōu)缺點、服務(wù)等級、可訪問性、災(zāi)難恢復(fù)選項、合規(guī)性等等。
雖然“歸檔”一詞意味著數(shù)據(jù)將被存儲很長一段時間,但是其具體的時限卻是隨行業(yè)不同而各有差異。例如,大多數(shù)的財務(wù)數(shù)據(jù)要求的歸檔時間為七年,藥品研究數(shù)據(jù)則要求二十年,而那些醫(yī)療記錄和核記錄數(shù)據(jù)則必須保存長達五十年之久。一般來說,在磁盤上保存數(shù)據(jù)長達十年甚至更長時間的的成本是非常昂貴的。同樣,我們也很難預(yù)測哪一種歸檔技術(shù)將存在十年之久,因此,本文中用于云歸檔的“長時間”一詞是指一年至七年的時間。價格與性能
云歸檔恰恰實現(xiàn)了成本與可訪問性之間一個“恰到好處”的平衡。存儲磁帶一直以來都是,甚至仍將是長時間存儲數(shù)據(jù)方法中成本最低的一種。一個典型的LTO存儲磁帶存儲數(shù)據(jù)的成本約為35美元/TB每月。即使是最便宜的云計算存儲也無法在這個價格方面體現(xiàn)其競爭優(yōu)勢。而其不利的一面在于,存儲磁帶歸檔的正常檢索時間為次日交付加上安裝和恢復(fù)所需的時間。這就意味著用戶在能夠訪問所要求信息之前必須等待不少于一個工作日。
歸檔與備份
雖然眾多IT公司仍然考慮采用他們傳統(tǒng)的備份磁帶進行“歸檔”工作,但也有一些具有不同于歸檔、用于數(shù)據(jù)備份的特殊用例和訪問需求。執(zhí)行備份可保護目前正在被使用的數(shù)據(jù);如果必須把數(shù)據(jù)從備份中恢復(fù)出來,那么該操作必然發(fā)生在完成備份工作之后不久。一般來說,備份數(shù)據(jù)的保存時間相對較短。
歸檔數(shù)據(jù)是一組出于合規(guī)性、公司管理或知識產(chǎn)權(quán)等目的而將被保存相對較長一段時間的數(shù)據(jù)集合。歸檔數(shù)據(jù)可被不定期訪問,但具有較高的易搜索性,因此可相對較快和較容易地恢復(fù)特定數(shù)據(jù)。
存儲網(wǎng)絡(luò)行業(yè)協(xié)會為云備份和云歸檔服務(wù)的區(qū)別給出了一個定義:“對于云計算備份來說,云計算是一種備份數(shù)據(jù)的簡單存儲,而對于云計算歸檔和存儲來說,云計算是執(zhí)行具體操作的所在,以便于確保數(shù)據(jù)的長期存儲、保存以及存在?!?
另一方面,云存儲的價格為10美分/GB美元及以上(根據(jù)容量不同而不同)。當(dāng)涉及數(shù)以百計TB時其成本就相當(dāng)可觀了,但是它往往仍然要比在一個中央數(shù)據(jù)中心中采購、部署和管理陣列低。而存儲磁帶的檢索時間要以工作日為單位,而訪問在基于云計算技術(shù)存儲中托管的數(shù)據(jù),其單位則是以秒來計算的。對于某些應(yīng)用程序,這可能是價格與性能之間最為理想的平衡點。
云歸檔的優(yōu)缺點
但是在真正實施云歸檔之前,IT人員需要權(quán)衡云歸檔和內(nèi)部歸檔兩者各自的優(yōu)點。從技術(shù)角度講,云服務(wù)商無法實現(xiàn)那些在內(nèi)部也無法部署的系統(tǒng)。例如,一家公司可能會選擇一個具有三層高容量SATA磁盤的層存儲基礎(chǔ)設(shè)施來實現(xiàn)一個更低的平均成本(每GB)。通常情況下,如果組織無法承受與遠程場所連接中斷的風(fēng)險,那么他們往往會傾向于實施一個內(nèi)部實現(xiàn)的解決方案,這個解決方案有監(jiān)管要求,要求具備嚴格的數(shù)據(jù)安全監(jiān)督或數(shù)據(jù)檢索需求,而其中是無法接受遠程延遲的。這是一個相當(dāng)嚴格的列表,但是仍然還有眾多的應(yīng)用程序適用基于云計算技術(shù)的歸檔。
即便IT組織可以把遷移至云計算的物流工作量進行量化,但是他們卻不應(yīng)忽視這樣一個可預(yù)測而不可預(yù)見的調(diào)整:從以技術(shù)為中心的角度到一個服務(wù)等級管理角度的心態(tài)轉(zhuǎn)變。之前已習(xí)慣于進行技術(shù)決策和部署的IT人員們需要更深入地了解云計算供應(yīng)商的架構(gòu)和“建議”產(chǎn)品或特定技術(shù)的實施。當(dāng)供應(yīng)商完全承擔(dān)管理云計算基礎(chǔ)設(shè)施的全部責(zé)任時,很少有這樣保證的請求。如果合同中規(guī)定的服務(wù)等級已得到滿足,那么IT部門確實不應(yīng)該關(guān)心底層技術(shù)。隨著經(jīng)驗的進一步積累,工作人員的注意力應(yīng)逐漸從底層細節(jié)轉(zhuǎn)移至高層次的管理。服務(wù)是關(guān)鍵要素
因此,服務(wù)水平管理是是否使用云歸檔還是原本也運營模式的關(guān)鍵要素。在從云歸檔供應(yīng)商采購服務(wù)時,你需要考慮以下服務(wù)水平方面的問題:
在線時間。對于絕大多數(shù)應(yīng)用,3個9或4個9的可用性就已足夠應(yīng)對業(yè)務(wù)所需。假如你需要5個9的高可用性,這種數(shù)據(jù)訪問性的要求可能無法使用在歸檔層上。存儲在歸檔層上的數(shù)據(jù)通常會定義為非關(guān)鍵性的。關(guān)于在線時間的要求在很大程度上決定了供應(yīng)商應(yīng)當(dāng)具備多少基礎(chǔ)架構(gòu),因此這會對托管的成本造成重大影響。毋庸置疑的是,需要明確數(shù)據(jù)存取的實際時間、訪問模式以及宕機所會造成的損失。這些計算結(jié)論可以和各種保障系統(tǒng)在線所需的成本進行比較,基于這種比較可以很容易地調(diào)整或拒絕是否采用云環(huán)境。供應(yīng)商通常在無法滿足服務(wù)水平協(xié)議(SLA)時退回托管費用的部分款項或給予其它形式的補償。但是,相關(guān)附加說明常以小字形式顯示,所以請仔細找到并認真閱讀。
可訪問性??稍L問性和正常工作時間并不一定相同。存儲可能是忙碌的,但是子組件會導(dǎo)致一個應(yīng)用程序無法使用。例如,如果你需要實現(xiàn)數(shù)據(jù)鏈接的冗余或多個冗余,那么你必須為它們支付額外費用,但是不這么做可能帶來的后果就是無法接受的應(yīng)用程序中斷。請確定服務(wù)等級能夠確保數(shù)據(jù)的可用性。
性能。量化你的應(yīng)用所需的IOPS并且將其納入到SLA之中。IOPS可以通過平均或者峰值活動狀態(tài)加以測算。假如你要求峰值時刻的IOPS保障,你可能要為此支付給供應(yīng)商更多的費用。有些供應(yīng)商可能會提供計量計費,但是很多企業(yè)組織并不希望采用這種方式,因為其中存在著潛在的不確定性。絕大多數(shù)企業(yè)可以接受一定數(shù)量上的約束操作(尤其是針對歸檔層的存儲)以獲取成本優(yōu)勢。在這種情況下,SLA只保證一定的IOPS而非最終用戶的性能體驗。假如應(yīng)用要求超過了合約規(guī)定的IOPS量,這就絕對是企業(yè)IT部門的問題了;當(dāng)然可以通過購買額外IOPS的方式來滿足。
數(shù)據(jù)恢復(fù)。正如他們?yōu)閮?nèi)部應(yīng)用程序所做的那樣,IT組織需要為云計算歸檔指定恢復(fù)點對象(RPO)和恢復(fù)時間對象要求。這關(guān)系到正常運行時間,而且還覆蓋諸如數(shù)據(jù)損壞這樣的意外事故或不影響整體正常運行時間但有些個別應(yīng)用程序的組件故障。供應(yīng)商一般都有默認的RPO和RTO,對于歸檔層而來一般都是足夠的。此外,毋庸置疑的是,需要明確業(yè)務(wù)單元所能容忍的各類的數(shù)據(jù)丟失或應(yīng)用故障。在很多時候,這會比你認為的要長。
災(zāi)難恢復(fù)(DR)。如果云歸檔是用于離線復(fù)制存儲來滿足數(shù)據(jù)冗余的要求,你可以不考慮該層災(zāi)難恢復(fù)的策略。不過用戶仍然需要注意:絕大多數(shù)的托管存儲并不包含任何災(zāi)難恢復(fù)事故的防護。如果托管數(shù)據(jù)屬于混合云存儲中的活動數(shù)據(jù),災(zāi)難恢復(fù)規(guī)劃是完全必要的。托管服務(wù)供應(yīng)商可能定期備份所有數(shù)據(jù),不過他們通常不會循環(huán)備份離線站點中的數(shù)據(jù),即便做的話也是以很少的頻率(比如每月一次)。雖然在數(shù)據(jù)中心中做到SAS-70合規(guī)中的災(zāi)難恢復(fù)非常困難,但也絕非不可能的事。托管企業(yè)提供的災(zāi)難恢復(fù)通常要顯著地增加額外的成本,并且會快速改變托管業(yè)務(wù)的經(jīng)濟情況。請確保數(shù)據(jù)不會遺留在具有風(fēng)險的地方。
備份和恢復(fù)。即便托管服務(wù)供應(yīng)商定期備份數(shù)據(jù)并且頻繁地循環(huán)離線存儲數(shù)據(jù),IT部門也并非完全沒有風(fēng)險。托管企業(yè)通常只有有限的備份軟件和磁帶技術(shù)。這意味著其備份形式(硬件、軟件或者兩者兼?zhèn)洌┛赡芎湍愕腎T系統(tǒng)并不兼容。假設(shè)IT部門嘗試從供應(yīng)商的磁帶中進行恢復(fù),可能由于沒有足夠的基礎(chǔ)架構(gòu)支持而造成嚴重的延誤。請考慮好在最壞的情況下的解決方案。
合規(guī)性。要求特殊合規(guī)性對待的歸檔數(shù)據(jù)可能仍然是云計算托管應(yīng)用的一個理想對象。如果有必要的話,你將需要確定數(shù)據(jù)是否保存在永久存儲介質(zhì)上。你可能還需要確保,遵循和審計嚴格的訪問指引;SAS-70 供應(yīng)商就已具備了這樣的程序。
固定成本和可變成本。歸檔較之于使用自有的基礎(chǔ)架構(gòu),其核心收益之一就是你只需支付你使用的存儲。這一指標(biāo)會受你使用的多少的影響,但其也有最小的固定成本。從磁帶轉(zhuǎn)向云歸檔
很顯然,對于擁有大量存儲在相對昂貴內(nèi)部基礎(chǔ)設(shè)施中歷史數(shù)據(jù)的公司來說, 基于云計算技術(shù)的歸檔是具有相當(dāng)吸引力的。更多的質(zhì)疑在于,將基于存儲磁帶的歸檔轉(zhuǎn)變?yōu)樵朴嬎銡w檔是否真的有意義。大型企業(yè)可能通過數(shù)以百計的離線磁帶實現(xiàn)歸檔操作。將所有這些磁帶取出,讀取數(shù)據(jù)并遷移到云歸檔基礎(chǔ)架構(gòu)的工作讓人望而卻步。這里還有一個前提,供應(yīng)商需擁有必要的硬件以讀取所有的存儲磁帶,而其中部分的數(shù)據(jù)格式可能已經(jīng)過時。此外,沒有哪家云供應(yīng)商可以在托管這樣龐大的數(shù)據(jù)的同時,接受和大型磁帶庫相同的成本。磁盤壓縮和數(shù)據(jù)重復(fù)刪除技術(shù)可能會非常有用,不過成本上的差異仍然是一個問題。
即使從存儲磁帶歸檔到云計算歸檔的轉(zhuǎn)變難度極大,云歸檔仍不失為一種可以考慮的方式。超過7年以上的磁帶在保存上代價高昂,并且可能有各種問題。最佳實踐顯示,企業(yè)需要在每五年讀取并重新寫入磁帶,來確保格式準(zhǔn)確以及數(shù)據(jù)可以被讀取,而這是一項不容小覷的任務(wù)。例如,如果一個公司擁有10,000個磁帶歸檔,更新周期為五年,那么它就必須每年更新2000個磁帶。也就是說,每個工作日更新近7個磁帶,這雖然可行,但這屬于年復(fù)一年而又不會帶來生產(chǎn)效益的工作。此外,問題的關(guān)鍵在于檢索的概率。一些企業(yè)考慮到恢復(fù)操作可能非常麻煩,允許磁帶被廢棄,但是需要修復(fù)的概率已低至可承受由其產(chǎn)生的風(fēng)險本身。另一方面,如果你知道恢復(fù)是不可避免的,現(xiàn)在就可以考慮選擇時間,預(yù)留經(jīng)費來從磁帶遷移到云端,這可以在以后節(jié)省下大量的時間和精力,甚至應(yīng)對一些突發(fā)情況。
當(dāng)然,并不是說存儲磁帶已在歸檔應(yīng)用中失去其地位和意義,在絕大多數(shù)情況下,它依然是最低成本的解決方案。此外,LTO線性磁帶文件系統(tǒng)可使磁帶在四層存儲中承擔(dān)新的角色,在云(或者數(shù)據(jù)中心)中作為額外的一層提供給存儲的0、1、2、3層。在云歸檔環(huán)境中,這可以有效地生成混合云并為少量數(shù)據(jù)提供相對高速的訪問(分鐘級),但其成本卻和磁帶類似。磁帶也會有內(nèi)置的壓縮技術(shù),并支持加密和一次寫入多次讀出(WORM)。使用自動化的分層軟件,數(shù)據(jù)可以自動化地遷移至歸檔層。
考慮到不可避免的意外事件
到目前為止,我們已描繪了云計算歸檔服務(wù)的一個相當(dāng)正面積極的輪廓。通常,只需努力就能夠?qū)崿F(xiàn)預(yù)期的效果,但事實并不總是如此。組織應(yīng)當(dāng)考慮到,他們把數(shù)十TB的數(shù)據(jù)遷移至供應(yīng)商所帶來的可能后果,因為有可能會發(fā)生不希望發(fā)生的事件或合同違約事件。 當(dāng)然,賠償可能有所心理安慰,但是小額的經(jīng)濟賠償完全不能彌補對企業(yè)組織的交付聲譽所帶來的實際成本、惡化或損害。一旦發(fā)生意外事故,如果無法滿足特定的性能等級,合同可能就會終止且無任何賠償。因此規(guī)劃中還應(yīng)當(dāng)包含備選的托管功能,無論是內(nèi)部的備用系統(tǒng)或者另一家供應(yīng)商。云歸檔并不屬于高風(fēng)險的方案,不過聰明的企業(yè)凡事都會準(zhǔn)備在前。
|