新聞中心
當前位置:網(wǎng)站首頁 > 新聞中心
BI和真實數(shù)據(jù)分析解決云存儲成本問題
近年來,圍繞云計算的所有應(yīng)用正在逐步增多,但目前公共云服務(wù)中的應(yīng)用只代表了IT總支出的一小部分,而公共云應(yīng)用的最大瓶頸似乎是高昂的云計算存儲成本。與Web相關(guān)的云應(yīng)用可能會存儲數(shù)以百兆的數(shù)據(jù),而關(guān)鍵任務(wù)應(yīng)用則可能會存儲TB級的數(shù)據(jù),按目前的價格來看,其存儲成本是大部分用戶所難以承受的。
除非主流的、占企業(yè)預算大頭的關(guān)鍵任務(wù)應(yīng)用能夠遷往公共云,否則這一態(tài)勢將不會發(fā)生變化。但是值得慶幸的是,我們有兩種策略可以來解決這一云存儲成本問題:數(shù)據(jù)抽象和分布查詢式數(shù)據(jù)訪問。將數(shù)據(jù)抽象方法用于商業(yè)智能和成本分析應(yīng)用目前,商業(yè)智能(BI)與分析是云計算最有前途的兩個應(yīng)用。這些應(yīng)用都聚集在重要IT決策上,且遍布在規(guī)劃者和決策者中。這使得它們成為理想的云計算應(yīng)用,建立真實而不過分龐大的大數(shù)據(jù)是我們之前提出的兩個數(shù)據(jù)成本管理方法中第一個,即數(shù)據(jù)抽象的一個具體實施。數(shù)據(jù)抽象是從原始公司信息中產(chǎn)生一個或多個摘要數(shù)據(jù)庫的機制,其數(shù)據(jù)庫規(guī)模應(yīng)確保它(們)能夠被經(jīng)濟地存儲在云計算中。
BI和真實數(shù)據(jù)分析解決云存儲成本問題在醫(yī)療行業(yè)中的某一個客戶曾表示,通過診斷代碼、治療代碼以及年齡/性別的形式,創(chuàng)建一組患者信息摘要數(shù)據(jù)庫,將減少三百倍以上的信息量,這意味著其云數(shù)據(jù)存儲和訪問成本僅為未經(jīng)數(shù)據(jù)抽象處理的三百分之一。如果希望數(shù)據(jù)抽象方法成為一種高效的成本管理方法,那么就必須對如何進行分析以及分析的對象進行深入研究。大多數(shù)BI運行的目的并不是為了發(fā)現(xiàn)細節(jié)信息;它們是為了尋找某種規(guī)律或某種發(fā)展趨勢。對于大多數(shù)的行業(yè)來說,有明確的變量非常重要。
通過對這些變量創(chuàng)建摘要數(shù)據(jù)庫,能夠通過加快訪問速度來降低成本支出,同時也不會影響分析工作本身。一旦定義好變量的特定組合,那么之后如有需要從未抽象的數(shù)據(jù)中提取該組合的詳細信息也是非常容易實現(xiàn)。這樣一來,基于數(shù)據(jù)抽象的分析就成為了一個云應(yīng)用,可以用于數(shù)據(jù)中心的詳細分析操作。
對非結(jié)構(gòu)化數(shù)據(jù)使用分布查詢式訪問方法數(shù)據(jù)抽象方法適用于對具有少量重要變量參數(shù)結(jié)構(gòu)化交易數(shù)據(jù)的分析應(yīng)用。但它不適用于非結(jié)構(gòu)化格式的傳統(tǒng)大數(shù)據(jù),這是因為非結(jié)構(gòu)化數(shù)據(jù)的抽象比較難以實現(xiàn)。有些公司在創(chuàng)建電子郵件特定單詞或單詞組合高識別率數(shù)據(jù)庫的應(yīng)用中有過不少成功案例,但是其前提條件是這樣的關(guān)鍵詞/詞組合是可以預先知道的。對于大多數(shù)應(yīng)用來說,還是需要有一個更為通用的方法的。這個方法就是我們所提出的第二個數(shù)據(jù)成本管理策略——分布查詢式數(shù)據(jù)訪問方法。
通常來說,數(shù)據(jù)處理任務(wù)可以分為三個部分:對數(shù)據(jù)的實際處理、用于定位數(shù)據(jù)位置的數(shù)據(jù)庫管理訪問,以及從海量存儲設(shè)備中獲取信息的存儲訪問。如果由于成本原因而無法把大量的信息遷往云,那么也就無法在云中實現(xiàn)信息的逐條訪問。最好的解決方法就是在云以外的某地托管數(shù)據(jù)和查詢邏輯,并發(fā)送數(shù)據(jù)庫管理系統(tǒng)(DBMS)查詢命令以提取數(shù)據(jù)的一個子集,從而實現(xiàn)在云中的數(shù)據(jù)處理。在企業(yè)內(nèi)部確保DBMS引擎功能并只把查詢和結(jié)果遷入/出云能夠顯著地降低數(shù)據(jù)存儲和訪問成本。
針對這類功能劃分對應(yīng)用程序進行結(jié)構(gòu)設(shè)計是相對簡單的,事實上,正有越來越多的廠商提供了包含存儲/查詢功能的DBMS引擎或設(shè)備。但是,構(gòu)建針對應(yīng)用程序的檢查以防止有問題的查詢結(jié)構(gòu)提供所有的數(shù)據(jù)信息是非常必要的措施。在這里,試點測試是不夠的;在交付前,查詢邏輯應(yīng)當測試結(jié)果的大小。
雖然當前有很多人對如何創(chuàng)建混合云非常關(guān)注,但是對未來云中關(guān)鍵任務(wù)應(yīng)用程序來說,創(chuàng)建“混合數(shù)據(jù)”將是更為重要的任務(wù)。如果缺少一種最優(yōu)化使用物美價廉本地存儲資源和高度靈活云計算處理的方法,那么用戶們可能會發(fā)現(xiàn)他們的大型數(shù)據(jù)將迫使他們保持傳統(tǒng)的IT架構(gòu)。
|