新聞中心
當(dāng)前位置:網(wǎng)站首頁(yè) > 新聞中心
云計(jì)算將如何影響數(shù)據(jù)倉(cāng)庫(kù)技術(shù)?
近年來(lái),數(shù)據(jù)生成水平激增,其特點(diǎn)是工業(yè)領(lǐng)域中很多企業(yè)進(jìn)行了巨大的數(shù)字化轉(zhuǎn)型。全球范圍內(nèi)生成的數(shù)據(jù)量正在快速增長(zhǎng)。實(shí)際上,行業(yè)媒體Gigabit Magazine的研究表明,全球2020年生成的數(shù)據(jù)量將比10年前增長(zhǎng)25倍以上。此外,據(jù)估計(jì),到2025年,生成的累積數(shù)據(jù)將增加三倍,達(dá)到近175ZB。目前,業(yè)務(wù)決策者對(duì)實(shí)時(shí)數(shù)據(jù)訪問(wèn)的需求也在以前所未有的速度增長(zhǎng),以便于進(jìn)行明智的業(yè)務(wù)決策。
為了使數(shù)據(jù)對(duì)他們的業(yè)務(wù)有用、可行和可擴(kuò)展,企業(yè)需要一種有效且經(jīng)濟(jì)高效的方式來(lái)存儲(chǔ)、標(biāo)記和解釋這些數(shù)據(jù)。實(shí)現(xiàn)這種目的最有利可圖的方法之一就是采用數(shù)據(jù)倉(cāng)庫(kù)。
這一概念可以追溯到上世紀(jì)70年代,當(dāng)計(jì)算機(jī)科學(xué)家Bill Inmon首次提出“數(shù)據(jù)倉(cāng)庫(kù)”一詞時(shí),就出現(xiàn)了數(shù)據(jù)倉(cāng)庫(kù)市場(chǎng)。早期的數(shù)據(jù)倉(cāng)庫(kù)創(chuàng)建為本地服務(wù)器,其構(gòu)建能力僅為千兆字節(jié)。從那時(shí)起,它們經(jīng)歷了重大的變革,現(xiàn)代化的倉(cāng)庫(kù)可容納更大的容量。
數(shù)據(jù)倉(cāng)庫(kù),也稱(chēng)為決策支持?jǐn)?shù)據(jù)庫(kù),是指一個(gè)中央存儲(chǔ)庫(kù),用于保存從一個(gè)或多個(gè)數(shù)據(jù)源(例如事務(wù)系統(tǒng)和關(guān)系數(shù)據(jù)庫(kù))衍生的信息。系統(tǒng)中收集的數(shù)據(jù)可以采用非結(jié)構(gòu)化、半結(jié)構(gòu)化或結(jié)構(gòu)化數(shù)據(jù)的形式。然后對(duì)這些數(shù)據(jù)進(jìn)行處理、轉(zhuǎn)換和使用,以使用戶(hù)可以更輕松地通過(guò)SQL客戶(hù)端,電子表格和商業(yè)智能工具對(duì)其進(jìn)行訪問(wèn)。
數(shù)據(jù)倉(cāng)庫(kù)還促進(jìn)了更輕松的數(shù)據(jù)挖掘,這是對(duì)數(shù)據(jù)中的模式進(jìn)行標(biāo)識(shí),然后可以用來(lái)推動(dòng)更高的利潤(rùn)和銷(xiāo)售量。數(shù)據(jù)倉(cāng)庫(kù)行業(yè)的應(yīng)用范圍跨越了與分析乃至云計(jì)算相關(guān)的多個(gè)領(lǐng)域,在某些情況下,其中包括醫(yī)療保健、制造業(yè)、電信與IT、零售和政府等。
在技術(shù)領(lǐng)域,有幾家公司在推進(jìn)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)方面取得了長(zhǎng)足的進(jìn)步。最著名的公司之一是Teradata公司,這是一家行業(yè)領(lǐng)先的數(shù)據(jù)倉(cāng)庫(kù)公司,在該領(lǐng)域擁有30多年的經(jīng)驗(yàn)。Teradata軟件被廣泛用于許多行業(yè)的各種數(shù)據(jù)倉(cāng)庫(kù)活動(dòng),尤其是在銀行業(yè)。該公司一直致力于通過(guò)創(chuàng)新的新技術(shù)(包括基于Hadoop的服務(wù))來(lái)增強(qiáng)其商業(yè)智能解決方案。
大數(shù)據(jù)和數(shù)據(jù)倉(cāng)庫(kù)
在現(xiàn)代時(shí)代,大數(shù)據(jù)和數(shù)據(jù)科學(xué)正在極大地顛覆企業(yè)開(kāi)展業(yè)務(wù)以及決策流程的方式??缧袠I(yè)擁有如此大量的數(shù)據(jù),對(duì)高效大數(shù)據(jù)分析的需求變得至關(guān)重要。大數(shù)據(jù)最早是在上世紀(jì)90年代出現(xiàn)的,但是這個(gè)概念可以追溯到術(shù)語(yǔ)創(chuàng)造之前,直到計(jì)算機(jī)時(shí)代的曙光,那時(shí)企業(yè)將使用大型電子表格分析數(shù)字和研究趨勢(shì)。
隨著1990年代末和2000年代初出現(xiàn)新的數(shù)據(jù)源,它們開(kāi)始推動(dòng)了海量數(shù)據(jù)的產(chǎn)生。隨著移動(dòng)設(shè)備和搜索引擎的興起,這種趨勢(shì)尤其激增,搜索引擎比以往任何時(shí)候都可以輸出更多的數(shù)據(jù)。表征大數(shù)據(jù)出現(xiàn)的另一個(gè)因素是速度。數(shù)據(jù)生成速度越快,所需的處理就越多。因此,在2005年,Gartner公司將大數(shù)據(jù)的概念描述為數(shù)據(jù)的3V,也就是數(shù)量,速度和種類(lèi)。
隨著數(shù)據(jù)量持續(xù)快速增長(zhǎng),傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)無(wú)法處理這些數(shù)據(jù)。為了規(guī)避此問(wèn)題并確保更高效的大數(shù)據(jù)分析系統(tǒng),雅虎等公司的工程師于2006年創(chuàng)建了Hadoop,這是一個(gè)Apache開(kāi)放源項(xiàng)目,它具有分布式處理框架,即使在集群平臺(tái)上也可以運(yùn)行大數(shù)據(jù)應(yīng)用程序。
人工智能,機(jī)器學(xué)習(xí)和基于云的解決方案可能會(huì)推動(dòng)數(shù)據(jù)倉(cāng)庫(kù)市場(chǎng)的未來(lái)前景
考慮到現(xiàn)代產(chǎn)生的數(shù)據(jù)量以及處理數(shù)據(jù)所需的高級(jí)基礎(chǔ)設(shè)施,決策支持?jǐn)?shù)據(jù)庫(kù)在技術(shù)和體系結(jié)構(gòu)方面都面臨著巨大的發(fā)展壓力。除了幾種新的數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)方法之外,還出現(xiàn)了許多技術(shù),成為現(xiàn)代商業(yè)智能解決方案的主要貢獻(xiàn)者,從云計(jì)算服務(wù)到數(shù)據(jù)虛擬化再到自動(dòng)化和機(jī)器學(xué)習(xí)等。
基于云計(jì)算的解決方案是數(shù)據(jù)倉(cāng)庫(kù)市場(chǎng)的未來(lái)。隨著眾多企業(yè)轉(zhuǎn)向云平臺(tái)來(lái)支持和存儲(chǔ)其數(shù)據(jù)倉(cāng)庫(kù)解決方案,像亞馬遜和谷歌這樣的互聯(lián)網(wǎng)公司不知疲倦地致力于開(kāi)發(fā)和托管創(chuàng)新的基于云計(jì)算的數(shù)據(jù)倉(cāng)庫(kù)。
未來(lái)幾年將推動(dòng)數(shù)據(jù)倉(cāng)庫(kù)行業(yè)前景的另一趨勢(shì)是機(jī)器學(xué)習(xí)和人工智能支持。新的數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)將成為人工智能數(shù)據(jù)集的基礎(chǔ),而人工智能和機(jī)器學(xué)習(xí)將改善這些商業(yè)智能解決方案的功能和運(yùn)營(yíng)。這種趨勢(shì)的一個(gè)例子是谷歌將機(jī)器學(xué)習(xí)整合到BigQuery數(shù)據(jù)倉(cāng)庫(kù)中。
|