新聞中心
當(dāng)前位置:網(wǎng)站首頁 > 新聞中心
7大云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)
優(yōu)秀云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)展示了近年來云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)市場(chǎng)發(fā)展的特性,因?yàn)楹芏嗥髽I(yè)更多地采用云計(jì)算,并減少了自己的物理數(shù)據(jù)中心足跡。圖片來源:千庫(kù)網(wǎng)
云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)是一項(xiàng)收集、組織和經(jīng)常存儲(chǔ)供組織用于不同活動(dòng)(包括數(shù)據(jù)分析和監(jiān)視)數(shù)據(jù)的服務(wù)。
在企業(yè)使用云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)時(shí),物理硬件方面全部由云計(jì)算供應(yīng)商負(fù)責(zé)。對(duì)于只看到大量等待數(shù)據(jù)并可供處理的大型倉(cāng)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)的最終用戶來說,它們是抽象的。近年來,隨著越來越多的企業(yè)開始利用云計(jì)算的優(yōu)勢(shì),并減少物理數(shù)據(jù)中心,云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)的市場(chǎng)不斷增長(zhǎng)。
云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)通常包括一個(gè)或多個(gè)指向數(shù)據(jù)庫(kù)集合的指針,在這些集合中收集生產(chǎn)數(shù)據(jù)。云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)的第二個(gè)核心元素是某種形式的集成查詢引擎,使用戶能夠搜索和分析數(shù)據(jù)。這有助于數(shù)據(jù)挖掘。
如何選擇云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)服務(wù)
在尋求選擇云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)服務(wù)時(shí),企業(yè)應(yīng)考慮許多標(biāo)準(zhǔn)。
現(xiàn)有的云部署。每個(gè)主要的公共云提供商都擁有自己的數(shù)據(jù)倉(cāng)庫(kù),該倉(cāng)庫(kù)提供與現(xiàn)有資源的集成,這可以使云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)用戶更輕松地進(jìn)行部署和使用。
遷移數(shù)據(jù)的能力??紤]組織擁有的不同類型的數(shù)據(jù)及其存儲(chǔ)位置,有效地將數(shù)據(jù)遷移到新數(shù)據(jù)倉(cāng)庫(kù)中的能力至關(guān)重要。
存儲(chǔ)選項(xiàng)。雖然數(shù)據(jù)倉(cāng)庫(kù)解決方案可以用于存儲(chǔ)數(shù)據(jù),但能夠訪問商品化的云存儲(chǔ)服務(wù),可以提供更低的成本選擇。
在行業(yè)媒體Datamation列出的優(yōu)秀公司列表中,重點(diǎn)介紹了可以提供優(yōu)秀云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)服務(wù)的供應(yīng)商:
(1)Amazon Redshift
潛在買家的價(jià)值主張。隨著亞馬遜公司進(jìn)入云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)市場(chǎng),對(duì)于那些已經(jīng)在AWS工具和部署方面進(jìn)行投資的組織來說,Redshift是一個(gè)理想的解決方案。
關(guān)鍵價(jià)值/差異:Redshift的主要區(qū)別在于,憑借其Spe ctrum功能,組織可以直接與AWS S3云數(shù)據(jù)存儲(chǔ)服務(wù)中的數(shù)據(jù)存儲(chǔ)連接,從而減少了啟動(dòng)所需的時(shí)間和成本。
用戶強(qiáng)調(diào)的優(yōu)勢(shì)之一是Redshift的性能,它得益于AWS基礎(chǔ)設(shè)施和大型并行處理數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)的分布查詢和數(shù)據(jù)分析。
對(duì)于S3或現(xiàn)有數(shù)據(jù)湖之外的數(shù)據(jù),Redshift可以與AWS Glue集成,AWS Glue是一種提取、轉(zhuǎn)換、加載(ETL)工具,可將數(shù)據(jù)導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)。
數(shù)據(jù)倉(cāng)庫(kù)的存儲(chǔ)和操作通過AWS網(wǎng)絡(luò)隔離策略和工具(包括虛擬私有云(VPC))進(jìn)行保護(hù)。(2)Google BigQuery
潛在買家的價(jià)值主張。對(duì)于希望使用標(biāo)準(zhǔn)SQL查詢來分析云中的大型數(shù)據(jù)集的用戶而言,BigQuery是一個(gè)合理的選擇。
關(guān)鍵價(jià)值/差異:作為完全托管的云計(jì)算服務(wù),數(shù)據(jù)倉(cāng)庫(kù)的設(shè)置和資源供應(yīng)均由谷歌公司使用無服務(wù)器技術(shù)來處理。
通過SQL或通過開放數(shù)據(jù)庫(kù)連接(ODBC)輕松查詢數(shù)據(jù)的能力是BigQuery的關(guān)鍵價(jià)值,它使用戶能夠使用現(xiàn)有的工具和技能。
BigQuery中的邏輯數(shù)據(jù)倉(cāng)庫(kù)功能使用戶可以與其他數(shù)據(jù)源(包括數(shù)據(jù)庫(kù)甚至電子表格)連接以分析數(shù)據(jù)。
與BigQuery ML的集成是一個(gè)關(guān)鍵的區(qū)別因素,它將數(shù)據(jù)倉(cāng)庫(kù)和機(jī)器學(xué)習(xí)(ML)的世界融合在一起。使用BigQuery ML,可以在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)上訓(xùn)練機(jī)器學(xué)習(xí)工作負(fù)載。(3)IBM Db2 Warehouse
潛在買家的價(jià)值主張。對(duì)于處理分析工作負(fù)載的組織來說,IBM Db2 Warehouse是一個(gè)很好的選擇,它可以從平臺(tái)的集成內(nèi)存數(shù)據(jù)庫(kù)引擎和Apache Spark分析引擎中獲益。
關(guān)鍵價(jià)值/差異:集成了Db2內(nèi)存中的列式數(shù)據(jù)庫(kù)引擎,對(duì)于正在尋找包含高性能數(shù)據(jù)庫(kù)的數(shù)據(jù)倉(cāng)庫(kù)的組織而言,這可能是一個(gè)很大的好處。
Apache Spark引擎也與Db2集成在一起,這意味著用戶可以針對(duì)數(shù)據(jù)倉(cāng)庫(kù)使用SQL查詢和Spark查詢,以獲取見解。
Db2 Warehouse受益于IBM的Netezza技術(shù)以及高級(jí)數(shù)據(jù)查找功能。
可以在IBM云平臺(tái)或AWS云平臺(tái)中完成云部署,并且還有本地版本的Db2 Warehouse,這對(duì)于具有混合云部署需求的組織很有用。(4)Microsoft Azure SQL Data Warehouse
潛在買家的價(jià)值主張。Microsoft Azure SQL數(shù)據(jù)倉(cāng)庫(kù)非常適合任何規(guī)模的組織,這要?dú)w功于與Microsoft SQL Server的集成,希望可以輕松地將基于云計(jì)算的數(shù)據(jù)倉(cāng)庫(kù)技術(shù)引入。
關(guān)鍵價(jià)值/差異:微軟公司在2019年7月發(fā)布了Azure SQL數(shù)據(jù)倉(cāng)庫(kù)的主要更新,其中包括Gen2更新,提供了更多的SQL Server功能和高級(jí)安全選項(xiàng)。
動(dòng)態(tài)數(shù)據(jù)屏蔽(DDM)提供了非常精細(xì)的安全控制級(jí)別,使敏感數(shù)據(jù)可以在進(jìn)行查詢時(shí)即時(shí)隱藏。
現(xiàn)有的微軟用戶可能會(huì)從Azure SQL數(shù)據(jù)倉(cāng)庫(kù)中獲得最大的收益,因?yàn)樗鏜icrosoft Azure公共云以及更重要的是用于數(shù)據(jù)庫(kù)的SQL Server具有多種集成。
與僅在本地運(yùn)行SQL Server相比,微軟建立在龐大的并行處理體系結(jié)構(gòu)上,該體系結(jié)構(gòu)可使用戶同時(shí)運(yùn)行一百多個(gè)并發(fā)查詢。(5)Oracle Autonomous Data Warehouse
潛在買家的價(jià)值主張。對(duì)于Oracle數(shù)據(jù)庫(kù)的現(xiàn)有用戶而言,Oracle自主數(shù)據(jù)倉(cāng)庫(kù)可能是最簡(jiǎn)單的選擇,它提供了一個(gè)連接到云端的入口。
關(guān)鍵價(jià)值/差異:Oracle的主要區(qū)別在于,它在優(yōu)化的云計(jì)算服務(wù)中運(yùn)行自主數(shù)據(jù)倉(cāng)庫(kù),該服務(wù)運(yùn)行Oracle的Exadata硬件系統(tǒng),該系統(tǒng)專門針對(duì)Oracle數(shù)據(jù)庫(kù)而構(gòu)建。
該服務(wù)集成了基于Web的筆記本和報(bào)告服務(wù),以共享數(shù)據(jù)分析并實(shí)現(xiàn)輕松的協(xié)作。
雖然支持Oracle自己的同名數(shù)據(jù)庫(kù),但用戶還可以從其他數(shù)據(jù)庫(kù)和云平臺(tái)(包括Amazon Redshift)以及本地對(duì)象數(shù)據(jù)存儲(chǔ)中遷移數(shù)據(jù)。
Oracle的SQL Developer功能是另一個(gè)關(guān)鍵功能,它集成了數(shù)據(jù)加載向?qū)Ш蛿?shù)據(jù)庫(kù)開發(fā)環(huán)境。(6)SAP Data Warehouse Cloud
潛在買家的價(jià)值主張。SAP Data Warehouse Cloud可能非常適合那些希望通過預(yù)先構(gòu)建的模板尋求更多交鑰匙方法來充分利用數(shù)據(jù)倉(cāng)庫(kù)的組織。
關(guān)鍵價(jià)值/差異:SAP Data Warehouse Cloud是該領(lǐng)域相對(duì)較新的參與者,它是在5月的2019 SAPPHIRE NOW會(huì)議上首次發(fā)布的。
SAP的HANA云服務(wù)和數(shù)據(jù)庫(kù)是數(shù)據(jù)倉(cāng)庫(kù)云的核心,輔以數(shù)據(jù)治理的優(yōu)秀幫助解決特定行業(yè)和業(yè)務(wù)線的通用數(shù)據(jù)倉(cāng)庫(kù)和分析用例。
對(duì)于現(xiàn)有的SAP用戶,與其他SAP應(yīng)用程序的集成意味著可以更輕松地訪問本地以及云計(jì)算數(shù)據(jù)集。(7)Snowflake
對(duì)潛在買家的價(jià)值主張。對(duì)于需要為數(shù)據(jù)倉(cāng)庫(kù)功能選擇不同的公共云提供商的任何行業(yè)的組織而言,Snowflake是一個(gè)很好的選擇。
關(guān)鍵價(jià)值/差異:關(guān)鍵區(qū)別在于Snowflake的列式數(shù)據(jù)庫(kù)引擎功能,該功能可以處理JSON和XML等結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。
解耦的Snowflake架構(gòu)允許計(jì)算和存儲(chǔ)分別擴(kuò)展,并在用戶選擇的云提供商上提供數(shù)據(jù)存儲(chǔ)。
系統(tǒng)創(chuàng)建Snowflake所謂的虛擬數(shù)據(jù)倉(cāng)庫(kù),其中不同的工作負(fù)載共享相同的數(shù)據(jù),但可以獨(dú)立運(yùn)行。
通過標(biāo)準(zhǔn)SQL進(jìn)行查詢,以進(jìn)行分析,并與R和Python編程語言集成。7個(gè)優(yōu)秀云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)對(duì)比圖表
|