新聞中心
當(dāng)前位置:網(wǎng)站首頁 > 新聞中心
一步一圖,帶你了解分布式架構(gòu)的前世今生
什么是分布式架構(gòu)?分布式架構(gòu)的演進(jìn)
分布式服務(wù)面臨的問題
什么是分布式架構(gòu)?分布式系統(tǒng)(distributed system)是建立在網(wǎng)絡(luò)之上的軟件系統(tǒng),它有兩個(gè)典型特點(diǎn):內(nèi)聚性:每個(gè)數(shù)據(jù)庫分布節(jié)點(diǎn)高度自治,有本地的數(shù)據(jù)庫管理系統(tǒng)
透明性:每個(gè)數(shù)據(jù)庫分布節(jié)點(diǎn)對(duì)用戶的應(yīng)用來說都是透明的,看不出是本地還是遠(yuǎn)程。也就是說,在分布式系統(tǒng)中,用戶感覺不到數(shù)據(jù)是分布式的,不知道數(shù)據(jù)是否分割,有無副本,不知道數(shù)據(jù)存在于哪個(gè)節(jié)點(diǎn)上。
簡(jiǎn)單來說:一個(gè)分布式系統(tǒng)中,一組獨(dú)立的計(jì)算機(jī)展現(xiàn)給用戶的是一個(gè)統(tǒng)一的整體,就好像是一個(gè)系統(tǒng)似的。
如上圖所示,分布式系統(tǒng)作為一個(gè)整體對(duì)用戶提供服務(wù),而整個(gè)系統(tǒng)的內(nèi)部的協(xié)作對(duì)用戶來說是透明的,用戶就像是指使用一個(gè)mysql 一樣。
分布式架構(gòu)的演進(jìn)
(1)初始階段架構(gòu)
特征:應(yīng)用程序,數(shù)據(jù)庫,文件等所有資源都放在一臺(tái)服務(wù)器上。
(2)應(yīng)用服務(wù)、數(shù)據(jù)服務(wù)、文件服務(wù)分離
說明:好景不長,隨著系統(tǒng)訪問量的再度增加,webserver機(jī)器的壓力在高峰期會(huì)上升到比較高,這個(gè)時(shí)候開始考慮增加一臺(tái)webserver。
特征:應(yīng)用程序、數(shù)據(jù)庫、文件分別部署在獨(dú)立的資源上。
(3)使用緩存改善性能
說明:系統(tǒng)訪問特點(diǎn)遵循二八定律,即80%的業(yè)務(wù)訪問集中在20%的數(shù)據(jù)上。
緩存分為本地緩存和遠(yuǎn)程分布式緩存,本地緩存訪問速度更快但緩存數(shù)據(jù)量有限,同時(shí)存在與應(yīng)用程序爭(zhēng)用內(nèi)存的情況。
特征:數(shù)據(jù)庫中訪問較集中的一小部分?jǐn)?shù)據(jù)存儲(chǔ)在緩存服務(wù)器中,減少數(shù)據(jù)庫的訪問次數(shù),降低數(shù)據(jù)庫的訪問壓力。
(4)使用“應(yīng)用服務(wù)器”集群
說明:在做完分庫分表這些工作后,數(shù)據(jù)庫上的壓力已經(jīng)降到比較低了,又開始過著每天看著訪問量暴增的幸福生活了。
突然有一天,發(fā)現(xiàn)系統(tǒng)的訪問又開始有變慢的趨勢(shì)了,這個(gè)時(shí)候首先查看數(shù)據(jù)庫,壓力一切正常,之后查看webserver,發(fā)現(xiàn)apache阻塞了很多的請(qǐng)求,
而應(yīng)用服務(wù)器對(duì)每個(gè)請(qǐng)求也是比較快的,看來是請(qǐng)求數(shù)太高導(dǎo)致需要排隊(duì)等待,響應(yīng)速度變慢。
特征:多臺(tái)服務(wù)器通過負(fù)載均衡同時(shí)向外部提供服務(wù),解決單臺(tái)服務(wù)器處理能力和存儲(chǔ)空間上限的問題。
描述:使用集群是系統(tǒng)解決高并發(fā)、海量數(shù)據(jù)問題的常用手段。通過向集群中追加資源,提升系統(tǒng)的并發(fā)處理能力,使得服務(wù)器的負(fù)載壓力不再成為整個(gè)系統(tǒng)的瓶頸。
(5)數(shù)據(jù)庫讀寫分離
說明:享受了一段時(shí)間的系統(tǒng)訪問量高速增長的幸福后,發(fā)現(xiàn)系統(tǒng)又開始變慢了,這次又是什么狀況呢?
經(jīng)過查找,發(fā)現(xiàn)數(shù)據(jù)庫寫入、更新的這些操作的部分?jǐn)?shù)據(jù)庫連接的資源競(jìng)爭(zhēng)非常激烈,導(dǎo)致了系統(tǒng)變慢
特征:多臺(tái)服務(wù)器通過負(fù)載均衡同時(shí)向外部提供服務(wù),解決單臺(tái)服務(wù)器處理能力和存儲(chǔ)空間上限的問題。
描述:使用集群是系統(tǒng)解決高并發(fā)、海量數(shù)據(jù)問題的常用手段。通過向集群中追加資源,使得服務(wù)器的負(fù)載壓力不在成為整個(gè)系統(tǒng)的瓶頸。
(6)反向代理和CDN加速
特征:采用CDN和反向代理加快系統(tǒng)的訪問速度。
描述:為了應(yīng)付復(fù)雜的網(wǎng)絡(luò)環(huán)境和不同地區(qū)用戶的訪問,通過CDN和反向代理加快用戶訪問的速度,同時(shí)減輕后端服務(wù)器的負(fù)載壓力。CDN與反向代理的基本原理都是緩存。
(7)“分布式文件”系統(tǒng) 和 “分布式數(shù)據(jù)庫”
說明:隨著系統(tǒng)的不斷運(yùn)行,數(shù)據(jù)量開始大幅度增長,這個(gè)時(shí)候發(fā)現(xiàn)分庫后查詢?nèi)匀粫?huì)有些慢,于是按照分庫的思想開始做分表的工作
特征:數(shù)據(jù)庫采用分布式數(shù)據(jù)庫,文件系統(tǒng)采用分布式文件系統(tǒng)。
描述:任何強(qiáng)大的單一服務(wù)器都滿足不了大型系統(tǒng)持續(xù)增長的業(yè)務(wù)需求,數(shù)據(jù)庫讀寫分離隨著業(yè)務(wù)的發(fā)展最終也將無法滿足需求,需要使用分布式數(shù)據(jù)庫及分布式文件系統(tǒng)來支撐。
分布式數(shù)據(jù)庫是系統(tǒng)數(shù)據(jù)庫拆分的最后方法,只有在單表數(shù)據(jù)規(guī)模非常龐大的時(shí)候才使用,更常用的數(shù)據(jù)庫拆分手段是業(yè)務(wù)分庫,將不同的業(yè)務(wù)數(shù)據(jù)庫部署在不同的物理服務(wù)器上。
(8)使用NoSQL和搜索引擎
特征:系統(tǒng)引入NoSQL數(shù)據(jù)庫及搜索引擎。
描述:隨著業(yè)務(wù)越來越復(fù)雜,對(duì)數(shù)據(jù)存儲(chǔ)和檢索的需求也越來越復(fù)雜,系統(tǒng)需要采用一些非關(guān)系型數(shù)據(jù)庫如NoSQL和分?jǐn)?shù)據(jù)庫查詢技術(shù)如搜索引擎。
應(yīng)用服務(wù)器通過統(tǒng)一數(shù)據(jù)訪問模塊訪問各種數(shù)據(jù),減輕應(yīng)用程序管理諸多數(shù)據(jù)源的麻煩。
(9)業(yè)務(wù)拆分
特征:系統(tǒng)上按照業(yè)務(wù)進(jìn)行拆分改造,應(yīng)用服務(wù)器按照業(yè)務(wù)區(qū)分進(jìn)行分別部署。
描述:為了應(yīng)對(duì)日益復(fù)雜的業(yè)務(wù)場(chǎng)景,通常使用分而治之的手段將整個(gè)系統(tǒng)業(yè)務(wù)分成不同的產(chǎn)品線,應(yīng)用之間通過超鏈接建立關(guān)系,也可以通過消息隊(duì)列進(jìn)行數(shù)據(jù)分發(fā),
當(dāng)然更多的還是通過訪問同一個(gè)數(shù)據(jù)存儲(chǔ)系統(tǒng)來構(gòu)成一個(gè)關(guān)聯(lián)的完整系統(tǒng)。
縱向拆分:將一個(gè)大應(yīng)用拆分為多個(gè)小應(yīng)用,如果新業(yè)務(wù)較為獨(dú)立,那么就直接將其設(shè)計(jì)部署為一個(gè)獨(dú)立的Web應(yīng)用系統(tǒng)
縱向拆分相對(duì)較為簡(jiǎn)單,通過梳理業(yè)務(wù),將較少相關(guān)的業(yè)務(wù)剝離即可。
橫向拆分:將復(fù)用的業(yè)務(wù)拆分出來,獨(dú)立部署為分布式服務(wù),新增業(yè)務(wù)只需要調(diào)用這些分布式服務(wù)
橫向拆分需要識(shí)別可復(fù)用的業(yè)務(wù),設(shè)計(jì)服務(wù)接口,規(guī)范服務(wù)依賴關(guān)系。
(10)分布式服務(wù)
特征:公共的應(yīng)用模塊被提取出來,部署在分布式服務(wù)器上供應(yīng)用服務(wù)器調(diào)用。
描述:隨著業(yè)務(wù)越拆越小,應(yīng)用系統(tǒng)整體復(fù)雜程度呈指數(shù)級(jí)上升,由于所有應(yīng)用要和所有數(shù)據(jù)庫系統(tǒng)連接,最終導(dǎo)致數(shù)據(jù)庫連接資源不足,拒絕服務(wù)。
分布式服務(wù)面臨哪些問題?當(dāng)服務(wù)越來越多時(shí),服務(wù)URL配置管理變得非常困難,F(xiàn)5硬件負(fù)載均衡器的單點(diǎn)壓力也越來越大。
當(dāng)進(jìn)一步發(fā)展,服務(wù)間依賴關(guān)系變得錯(cuò)蹤復(fù)雜,甚至分不清哪個(gè)應(yīng)用要在哪個(gè)應(yīng)用之前啟動(dòng),架構(gòu)師都不能完整的描述應(yīng)用的架構(gòu)關(guān)系。
接著,服務(wù)的調(diào)用量越來越大,服務(wù)的容量問題就暴露出來,這個(gè)服務(wù)需要多少機(jī)器支撐?什么時(shí)候該加機(jī)器?
服務(wù)多了,溝通成本也開始上升,調(diào)某個(gè)服務(wù)失敗該找誰?服務(wù)的參數(shù)都有什么約定?
一個(gè)服務(wù)有多個(gè)業(yè)務(wù)消費(fèi)者,如何確保服務(wù)質(zhì)量?
隨著服務(wù)的不停升級(jí),總有些意想不到的事發(fā)生,比如cache寫錯(cuò)了導(dǎo)致內(nèi)存溢出,故障不可避免,每次核心服務(wù)一掛,影響一大片,人心慌慌,如何控制故障的影響面?服務(wù)是否可以功能降級(jí)?或者資源劣化?
|