新聞中心
當(dāng)前位置:網(wǎng)站首頁 > 新聞中心
負(fù)載均衡很難?看完這篇就懂了
互聯(lián)網(wǎng)早期,業(yè)務(wù)流量比較小并且業(yè)務(wù)邏輯比較簡單,單臺服務(wù)器便可以滿足基本的需求;但隨著互聯(lián)網(wǎng)的發(fā)展,業(yè)務(wù)流量越來越大并且業(yè)務(wù)邏輯也越來越復(fù)雜,單臺機(jī)器的性能問題以及單點(diǎn)問題凸顯了出來,因此需要多臺機(jī)器來進(jìn)行性能的水平擴(kuò)展以及避免單點(diǎn)故障。但是要如何將不同的用戶的流量分發(fā)到不同的服務(wù)器上面呢?早期的方法是使用DNS做負(fù)載,通過給客戶端解析不同的IP地址,讓客戶端的流量直接到達(dá)各個服務(wù)器。但是這種方法有一個很大的缺點(diǎn)就是延時性問題,在做出調(diào)度策略改變以后,由于DNS各級節(jié)點(diǎn)的緩存并不會及時的在客戶端生效,而且DNS負(fù)載的調(diào)度策略比較簡單,無法滿足業(yè)務(wù)需求,因此就出現(xiàn)了負(fù)載均衡??蛻舳说牧髁渴紫葧竭_(dá)負(fù)載均衡服務(wù)器,由負(fù)載均衡服務(wù)器通過一定的調(diào)度算法將流量分發(fā)到不同的應(yīng)用服務(wù)器上面,同時負(fù)載均衡服務(wù)器也會對應(yīng)用服務(wù)器做周期性的健康檢查,當(dāng)發(fā)現(xiàn)故障節(jié)點(diǎn)時便動態(tài)的將節(jié)點(diǎn)從應(yīng)用服務(wù)器集群中剔除,以此來保證應(yīng)用的高可用。負(fù)載均衡又分為四層負(fù)載均衡和七層負(fù)載均衡。四層負(fù)載均衡工作在OSI模型的傳輸層,主要工作是轉(zhuǎn)發(fā),它在接收到客戶端的流量以后通過修改數(shù)據(jù)包的地址信息將流量轉(zhuǎn)發(fā)到應(yīng)用服務(wù)器。
七層負(fù)載均衡工作在OSI模型的應(yīng)用層,因為它需要解析應(yīng)用層流量,所以七層負(fù)載均衡在接到客戶端的流量以后,還需要一個完整的TCP/IP協(xié)議棧。七層負(fù)載均衡會與客戶端建立一條完整的連接并將應(yīng)用層的請求流量解析出來,再按照調(diào)度算法選擇一個應(yīng)用服務(wù)器,并與應(yīng)用服務(wù)器建立另外一條連接將請求發(fā)送過去,因此七層負(fù)載均衡的主要工作就是代理。
二、四層和七層負(fù)載均衡的區(qū)別?
2.1 技術(shù)原理上的區(qū)別。
所謂四層負(fù)載均衡,也就是主要通過報文中的目標(biāo)地址和端口,再加上負(fù)載均衡設(shè)備設(shè)置的服務(wù)器選擇方式,決定最終選擇的內(nèi)部服務(wù)器。
以常見的TCP為例,負(fù)載均衡設(shè)備在接收到第一個來自客戶端的SYN 請求時,即通過上述方式選擇一個最佳的服務(wù)器,并對報文中目標(biāo)IP地址進(jìn)行修改(改為后端服務(wù)器IP),直接轉(zhuǎn)發(fā)給該服務(wù)器。TCP的連接建立,即三次握手是客戶端和服務(wù)器直接建立的,負(fù)載均衡設(shè)備只是起到一個類似路由器的轉(zhuǎn)發(fā)動作。在某些部署情況下,為保證服務(wù)器回包可以正確返回給負(fù)載均衡設(shè)備,在轉(zhuǎn)發(fā)報文的同時可能還會對報文原來的源地址進(jìn)行修改。所謂七層負(fù)載均衡,也稱為“內(nèi)容交換”,也就是主要通過報文中的真正有意義的應(yīng)用層內(nèi)容,再加上負(fù)載均衡設(shè)備設(shè)置的服務(wù)器選擇方式,決定最終選擇的內(nèi)部服務(wù)器。
以常見的TCP為例,負(fù)載均衡設(shè)備如果要根據(jù)真正的應(yīng)用層內(nèi)容再選擇服務(wù)器,只能先代理最終的服務(wù)器和客戶端建立連接(三次握手)后,才可能接受到客戶端發(fā)送的真正應(yīng)用層內(nèi)容的報文,然后再根據(jù)該報文中的特定字段,再加上負(fù)載均衡設(shè)備設(shè)置的服務(wù)器選擇方式,決定最終選擇的內(nèi)部服務(wù)器。
負(fù)載均衡設(shè)備在這種情況下,更類似于一個代理服務(wù)器。負(fù)載均衡和前端的客戶端以及后端的服務(wù)器會分別建立TCP連接。所以從這個技術(shù)原理上來看,七層負(fù)載均衡明顯的對負(fù)載均衡設(shè)備的要求更高,處理七層的能力也必然會低于四層模式的部署方式。那么,為什么還需要七層負(fù)載均衡呢?
2.2 應(yīng)用場景的需求。
七層應(yīng)用負(fù)載的好處,是使得整個網(wǎng)絡(luò)更智能化, 參考我們之前的另外一篇專門針對HTTP應(yīng)用的優(yōu)化的介紹,就可以基本上了解這種方式的優(yōu)勢所在。例如訪問一個網(wǎng)站的用戶流量,可以通過七層的方式,將對圖片類的請求轉(zhuǎn)發(fā)到特定的圖片服務(wù)器并可以使用緩存技術(shù);將對文字類的請求可以轉(zhuǎn)發(fā)到特定的文字服務(wù)器并可以使用壓縮技術(shù)。
當(dāng)然這只是七層應(yīng)用的一個小案例,從技術(shù)原理上,這種方式可以對客戶端的請求和服務(wù)器的響應(yīng)進(jìn)行任意意義上的修改,極大的提升了應(yīng)用系統(tǒng)在網(wǎng)絡(luò)層的靈活性。很多在后臺,(例如Nginx或者Apache)上部署的功能可以前移到負(fù)載均衡設(shè)備上,例如客戶請求中的Header重寫,服務(wù)器響應(yīng)中的關(guān)鍵字過濾或者內(nèi)容插入等功能。
另外一個常常被提到功能就是安全性。網(wǎng)絡(luò)中最常見的SYN Flood攻擊,即黑客控制眾多源客戶端,使用虛假IP地址對同一目標(biāo)發(fā)送SYN攻擊,通常這種攻擊會大量發(fā)送SYN報文,耗盡服務(wù)器上的相關(guān)資源,以達(dá)到Denial of Service(DoS)的目的。
從技術(shù)原理上也可以看出,四層模式下這些SYN攻擊都會被轉(zhuǎn)發(fā)到后端的服務(wù)器上;而七層模式下這些SYN攻擊自然在負(fù)載均衡設(shè)備上就截止,不會影響后臺服務(wù)器的正常運(yùn)營。另外負(fù)載均衡設(shè)備可以在七層層面設(shè)定多種策略,過濾特定報文,例如SQLInjection等應(yīng)用層面的特定攻擊手段,從應(yīng)用層面進(jìn)一步提高系統(tǒng)整體安全。
現(xiàn)在的7層負(fù)載均衡,主要還是著重于應(yīng)用廣泛的HTTP協(xié)議,所以其應(yīng)用范圍主要是眾多的網(wǎng)站或者內(nèi)部信息平臺等基于B/S開發(fā)的系統(tǒng)。 4層負(fù)載均衡則對應(yīng)其他TCP應(yīng)用,例如基于C/S開發(fā)的ERP等系統(tǒng)。
2.3 七層應(yīng)用需要考慮的問題。
是否真的必要,七層應(yīng)用的確可以提高流量智能化,同時必不可免的帶來設(shè)備配置復(fù)雜,負(fù)載均衡壓力增高以及故障排查上的復(fù)雜性等問題。在設(shè)計系統(tǒng)時需要考慮四層七層同時應(yīng)用的混雜情況。
是否真的可以提高安全性。例如SYN Flood攻擊,七層模式的確將這些流量從服務(wù)器屏蔽,但負(fù)載均衡設(shè)備本身要有強(qiáng)大的抗DDoS能力,否則即使服務(wù)器正常而作為中樞調(diào)度的負(fù)載均衡設(shè)備故障也會導(dǎo)致整個應(yīng)用的崩潰。
是否有足夠的靈活度。七層應(yīng)用的優(yōu)勢是可以讓整個應(yīng)用的流量智能化,但是負(fù)載均衡設(shè)備需要提供完善的七層功能,滿足客戶根據(jù)不同情況的基于應(yīng)用的調(diào)度。最簡單的一個考核就是能否取代后臺Nginx或者Apache等服務(wù)器上的調(diào)度功能。能夠提供一個七層應(yīng)用開發(fā)接口的負(fù)載均衡設(shè)備,可以讓客戶根據(jù)需求任意設(shè)定功能,才真正有可能提供強(qiáng)大的靈活性和智能性。
三、負(fù)載均衡的算法?
1. 隨機(jī)算法
Random隨機(jī),按權(quán)重設(shè)置隨機(jī)概率。在一個截面上碰撞的概率高,但調(diào)用量越大分布越均勻,而且按概率使用權(quán)重后也比較均勻,有利于動態(tài)調(diào)整提供者權(quán)重。
2. 輪詢及加權(quán)輪詢
輪詢(Round Robbin)當(dāng)服務(wù)器群中各服務(wù)器的處理能力相同時,且每筆業(yè)務(wù)處理量差異不大時,最適合使用這種算法。 輪循,按公約后的權(quán)重設(shè)置輪循比率。存在慢的提供者累積請求問題,比如:第二臺機(jī)器很慢,但沒掛,當(dāng)請求調(diào)到第二臺時就卡在那,久而久之,所有請求都卡在調(diào)到第二臺上。
加權(quán)輪詢(Weighted Round Robbin)為輪詢中的每臺服務(wù)器附加一定權(quán)重的算法。比如服務(wù)器1權(quán)重1,服務(wù)器2權(quán)重2,服務(wù)器3權(quán)重3,則順序為1-2-2-3-3-3-1-2-2-3-3-3-
3. 最小連接及加權(quán)最小連接
最少連接(Least Connections)在多個服務(wù)器中,與處理連接數(shù)(會話數(shù))最少的服務(wù)器進(jìn)行通信的算法。即使在每臺服務(wù)器處理能力各不相同,每筆業(yè)務(wù)處理量也不相同的情況下,也能夠在一定程度上降低服務(wù)器的負(fù)載。
加權(quán)最少連接(Weighted Least Connection)為最少連接算法中的每臺服務(wù)器附加權(quán)重的算法,該算法事先為每臺服務(wù)器分配處理連接的數(shù)量,并將客戶端請求轉(zhuǎn)至連接數(shù)最少的服務(wù)器上。
4. 哈希算法
普通哈希
一致性哈希一致性Hash,相同參數(shù)的請求總是發(fā)到同一提供者。當(dāng)某一臺提供者掛時,原本發(fā)往該提供者的請求,基于虛擬節(jié)點(diǎn),平攤到其它提供者,不會引起劇烈變動。
5. IP地址散列
通過管理發(fā)送方IP和目的地IP地址的散列,將來自同一發(fā)送方的分組(或發(fā)送至同一目的地的分組)統(tǒng)一轉(zhuǎn)發(fā)到相同服務(wù)器的算法。當(dāng)客戶端有一系列業(yè)務(wù)需要處理而必須和一個服務(wù)器反復(fù)通信時,該算法能夠以流(會話)為單位,保證來自相同客戶端的通信能夠一直在同一服務(wù)器中進(jìn)行處理。
6.URL散列
通過管理客戶端請求URL信息的散列,將發(fā)送至相同URL的請求轉(zhuǎn)發(fā)至同一服務(wù)器的算法。
四、負(fù)載均衡的實(shí)現(xiàn)
(DNS 數(shù)據(jù)鏈路層 IP層 Http層)?
1 DNS域名解析負(fù)載均衡(延遲)2 數(shù)據(jù)鏈路層負(fù)載均衡(LVS)
數(shù)據(jù)鏈路層負(fù)載均衡是指在通信協(xié)議的數(shù)據(jù)鏈路層修改mac地址進(jìn)行負(fù)載均衡。
這種數(shù)據(jù)傳輸方式又稱作三角傳輸模式,負(fù)載均衡數(shù)據(jù)分發(fā)過程中不修改IP地址,只修改目的的mac地址,通過配置真實(shí)物理服務(wù)器集群所有機(jī)器虛擬IP和負(fù)載均衡服務(wù)器IP地址一樣,從而達(dá)到負(fù)載均衡,這種負(fù)載均衡方式又稱為直接路由方式(DR).
在上圖中,用戶請求到達(dá)負(fù)載均衡服務(wù)器后,負(fù)載均衡服務(wù)器將請求數(shù)據(jù)的目的mac地址修改為真是WEB服務(wù)器的mac地址,并不修改數(shù)據(jù)包目標(biāo)IP地址,因此數(shù)據(jù)可以正常到達(dá)目標(biāo)WEB服務(wù)器,該服務(wù)器在處理完數(shù)據(jù)后可以經(jīng)過網(wǎng)管服務(wù)器而不是負(fù)載均衡服務(wù)器直接到達(dá)用戶瀏覽器。
使用三角傳輸模式的鏈路層負(fù)載均衡是目前大型網(wǎng)站所使用的最廣的一種負(fù)載均衡手段。在linux平臺上最好的鏈路層負(fù)載均衡開源產(chǎn)品是LVS(linux virtual server)。
3 IP負(fù)載均衡(SNAT)
IP負(fù)載均衡:即在網(wǎng)絡(luò)層通過修改請求目標(biāo)地址進(jìn)行負(fù)載均衡。
用戶請求數(shù)據(jù)包到達(dá)負(fù)載均衡服務(wù)器后,負(fù)載均衡服務(wù)器在操作系統(tǒng)內(nèi)核進(jìn)行獲取網(wǎng)絡(luò)數(shù)據(jù)包,根據(jù)負(fù)載均衡算法計算得到一臺真實(shí)的WEB服務(wù)器地址,然后將數(shù)據(jù)包的IP地址修改為真實(shí)的WEB服務(wù)器地址,不需要通過用戶進(jìn)程處理。真實(shí)的WEB服務(wù)器處理完畢后,相應(yīng)數(shù)據(jù)包回到負(fù)載均衡服務(wù)器,負(fù)載均衡服務(wù)器再將數(shù)據(jù)包源地址修改為自身的IP地址發(fā)送給用戶瀏覽器。
這里的關(guān)鍵在于真實(shí)WEB服務(wù)器相應(yīng)數(shù)據(jù)包如何返回給負(fù)載均衡服務(wù)器,一種是負(fù)載均衡服務(wù)器在修改目的IP地址的同時修改源地址,將數(shù)據(jù)包源地址改為自身的IP,即源地址轉(zhuǎn)換(SNAT),另一種方案是將負(fù)載均衡服務(wù)器同時作為真實(shí)物理服務(wù)器的網(wǎng)關(guān)服務(wù)器,這樣所有的數(shù)據(jù)都會到達(dá)負(fù)載均衡服務(wù)器。
IP負(fù)載均衡在內(nèi)核進(jìn)程完成數(shù)據(jù)分發(fā),較反向代理均衡有更好的處理性能。但由于所有請求響應(yīng)的數(shù)據(jù)包都需要經(jīng)過負(fù)載均衡服務(wù)器,因此負(fù)載均衡的網(wǎng)卡帶寬成為系統(tǒng)的瓶頸。
4 HTTP重定向負(fù)載均衡(少見)
HTTP重定向服務(wù)器是一臺普通的應(yīng)用服務(wù)器,其唯一的功能就是根據(jù)用戶的HTTP請求計算一臺真實(shí)的服務(wù)器地址,并將真實(shí)的服務(wù)器地址寫入HTTP重定向響應(yīng)中(響應(yīng)狀態(tài)嗎302)返回給瀏覽器,然后瀏覽器再自動請求真實(shí)的服務(wù)器。
這種負(fù)載均衡方案的優(yōu)點(diǎn)是比較簡單,缺點(diǎn)是瀏覽器需要每次請求兩次服務(wù)器才能拿完成一次訪問,性能較差;使用HTTP302響應(yīng)碼重定向,可能是搜索引擎判斷為SEO作弊,降低搜索排名。重定向服務(wù)器自身的處理能力有可能成為瓶頸。因此這種方案在實(shí)際使用中并不見多。
5 反向代理負(fù)載均衡(nginx)
傳統(tǒng)代理服務(wù)器位于瀏覽器一端,代理瀏覽器將HTTP請求發(fā)送到互聯(lián)網(wǎng)上。而反向代理服務(wù)器則位于網(wǎng)站機(jī)房一側(cè),代理網(wǎng)站web服務(wù)器接收http請求。
反向代理的作用是保護(hù)網(wǎng)站安全,所有互聯(lián)網(wǎng)的請求都必須經(jīng)過代理服務(wù)器,相當(dāng)于在web服務(wù)器和可能的網(wǎng)絡(luò)攻擊之間建立了一個屏障。
除此之外,代理服務(wù)器也可以配置緩存加速web請求。當(dāng)用戶第一次訪問靜態(tài)內(nèi)容的時候,靜態(tài)內(nèi)存就被緩存在反向代理服務(wù)器上,這樣當(dāng)其他用戶訪問該靜態(tài)內(nèi)容時,就可以直接從反向代理服務(wù)器返回,加速web請求響應(yīng)速度,減輕web服務(wù)器負(fù)載壓力。
另外,反向代理服務(wù)器也可以實(shí)現(xiàn)負(fù)載均衡的功能。
由于反向代理服務(wù)器轉(zhuǎn)發(fā)請求在HTTP協(xié)議層面,因此也叫應(yīng)用層負(fù)載均衡。優(yōu)點(diǎn)是部署簡單,缺點(diǎn)是可能成為系統(tǒng)的瓶頸。
|