新聞中心
當(dāng)前位置:網(wǎng)站首頁 > 新聞中心
想知道SaaS運(yùn)行好不好?你得讀懂這三類分析指標(biāo)!
分析指標(biāo)是所有現(xiàn)代SaaS應(yīng)用程序的核心。如果不監(jiān)控SaaS應(yīng)用程序如何運(yùn)行、它在內(nèi)部執(zhí)行的任務(wù)及其實(shí)現(xiàn)目標(biāo)的成功率,就無從談起成功運(yùn)行SaaS應(yīng)用程序。
然而,現(xiàn)代應(yīng)用程序需要監(jiān)控和查看多種類型的分析指標(biāo)。這些分析指標(biāo)的用途、價(jià)值、準(zhǔn)確性和可靠性相差懸殊,具體取決于如何衡量它們、如何使用它們以及誰在使用它們。
基本上有三類用例全然不同的分析指標(biāo)。
A類分析指標(biāo)
A類分析指標(biāo)對應(yīng)用程序而言是關(guān)鍵指標(biāo)。如果沒有這些分析指標(biāo),你的應(yīng)用程序可能會(huì)立即失靈。這類指標(biāo)用于評(píng)估應(yīng)用程序的運(yùn)行,調(diào)整其運(yùn)行方式,并進(jìn)行動(dòng)態(tài)調(diào)整以保持應(yīng)用程序正常運(yùn)行。
分析指標(biāo)是反饋回路的一部分,反饋回路可以不斷監(jiān)控和改進(jìn)應(yīng)用程序的操作環(huán)境。
A類分析指標(biāo)的一個(gè)典例是用于自動(dòng)擴(kuò)展的指標(biāo)。這類指標(biāo)用于在應(yīng)用程序負(fù)載變化時(shí)動(dòng)態(tài)改變基礎(chǔ)設(shè)施的規(guī)模,以滿足當(dāng)前或預(yù)期的需求。
一個(gè)眾所周知的例子是AWS Auto Scaling云服務(wù)。該服務(wù)可自動(dòng)監(jiān)控特定的Amazon CloudWatch指標(biāo),尋找觸發(fā)器和閾值。如果某個(gè)特定的指標(biāo)達(dá)到特定標(biāo)準(zhǔn),AWS Auto Scaling 會(huì)為應(yīng)用程序添加或刪除Amazon EC2實(shí)例,自動(dòng)調(diào)整用于運(yùn)行應(yīng)用程序的資源。需要額外資源時(shí),它會(huì)添加實(shí)例;指標(biāo)表明不再需要資源時(shí),它會(huì)刪除這些實(shí)例。
AWS Auto Scaling讓你可以創(chuàng)建由任意數(shù)量的EC2實(shí)例組成的服務(wù),并根據(jù)流量和負(fù)載需求自動(dòng)添加或減少服務(wù)器。流量較小時(shí),將使用較少的實(shí)例。流量較大時(shí),將使用更多的實(shí)例。
舉例來說,AWS Auto Scaling可能使用CloudWatch指標(biāo)來測量用于服務(wù)的所有實(shí)例的平均CPU負(fù)載。一旦CPU負(fù)載超過某個(gè)閾值,AWS Auto Scaling就會(huì)向服務(wù)池添加額外的服務(wù)器。
請注意,如果由于某個(gè)原因,這些Amazon CloudWatch指標(biāo)不可用或不正確,那么算法就無法正常運(yùn)行。結(jié)果是,要么為服務(wù)添加過多的實(shí)例這會(huì)浪費(fèi)資金;要么為服務(wù)添加過少的實(shí)例這會(huì)導(dǎo)致應(yīng)用程序的速度減慢或徹底失效。
很顯然,這些指標(biāo)確實(shí)必不可少。如果它們不可用、不正確,應(yīng)用程序的運(yùn)行就會(huì)岌岌可危。正因?yàn)槿绱?,它們才叫A類指標(biāo)。
AWS Elastic Load Balancing是另一個(gè)典例。AWS可以根據(jù)當(dāng)前進(jìn)入到每個(gè)負(fù)載均衡系統(tǒng)的流量大小,自動(dòng)調(diào)整針對特定用例運(yùn)行流量負(fù)載均衡服務(wù)所需要的實(shí)例大小和數(shù)量。隨著流量增加,負(fù)載均衡系統(tǒng)自動(dòng)改用更大的實(shí)例或更多的實(shí)例。隨著流量減少,負(fù)載均衡系統(tǒng)自動(dòng)改用更小的實(shí)例或更少的實(shí)例。這一切都是自動(dòng)化的,基于使用特定CloudWatch指標(biāo)的內(nèi)部算法。如果這些指標(biāo)不可用或不正確,負(fù)載均衡系統(tǒng)將無法調(diào)整適當(dāng)?shù)拇笮。?fù)載均衡系統(tǒng)處理流量負(fù)載的能力可能會(huì)受到影響。
B類分析指標(biāo)
B類分析指標(biāo)不是關(guān)鍵業(yè)務(wù)型指標(biāo),是用來表明即將發(fā)生的問題的早期指標(biāo),或用于在問題出現(xiàn)時(shí)解決問題。B類分析指標(biāo)對于防止系統(tǒng)故障或出現(xiàn)故障后恢復(fù)正常很重要。
B類指標(biāo)通常便于深入了解應(yīng)用程序或服務(wù)的內(nèi)部操作,或者便于深入了解運(yùn)行應(yīng)用程序或服務(wù)的基礎(chǔ)設(shè)施。你可以主動(dòng)或被動(dòng)地利用這種洞察力,改進(jìn)應(yīng)用程序或服務(wù)的運(yùn)行。
就主動(dòng)方面而言,用戶可以密切關(guān)注B類指標(biāo),這類指標(biāo)表明了應(yīng)用程序或服務(wù)可能不正常的趨勢?;谶@些趨勢,可以利用指標(biāo)觸發(fā)警報(bào),提醒運(yùn)營團(tuán)隊(duì)必須檢查系統(tǒng),查看可能出現(xiàn)的問題。
就被動(dòng)方面而言,在系統(tǒng)故障或性能降級(jí)期間,可以檢查B指標(biāo)的以往情況,以確定可能導(dǎo)致故障或性能問題的原因,以便查明解決問題的方法。這類指標(biāo)常常在站點(diǎn)出現(xiàn)故障期間使用,并在事后檢查期間使用。
在出現(xiàn)故障期間,B類指標(biāo)用于迅速查明出了什么問題以及如何解決問題。之后,它們用于縮短平均檢測時(shí)間(MTTD)和平均修復(fù)時(shí)間(MTTR),前者是指故障期間發(fā)現(xiàn)問題所花的平均時(shí)間,后者是指故障期間確定解決問題所花的時(shí)間。這兩個(gè)都是高性能SaaS應(yīng)用程序的關(guān)鍵目標(biāo)。
這種指標(biāo)與A類指標(biāo)的危急程度不一樣。如果A類指標(biāo)失效,你的應(yīng)用程序可能失靈,但是如果B類指標(biāo)失效,你的應(yīng)用程序不會(huì)失靈。然而,如果你的應(yīng)用程序有問題,而且B類指標(biāo)沒有正常運(yùn)作,你可能需要更長的時(shí)間才能找到問題并解決它。
B類指標(biāo)的例子有很多,許多公司專注于生成這些指標(biāo),比如AppDynamics、Datadog、Dynatrace和New Relic。B類指標(biāo)還包括來自Elastic和Splunk等公司的日志記錄及其他指標(biāo)。
作者:Lee Atchison 是云計(jì)算和應(yīng)用程序現(xiàn)代化領(lǐng)域公認(rèn)的思想領(lǐng)袖。他在產(chǎn)品開發(fā)、架構(gòu)設(shè)計(jì)、規(guī)模擴(kuò)展和現(xiàn)代化方面擁有30多年的經(jīng)驗(yàn),曾供職于亞馬遜、亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)、New Relic及其他現(xiàn)代應(yīng)用程序組織。他的名字出現(xiàn)在許多出版物中,經(jīng)常在全球各地受邀擔(dān)任演講嘉賓。Lee的最新著作是《為規(guī)模設(shè)計(jì)架構(gòu)》。
作者:Lee Atchison? ?來源:計(jì)算機(jī)世界
|