更多虛機重啟優(yōu)先級
當故障轉(zhuǎn)移(failover)發(fā)生時,虛機重啟優(yōu)先級決定了虛機重啟的先后順序。需要重啟的虛機被分配給還有空閑資源的服務器,高優(yōu)先級的虛機被優(yōu)先分配,然后是次一級優(yōu)先級的虛機,直到所有的空閑資源用完。服務器然后按照優(yōu)先順序啟動虛機,如果資源不夠了,vSphere 會暫停重啟動作,直到有足夠的資源可用(因為有其他的虛機釋放資源了)。
在 vSphere 6.5 中新增了兩個虛機重啟優(yōu)先級(下面標藍色的兩個級別),讓管理員有更多的配置選擇,把虛機的優(yōu)先等級分得更細。
- Highest
- High
- Medium
- Low
- Lowest

虛機重啟順序可控
一個多層應用(Multi-Tiered Application)是由多個虛機組成的,如數(shù)據(jù)庫、應用服務器、Web 服務器等,這些虛機的啟動應該有一個先后順序,在一般的情況下,應該遵循數(shù)據(jù)庫→應用服務器→Web服務器的順序。vSphere 用 vApp 把這些虛機組成一組,作為一個整體來進行管理。管理員可以給 vApp 分配資源,把 vApp 作為一個整體來啟動或關閉等。在 vApp 的配置中,通過指定每一個虛機啟動的延遲時間來調(diào)整各個虛機的啟動順序。
vSphere 6.5 引入了虛機之間的依賴鏈機制來控制多層應用的啟動,通過指定虛機之間的依賴關系來定義它們的啟動順序,這稱之為順序可控的重啟(Orchestrated Restart)。在下圖的例子中,APP 依賴于 DB,WEB 依賴于 APP,所以它們的啟動順序就如數(shù)字標識所示。vSphere 會檢依賴鏈的有效性,避免產(chǎn)生無效的依賴關系:
- 循環(huán)依賴:例如下圖中 DB 又依賴于 WEB;
- 依賴關系跟重啟優(yōu)先級相矛盾:例如下圖中 APP 和 WEB 為高優(yōu)先級,但是 DB 卻被定義為低優(yōu)先級。

主動預防系統(tǒng)故障
傳統(tǒng)的 HA 都是被動的,只有當服務器故障時,才會把受保護的虛機故障轉(zhuǎn)移(failover)到其他的服務器上去。現(xiàn)在主流的服務器廠商都提供了硬件系統(tǒng)的監(jiān)控和預警功能,使得主動預防成為可能。vSphere 6.5 可以通過插件與以下服務器廠商的系統(tǒng)管理工具相集成,以實現(xiàn)主動預防式 HA(Proactive HA):
- Dell Openmanage
- HP Insight Manager
- Cisco UCS Manager
這些系統(tǒng)管理工具會把服務器的一些異常狀況向 vSphere 告警,例如某個散熱風扇發(fā)生故障,某塊硬盤的讀寫故障率超出正常閾值范圍等等。當這種告警發(fā)生時,意味著服務器處于亞健康狀態(tài),這時 vSphere 就會把這臺服務器處于隔離模式(Quarantine mode),這意味著該服務器上不會再啟動新的虛機,并且 vSphere 會盡可能地把該服務器上的虛機 vMotion 到其他健康服務器上去。
傳統(tǒng)的 HA 是當服務器發(fā)生故障時才起作用,主動預防式 HA 把故障防患于未然,主動獲取服務器的故障預警,在宕機發(fā)生之前就把應用負載轉(zhuǎn)移到其他服務器上去,從而為企業(yè)關鍵應用提供更高等級的可靠性保護。
