浪潮信息在分布式存儲平臺上研發(fā)出在線(xiàn)并發(fā)升級算法,能夠保證在不影響企業(yè)業(yè)務(wù)的前提下進(jìn)行快速、可靠的版本迭代,實(shí)現整體存儲平臺升級效率提升超10倍。
在線(xiàn)并發(fā)升級 讓升級更有效
浪潮信息研發(fā)的在線(xiàn)并發(fā)升級算法,相對于傳統串行在線(xiàn)升級有兩大優(yōu)勢:首先,在于從集群底層數據分布結構出發(fā),對節點(diǎn)進(jìn)行升級分類(lèi),可避免上層協(xié)議對于并發(fā)升級的影響,進(jìn)而實(shí)現了集群全場(chǎng)景并發(fā)升級。其次,升級隊列生成器可以根據當前集群實(shí)際情況制定出優(yōu)化的升級策略,而升級控制器保證實(shí)際升級過(guò)程中能夠綜合各種集群服務(wù)狀態(tài),在確保集群業(yè)務(wù)正常的情況下動(dòng)態(tài)調整各節點(diǎn)的升級順序,進(jìn)而實(shí)現在存儲業(yè)務(wù)不受影響的前提下快速完成存儲版本的迭代。
例如,在存儲系統由70臺設備組成的情況下,按照傳統串行升級方式,整個(gè)存儲集群完成升級耗時(shí)在8小時(shí)左右。在采用浪潮信息的并發(fā)升級技術(shù)后,存儲集群升級耗時(shí)縮減至42分鐘,整體升級時(shí)間縮短90%。
浪潮信息的并發(fā)升級技術(shù)之所以能有效提升集群整體升級效率,關(guān)鍵在于此技術(shù)能夠根據存儲系統底層結構將70個(gè)節點(diǎn)劃分為5個(gè)升級組,單個(gè)升級組之間相互獨立,可以進(jìn)行并發(fā)升級。然后根據存儲系統服務(wù)分布、存儲池狀態(tài)、閾值等信息綜合計算得出單個(gè)升級組內可允許并行升級的節點(diǎn)個(gè)數,具體分組內容如下表所示:
在進(jìn)行分組后集群節點(diǎn)可進(jìn)行兩輪并發(fā),首先是5個(gè)升級組間可以執行并發(fā)升級,其次單個(gè)升級組內節點(diǎn)按照并發(fā)個(gè)數進(jìn)行并發(fā)升級。經(jīng)過(guò)兩輪并發(fā)升級后集群升級耗時(shí)被縮減至42分鐘。
在線(xiàn)并發(fā)升級 讓升級更可靠
浪潮信息支持不同版本間的功能互通,即在整個(gè)升級期間不同版本間業(yè)務(wù)可以正?;ネ?,不影響集群原功能的正常使用。
浪潮信息的分布式存儲產(chǎn)品還支持暫停/繼續功能。當在線(xiàn)升級時(shí)間窗口不足或節點(diǎn)升級異常時(shí),用戶(hù)可主動(dòng)觸發(fā)升級暫停動(dòng)作,浪潮信息的分布式存儲可以在記錄下當前集群升級狀態(tài)后進(jìn)行集群狀態(tài)恢復并退出升級。升級暫停期間浪潮信息支持系統多版本兼容,使得集群即使在各節點(diǎn)系統版本不一致的情況下,也可以維持整個(gè)存儲系統的功能、穩定性和性能不受影響,集群仍可正常對外提供服務(wù)。此后用戶(hù)可通過(guò)繼續升級功能來(lái)恢復集群升級。暫停和繼續功能不僅增加了升級功能的穩定性和健壯性,同時(shí)也解決了大規模集群用戶(hù)升級時(shí)間窗口選擇難的問(wèn)題。
浪潮信息的分布式存儲AS13000,基于在線(xiàn)并發(fā)升級功能,已經(jīng)在金融、通信、醫療等行業(yè)實(shí)現規模部署,在實(shí)際升級操作中可快速、安全的實(shí)現分布式存儲版本的迭代,提升升級效率、降低運維成本。未來(lái),浪潮信息將持續秉承“存儲即平臺”戰略,加速推進(jìn)存儲系統功能的研發(fā)和創(chuàng )新,助力各個(gè)行業(yè)釋放數據價(jià)值,加速數字化轉型。