您所在的位置:
首頁(yè) >
新聞中心
> 最新資訊
更開(kāi)放,更懂AI,新華三發(fā)布多元異構算力平臺
紫光股份旗下新華三集團發(fā)布全新多元異構算力平臺H3C UniServer R5330 G7和H3C UniServer R5500 G7服務(wù)器,以多元異構、開(kāi)放包容、靈活等多重優(yōu)勢,提供高性能、高可靠的多元算力,為不同AI負載提供強勁算力支撐,為數字經(jīng)濟高質(zhì)量發(fā)展提供堅實(shí)后盾。
智能算力 H3C UniServer R5500 G7服務(wù)器
為AI而生 模塊化設計打造及至算力
“百模大戰”熱潮下,大模型的訓練及推理過(guò)程均需要強大的算力作為支撐。H3C UniServer R5500 G7服務(wù)器是專(zhuān)為AI大模型訓練而設計的智能算力旗艦新品,支持千億級參數規模的大模型訓練。產(chǎn)品采用系統解耦的模塊化設計,兼容新OCP OAI開(kāi)放硬件標準,實(shí)現算力開(kāi)放和可進(jìn)化;通過(guò)搭載2顆新處理器以及新一代OAM 8-GPU模組,為AI大模型訓練提供算力與互聯(lián)帶寬,加速AGI時(shí)代到來(lái)。算力旗 艦,助力AI大模型訓練:
-
支持超過(guò)15種、千億級參數主流大模型訓練,覆蓋AIGC、計算機視覺(jué)、自然語(yǔ)言處理和大數據分析等多種AI應用場(chǎng)景。
-
采用模塊化設計,用戶(hù)可靈活選擇GPU計算模塊,提高系統的可擴展性和可維護性,節省成本。
-
GPU模組算力可提升200%,Llama2-70B增量預訓練僅需15天。
生態(tài)兼容,AI業(yè)務(wù)平滑遷移:
-
主流開(kāi)源大模型一鍵遷移,客戶(hù)模型零代碼改動(dòng)。
-
CUDA底層原生兼容,算子庫兼容可達95%以上。
-
適配國內外主流深度學(xué)習框架,原生適配國產(chǎn)飛槳深度學(xué)習框架。
可靠,算力管理智能靈活:
-
CPU、GPU模組、BMC芯片等核心部件支持國產(chǎn)化,供應可靠。
-
結合傲飛算力平臺,可實(shí)現萬(wàn)卡集群算力統一調度,算力高 效率使用。
-
算力資源統一管理、監控、告警,智能靈活。
自主算力引擎H3C UniServer R5330 G7服務(wù)器
直面異構算力 性能助力AGI時(shí)代
隨著(zhù)多元異構算力的廣泛應用,伴隨而來(lái)的諸多挑戰也逐漸浮現。由于不同廠(chǎng)商硬件存在計算架構、緩存資源、互聯(lián)方式等差異,限制了算力資源的充分使用和靈活調度。新華三集團發(fā)布的自主算力引擎產(chǎn)品——H3C UniServer R5330 G7服務(wù)器,搭載2顆新處理器+GPU異構算力,可解決異構算力部署的技術(shù)難題;CUDA算子庫支持95%以上,讓底層適配更加便捷,實(shí)現生態(tài)無(wú)縫遷移;開(kāi)放包容,異構賦能,為不同AI負載提供強勁算力支撐。訓推一體,AI開(kāi)發(fā)新范式:
-
對比上一代GPU,大模型訓練場(chǎng)景下的AI算力提升超過(guò)30%,顯存容量提升100。
-
大模型推理場(chǎng)景僅需單臺8-GPU便可支持在100用戶(hù)同時(shí)訪(fǎng)問(wèn)情況下達到15 token/s,提供更快的服務(wù)響應速度。
-
支持多元GPU異構算力大模型混合部署,更具靈活性,為用戶(hù)提供更多選擇。
生態(tài)開(kāi)放,AI業(yè)務(wù)快速部署:
-
CUDA算子庫支持95%以上,用戶(hù)代碼零改動(dòng)。
-
支持200種以上主流AI模型,軟件棧兼容國內外主流生態(tài),支持原生社區分布式訓練方案。
-
覆蓋通用計算、FFT(快速傅里葉變換)等多種計算模式。
異構賦能,實(shí)現智能算力調度:
-
結合傲飛算力平臺,可實(shí)現萬(wàn)卡集群算力統一調度。
-
提供模型訓練、微調、評估、推理全流程服務(wù)。
-
支持AI算力資源統一管理、監控、告警,讓運維更智能、更靈活。