以客戶(hù)為中心,提供定制化或一站式的全棧解決方案,賦能千行百業(yè)
近年來(lái),由于地球環(huán)境的不斷惡化,極端天氣頻發(fā),海洋環(huán)境遭到嚴重污染,自然氣象災害的增多,對氣象預報、海洋領(lǐng)域業(yè)務(wù)提出更高、更旺盛的需求。天氣氣候預報的數值預測模式日益成熟,關(guān)于海洋環(huán)境領(lǐng)域的研究也越來(lái)越受到重視,高性能計算機處理能力也越來(lái)越高,將高性能計算機應用于氣候、海洋、環(huán)境領(lǐng)域模式可以實(shí)現對其模式的最佳提升,目前,高性能計算機早已成為開(kāi)展氣候、海洋環(huán)境等數值模擬業(yè)務(wù)和科學(xué)研究所必須的基礎工具。寶德為氣象、海洋領(lǐng)域提供硬件服務(wù)全方位的解決方案。
針對氣象、海洋領(lǐng)域模式的主要特點(diǎn) :浮點(diǎn)計算量大、通信密集、要求系統具有高穩定性和高I O吞吐能力。寶德高性能計算機系統區別于傳統的集群高性能計算機,在如上幾個(gè)方面進(jìn)行了強化設計。 寶德PR6010P刀片服務(wù)器和PR2750P機架服務(wù)器采用Intel C624高性能芯片組處理器架構,處理能力 高達1.2Tf lops,具有強大的計算能力。 網(wǎng)絡(luò )系統方面采用單向56Gb s高速FDR Infiniband作為通信網(wǎng)絡(luò )以解決中大規模系統中的網(wǎng)絡(luò )壓力問(wèn)題, Infiniband網(wǎng)絡(luò )是當今業(yè)界最成熟的通用高速網(wǎng)絡(luò ),在目前TOP500的大型集群系統中占據著(zhù)絕對主流。為保證應用的數據訪(fǎng)問(wèn)的性能和安全,在存儲硬件方面,寶德提供企業(yè)級FC-SAN存儲系統,專(zhuān)業(yè)的企業(yè)級磁 盤(pán)、功能強大的存儲管理軟件以及模塊化結構為用戶(hù)快速、簡(jiǎn)便和動(dòng)態(tài)響應不斷變化的容量和性能要求提供 了前所未有的靈活性。
計算量大:中尺度氣象預報模式(MM5、WRF、GRAPES和AREMS),物理海洋模式如ROMs、Fvcom等都有非常大的計算量,預報精度提高一倍,其所需計算量將成幾何級上漲。目前上文提到的絕大部分預報模式都已經(jīng)完成了并行化 ,如中尺 度 預報 模 式 的MM5、WRF既支持MPI消 息傳 遞 并行 ,又支持OpenMP共享存儲并行 ,也支持MPI+OpenMP的混合運行模式。海洋模式中的FVCOM、ROMS、POM、HYCOM等等,環(huán)境模式中的CMAQ、CCSM3、 CAM等等均支持高性能計算,并具有良好的可擴展性。
通訊密集:由于這些模式都是并行軟件,同時(shí)一般都采用有限差分格點(diǎn)模式并行計算,所以運行這些預報模式時(shí),各個(gè) CPU之間的通訊量很大,模式對通訊的性能要求非常高。如氣象中尺度預報模式MM5、WRF的通訊既包括母域 和嵌套域之間的域間通訊,又有各個(gè)域內部不同數據劃分之間的通訊。所以這就要求高性能計算機有高性能 的通訊網(wǎng)絡(luò )。
對系統IO性能要求高:海洋模式如物理海洋和海洋地質(zhì)領(lǐng)域的程序大都對整個(gè)系統的IO性能有較高要求,一般要求有分布式IO或者 并行文件系統,否則可能很難有太好的加速比。
規范的模式系統化集成:氣象、海洋、環(huán)境領(lǐng)域模式從軟件的處理流程上看,一般分為前處理、主模式和后處理三個(gè)過(guò)程。前處理包 括資料的傳輸下載、數據同化等等,后處理主要是指圖形化處理生成產(chǎn)品等,前/后處理一般對計算機要求不是太高。主模式是整個(gè)系統的主要部分,也是主要計算量所在,這個(gè)部分是對計算機性能要求較高,整個(gè)模式系統從前處理到主模式然后到后處理這樣的流程運行下來(lái)也需要系統具有較高的穩健性,所以?xún)?yōu)秀的模 式軟件應用專(zhuān)家支持及硬件級的系統技術(shù)支持均對模式的良好使用也是關(guān)鍵。 對于構建一個(gè)針對氣象、海洋的高性能計算系統,在選擇基礎硬件環(huán)境時(shí),以下四點(diǎn)是非常重要的。
1、高性能,特別是浮點(diǎn)處理性能
2、高性能網(wǎng)絡(luò )環(huán)境
3、高性能的分布IO或者并行文件系統
4、系統的高穩健性
該方案采用寶德可擴展系列高性能計算機系統,寶德PR2750P是寶德公司在2018年推出 的跨時(shí)代的高性能計算機產(chǎn)品,它不僅在眾多方面超越了傳統的集群式高性能計算機,具有高穩定 、高可用、高擴展、高密度、高性能的特點(diǎn),適用于各類(lèi)氣象、海洋部門(mén)。
整個(gè)系統浮點(diǎn)計算理論峰值可以達到7.6萬(wàn)億次以上 ;計算模塊間采用56Gbps 高速I(mǎi)nfiniband互聯(lián),端到端延遲小于1.2us,優(yōu)于市場(chǎng)上的所有的商品化高速互聯(lián)網(wǎng)絡(luò )。
所有關(guān)鍵部件上,如電源、硬盤(pán)以及網(wǎng)絡(luò )等都做到了冗余設計,是保證程序模式高穩定性運行的保證