科研,是科技持續發(fā)展的引擎??蒲袡C構需要怎樣的支撐?除了經(jīng)費和人才外,對高性能計算有著(zhù)更高的需求,其強大的算力能夠支撐大量的科研項目,進(jìn)而縮短研發(fā)周期,推動(dòng)高效創(chuàng )新。
當前,隨著(zhù)數字經(jīng)濟的蓬勃發(fā)展,數據量的暴增,高性能計算正逐漸向新興的大數據、深度學(xué)習以及云計算等方向進(jìn)行融合和演進(jìn),以支撐人工智能、基因測序、仿真模擬等諸多領(lǐng)域的研究,HPC&AI的強大智能計算能力正推動(dòng)民生與數字經(jīng)濟的不斷升級,成為構建下一代基于數據產(chǎn)業(yè)和科學(xué)計算的基石,是開(kāi)啟未來(lái)數據文明的秘鑰。
近日,寶德為中國科學(xué)院(簡(jiǎn)稱(chēng)“中科院”)某研究院,量身定制的HPC&AI融合集群解決方案,憑借眾多優(yōu)勢以及良好的經(jīng)濟效益,在深圳市高校教育信息化學(xué)會(huì )舉辦的新基建下智慧校園建設發(fā)展論壇上,通過(guò)嚴格把關(guān)、層層甄選,獲評優(yōu)秀案例大獎。
作為我國自然科學(xué)最高學(xué)術(shù)機構、科學(xué)技術(shù)最高咨詢(xún)機構、自然科學(xué)與高技術(shù)綜合研究發(fā)展中心,中科院的高性能計算之路已經(jīng)走過(guò)了近三十年,在應用水平、計算規模和科研成果上都位列前沿,當然,這也決定了中科院對于伙伴的選擇更為苛刻。
本次獲獎案例中,寶德基于高可靠、易擴展和開(kāi)放的架構設計,為中科院某研究院搭建集實(shí)時(shí)計算、數據分析和大數據存儲于一體的遙感數據綜合分析管理平臺,實(shí)現高性能計算和人工智能的結合應用,既提供澎湃的算力,又帶來(lái)更多智能化的體驗,使得遙感數據處理速度提升120%,日處理數據量達到25TB,實(shí)際使用效益深厚院方滿(mǎn)意和認可。方案中系統主要分為三個(gè)層次設計:網(wǎng)絡(luò )層、存儲層和應用層。網(wǎng)絡(luò )層主要提供終端與服務(wù)器、服務(wù)器與服務(wù)器之間的網(wǎng)絡(luò )物理硬件連接;存儲層主要提供應用層所使用數據的讀取和存儲;應用層主要提供各種應用請求、計算服務(wù)器和存儲服務(wù)器之間的數據交換等。同時(shí),方案主要通過(guò)構建業(yè)務(wù)節點(diǎn)、計算節點(diǎn)、分布式存儲資源池以及磁帶庫,提供高達93.6TFlops以上的計算能力,SSD分布式存儲可用容量664TB,HDD分布式存儲可用容量4500TB,磁帶庫裸容量12PB的高性能計算集群,滿(mǎn)足院方當前科研發(fā)展對于高性能計算力以及高速存儲IO帶寬的需求。1、系統基于先進(jìn)的萬(wàn)兆以太網(wǎng)絡(luò )構建核心骨干網(wǎng),通過(guò)使用企業(yè)級萬(wàn)兆核心交換機實(shí)現核心網(wǎng)絡(luò )系統的架構設計,保證所有功能節點(diǎn)和存儲節點(diǎn)之間以萬(wàn)兆網(wǎng)絡(luò )以上的線(xiàn)性速率進(jìn)行數據傳輸,大幅度提升傳輸帶寬,同時(shí)具備高冗余性和容錯性。2、高性能在線(xiàn)計算集群部分基于100Gb Infiniband高速網(wǎng)絡(luò ),通過(guò)RDMA技術(shù)可以加快HPC&AI計算節點(diǎn)之間的MPI數據通信和與存儲之間的數據傳輸,實(shí)現數據的實(shí)時(shí)快速讀寫(xiě)計算,并提升遙感圖形機器視覺(jué)處理能力,實(shí)現自動(dòng)識別和分析空間遙感圖像。3、 采用兩套分布式存儲系統,均基于全對稱(chēng)分布式設計,SSD高速在線(xiàn)分布式存儲基于100Gb Infiniband提供存儲節點(diǎn)數據通信,HDD近線(xiàn)存儲基于萬(wàn)兆以太網(wǎng)提供存儲節點(diǎn)數據通信存儲之間,并采用糾刪碼和網(wǎng)絡(luò )冗余設計,保證存儲系統的整體容錯率。4、提供高可用業(yè)務(wù)服務(wù)器解決方案以及管理登錄節點(diǎn)雙機備份配置,保證集群系統高可用;Web服務(wù)器、數據庫服務(wù)器、綜合業(yè)務(wù)服務(wù)器也通過(guò)冗余配置,并與萬(wàn)兆核心骨干網(wǎng)絡(luò )相連,搭配高性能磁盤(pán)陣列,實(shí)現綜合業(yè)務(wù)應用高可用。5、采用綜合業(yè)務(wù)節點(diǎn)冗余配置搭配大容量磁帶庫,實(shí)現冷數據的傳輸和長(cháng)期穩定保存。以綜合業(yè)務(wù)節點(diǎn)作為備份管理端,將HDD近線(xiàn)存儲空間以NAS形式掛載到綜合業(yè)務(wù)節點(diǎn),配合備份軟件備份機制,將NAS里的文件備份到磁帶庫,實(shí)現數據的離線(xiàn)保存。綜合以上設計和優(yōu)勢,寶德HPC&AI融合集群解決方案幫助中科院某研究院實(shí)現對遙感大數據的實(shí)時(shí)分析,并結合人工智能技術(shù),快速獲取地表形態(tài)變化,以支撐多領(lǐng)域科學(xué)研究。在高性能計算領(lǐng)域,寶德已經(jīng)擁有二十余年的精耕細作和技術(shù)積累,當前,伴隨著(zhù)數字經(jīng)濟進(jìn)入全面滲透、融合階段,寶德的高性能計算更是走上了一條“融合創(chuàng )新發(fā)展”之路,此次為中科院某研究院打造的HPC&AI融合集群解決方案,是寶德綜合能力的展現也是二十余年底蘊的釋放。面向未來(lái),寶德亦持續賦能高科技研發(fā)領(lǐng)域,進(jìn)一步助推我國科技和數字經(jīng)濟的進(jìn)步與發(fā)展。