“你們先去吧,等會人少了我再去。最近事太多,我要抓緊把這組數(shù)據(jù)跑個結(jié)果出來,導(dǎo)師催著要呢。”
“你還在用咱們實驗室的集群在跑嗎?”
“是啊,實驗室買了這么多服務(wù)器,可還是跑的很慢。”
“你去超算中心啊,他那邊跑的快很多。”
“我之前試過,那邊排隊太長了,比我們實驗室快不了多少。”
“現(xiàn)在他們新買的華為HPC平臺,規(guī)模比之前大了很多,作業(yè)周轉(zhuǎn)快基本不用排隊。而且I/O特別快,算我們這種作業(yè)快得不要不要的。”
“真的嗎?那我趕緊試試華為的平臺。”
小科登錄超算中心的系統(tǒng),提交了幾個計算作業(yè)。不用不知道,一用就見識了這個平臺的快:下午提交的作業(yè)到凌晨依次運行完畢,第二天一早就拿到了需要的計算結(jié)果。
“幸虧你推薦我去超算中心跑程序,不然用實驗室的集群估計還要跑10天半個月。”
瀚海助力科大超算集群表現(xiàn)亮眼
瀚海助力科大超算集群表現(xiàn)亮眼
幫助小科的這個平臺叫做“瀚海20超級計算系統(tǒng)”,他擁有CPU計算集群30480顆核,系統(tǒng)理論峰值性能2.52Pflops,實測HPL雙精度浮點計算能力:700個節(jié)點1.43PFlops,計算效率為63.95%,甚至部分計算節(jié)點HPL效率跑出了71%以上的超高性能。“瀚海20系統(tǒng)”采用InfiniBand HDR100 100Gbps網(wǎng)絡(luò)技術(shù)構(gòu)建的全線速的高速計算網(wǎng)絡(luò),在600納秒的極低延遲下,每秒可發(fā)送2億條消息,讓用戶獲得更快的網(wǎng)絡(luò)性能,也是全國高校首例。
瀚海20系統(tǒng)單節(jié)點HPL性能統(tǒng)計
中科大瀚海20系統(tǒng)負載
不光是小科同學(xué),中科大合肥微尺度物質(zhì)科學(xué)國家研究中心的胡老師針對大尺度分子固體材料的第一性原理計算模擬,以自主開發(fā)的第一性原理線性標(biāo)度計算軟件DGDFT[JCP 143, 124110 (2015)]為基礎(chǔ),開發(fā)低標(biāo)度、低通訊,低內(nèi)存、低訪存的并行計算方法,實現(xiàn)超大規(guī)模高性能并行計算,其中DGDFT采用了多級MPI并行以及高效求本征值方法,具有高度可擴展性。而本次測試在某校外超算和“瀚海20系統(tǒng)”超算平臺上分別計算金屬石墨烯C2880(2880個碳原子),在相同核數(shù)下的絕對計算速度比該校外超算運行快30%以上。
DGDFT軟件在校外某超算和“瀚海20”超算系統(tǒng)上測試金屬石墨烯C2880計算的并行
瀚海為用戶提供多種選擇
瀚海為用戶提供多種選擇
“瀚海20系統(tǒng)”還為科研用戶提供了多種計算選擇,其采用20臺華為Taishan服務(wù)器構(gòu)建的鯤鵬生態(tài)計算集群,其中的華為Taishan服務(wù)器采用鯤鵬架構(gòu),該架構(gòu)芯片在部分單精度和整型計算應(yīng)用程序性能表現(xiàn)優(yōu)異,可用于生物信息學(xué)計算軟件,和流體力學(xué)計算。中國科大網(wǎng)絡(luò)信息中心張煥杰老師就利用其實現(xiàn)了ARM平臺甄別郵件系統(tǒng)中用戶弱口令問題,由原來的需要1天,縮短到30幾秒即可完成,大大縮短了處理時間,提高了郵件系統(tǒng)的安全性。
瀚海超算集群節(jié)能環(huán)保
瀚海超算集群節(jié)能環(huán)保
中科大“瀚海20系統(tǒng)”不只性能強,而且更加綠色環(huán)保,系統(tǒng)采用液冷技術(shù)進行高效散熱,可循環(huán)使用的冷卻水流經(jīng)CPU、內(nèi)存等高發(fā)熱量器件,80%的熱量直接由冷卻水帶走,大幅降低超算中心的散熱能耗。其中的720臺華為X6000液冷高密服務(wù)器計算節(jié)點僅需10個機柜即可部署,每個機柜72個節(jié)點39KW的超高密計算系統(tǒng),相比傳統(tǒng)服務(wù)器每年至少可節(jié)省電費17余萬元。
中科大“瀚海20系統(tǒng)”
中科大“瀚海20系統(tǒng)”液冷計算節(jié)點