有許多方法可以量化超級(jí)計(jì)算機(jī)的性能。事實(shí)上,Top500.org是一個(gè)發(fā)布半年度名單的組織,該組織排名世界上最強(qiáng)大的超級(jí)計(jì)算設(shè)備,包括從架構(gòu)到處理器,加速器到互連的各種數(shù)據(jù)。提供了供應(yīng)商對(duì)特定系統(tǒng)的貢獻(xiàn),以及他們的解決方案在整體性能和列表份額方面的表現(xiàn)。該小組還根據(jù)能源效率(Green500)和高性能共軛梯度(HPCG)對(duì)系統(tǒng)進(jìn)行排名。
雖然特定供應(yīng)商和系統(tǒng)在Top500的高端享有相對(duì)穩(wěn)定的位置是正常的,但Green500列表往往更加多樣化和流暢。此外,企業(yè)擁有的超級(jí)計(jì)算機(jī)在20或30個(gè)排名最高的Top500裝置中很少見(jiàn)到。這主要是由于高端超級(jí)計(jì)算機(jī)的成本和復(fù)雜性,這在大學(xué)和政府研究設(shè)施中比在現(xiàn)實(shí)世界的商業(yè)環(huán)境中更容易管理。
鑒于本周發(fā)布的新Top500和Green500名單,這些要點(diǎn)值得考慮。IBM宣布,它是唯一一家在兩個(gè)名單中排名前10位的超級(jí)計(jì)算機(jī)供應(yīng)商:Summit,Sierra和Lassen系統(tǒng)部署在美國(guó)能源部(DOE)實(shí)驗(yàn)室。此外,IBM宣布,該公司為T(mén)otal Exploration(一家在130個(gè)國(guó)家開(kāi)展業(yè)務(wù)的石油和天然氣公司)建造的新型Pangea III超級(jí)計(jì)算機(jī)在Top500排行榜上排名第11位,在Green500排名第8位。
讓我們仔細(xì)看看這三個(gè)公告,并考慮一下IBM的頂級(jí)系統(tǒng) - 在數(shù)據(jù)中心,云計(jì)算和SIEM -portend中的超級(jí)計(jì)算應(yīng)用程序和客戶(hù)。
Top500和Green500之巔
美國(guó)能源部峰會(huì)和Sierra超級(jí)計(jì)算機(jī)有什么共同之處嗎?絕對(duì)。兩者均采用IBM的AI優(yōu)化??IBM POWER9處理器和系統(tǒng),以及NVIDIA的V100 Tensor Core GPU和NVIDIA NVLink互連技術(shù)。
為什么這對(duì)超級(jí)計(jì)算很重要?IBM POWER9系統(tǒng)從頭開(kāi)始設(shè)計(jì),可以更快地在整個(gè)系統(tǒng)中移動(dòng)數(shù)據(jù),減少瓶頸,有助于提高計(jì)算性能和能效。根據(jù)IBM的說(shuō)法,其內(nèi)存技術(shù)使POWER9 CPU和連接的加速器之間的數(shù)據(jù)傳輸速度比基于x86的系統(tǒng)快9.5倍。
此外,CPU-to-GPU NVIDIA NVLink互連(由IBM和NVIDIA聯(lián)合開(kāi)發(fā))支持IBM POWER9 CPU和NVIDIA V100 GPU之間的帶寬,比同類(lèi)x86系統(tǒng)快5.6倍。這些是用于處理和分析大量數(shù)據(jù)的系統(tǒng)的關(guān)鍵優(yōu)勢(shì)。
這些IBM和NVIDIA技術(shù)是自去年六月入門(mén)以來(lái),Summit和Sierra在Top500排行榜中名列前茅的原因。但他們?cè)谛碌腉reen500名單上排名前十的系統(tǒng)中的位置同樣令人印象深刻,并證明至少一些現(xiàn)代超級(jí)計(jì)算機(jī)比許多人想象的更靈活和適應(yīng)性更強(qiáng)。
這些要點(diǎn)對(duì)于客戶(hù)在考慮當(dāng)前的超級(jí)計(jì)算狀態(tài)時(shí)要記住很重要。盡管x86在列出的系統(tǒng)和安裝總數(shù)方面領(lǐng)先Top500,但I(xiàn)BM和NVIDIA的創(chuàng)新解決方案通過(guò)提供卓越的性能和更高的能效,在Top500領(lǐng)域處于領(lǐng)先地位。
Total Exploration的Pangea III
這些相同的性能和效率問(wèn)題是Total Exploration擁有的Pangea III系統(tǒng)的基礎(chǔ)。通過(guò)競(jìng)爭(zhēng)性招標(biāo)流程,道達(dá)爾選擇了IBM,因?yàn)槠渲С諥I的GPU加速解決方案。因此,Pangea III采用與DOE的Summit和Sierra系統(tǒng)相同的IBM POWER9和NVIDIA架構(gòu)。新系統(tǒng)可提供25 petaflops的計(jì)算能力,同時(shí)支持50 PB的存儲(chǔ)容量,這些功能至關(guān)重要,因?yàn)榈肋_(dá)爾計(jì)劃利用Pangea III進(jìn)行復(fù)雜的石油和天然氣勘探分析。
另一個(gè)因素是IBM能夠提供的極高的混合計(jì)算和能效。據(jù)該公司稱(chēng),Pangea III所需的能量?jī)H為之前Pangea超級(jí)計(jì)算機(jī)峰值4.5兆瓦的三分之一,這是一個(gè)利用Intel Xeon E5 CPU和InfiniBand互連的SGI構(gòu)建系統(tǒng)。道達(dá)爾還指出,結(jié)合POWER9 / NVIDIA架構(gòu)性能的提升,Pangea III使用的Panfaa系統(tǒng)所需的每千萬(wàn)億次計(jì)算能耗不到10%。
如果企業(yè)能夠平衡超級(jí)計(jì)算研究的成本和收益與金融和市場(chǎng)現(xiàn)實(shí)之間的關(guān)系,那么價(jià)格/性能的顯著改善應(yīng)該是有意義的。
最終分析
那么,這三個(gè)公告的基本要點(diǎn)是什么?首先,盡管行業(yè)標(biāo)準(zhǔn)組件提供了無(wú)數(shù)的好處,但愿意投資于創(chuàng)新研發(fā)的供應(yīng)商可以提供顯著的性能,效率和其他好處。
這對(duì)于使用傳統(tǒng)數(shù)據(jù)中心解決方案的客戶(hù)來(lái)說(shuō)非常重要,但它們?cè)诎ǔ?jí)計(jì)算機(jī)安裝在內(nèi)的大型系統(tǒng)中變得越來(lái)越引人注目。IBM為DOE構(gòu)建的基于POWER9的強(qiáng)大Summit和Sierra安裝提供了證明。
其次,Total Exploration的新型POWER9和基于NVIDIA的Pangea III系統(tǒng)表明商用超級(jí)計(jì)算的未來(lái)可能最終接近。盡管有多年的樂(lè)觀預(yù)測(cè),但重大的資本支出投資和與能源相關(guān)的痛苦OPEX成本限制了企業(yè)對(duì)這些解決方案的興趣。通過(guò)Pangea III,IBM已經(jīng)證明它可以成功地提供頂線(xiàn)性能,并帶來(lái)底線(xiàn)優(yōu)勢(shì)。
因此,道達(dá)爾應(yīng)該為Pangea III在新的Top500榜單中獲得的排名感到自豪。同時(shí),如果該公司很快加入其他商業(yè)組織并決定利用基于IBM POWER9和NVIDIA的解決方案可以在超級(jí)計(jì)算的未來(lái)競(jìng)爭(zhēng)中提供的幫助,也就不足為奇了。