NVIDIA剛剛發(fā)布了其Ampere A100 GPU的第一個實際性能數(shù)據(jù),結(jié)果令人瘋狂。該公司在AI特定基準(zhǔn)測試中總共打破了16條性能記錄,并且在特定的機器學(xué)習(xí)性能類別中擊敗了其主要競爭對手,取得了巨大的領(lǐng)先優(yōu)勢。
結(jié)果來自MLPerf.MLPerf是一家成立于2018年的行業(yè)基準(zhǔn)測試組,主要專注于機器學(xué)習(xí)性能。該基準(zhǔn)套件包括總共八項測試,并且NVIDIA已以創(chuàng)紀(jì)錄的培訓(xùn)速度發(fā)布了所有記錄。
這是NVIDIA在2018年5月成立的行業(yè)基準(zhǔn)測試組織MLPerf進(jìn)行的培訓(xùn)測試中連續(xù)第三次,也是最強勁的表現(xiàn)。NVIDIA在2018年12月的首個MLPerf培訓(xùn)基準(zhǔn)中創(chuàng)下了六項記錄,在2019年7月創(chuàng)下了八項記錄。
NVIDIA是唯一一家為所有測試提供商用產(chǎn)品的公司。大多數(shù)其他提交使用的預(yù)覽類別是可能幾個月不可用的產(chǎn)品,而研究類別是使用預(yù)期時間不會可用的產(chǎn)品的。
NVIDIA博客
NVIDIA還報告了其DGX SuperPOD系統(tǒng)的八項新記錄,該系統(tǒng)是通過HDR InfiniBand連接在一起的龐大的DGX A100 HPC系統(tǒng)集群。DGX SuperPod由140個DGX A100系統(tǒng)組成,總共有1,120個NVIDIA Ampere A100 GPU,170個Mellanox Quantum 200G Infiniband交換機,4 PB的存儲空間和15公里的光纜。
令人贊嘆的DGX SuperPod系統(tǒng)中大約有770萬個Ampere CUDA內(nèi)核。該系統(tǒng)是DGX V擴(kuò)展計劃的一部分,為該系統(tǒng)增加了近700 Petaflops的計算能力,該系統(tǒng)目前已部署在加利福尼亞州圣克拉拉市的NVIDIA總部。
人工智能性能基準(zhǔn)-安培vs伏特&更多
NVIDIA已將其Ampere A100 Tensor Core GPU加速器與其前身Volta V100進(jìn)行了比較。比較還包括Google的第三代TPU和華為的Ascend HPC芯片。MLPerf本身列出了更詳細(xì)的基準(zhǔn)測試,還預(yù)覽了即將推出的AI加速器,例如英特爾的Cooper Lake-SP Xeon CPU和Google的第四代TPU。話雖如此,讓我們看一下基準(zhǔn)測試本身。
根據(jù)MLPerf的說法,他們的基準(zhǔn)套件包括針對機器學(xué)習(xí)和AI類別中最相關(guān)的性能工作負(fù)載的測試。NVIDIA Ampere A100只是將Volta V100毀壞,而性能卻提高了2.5倍。即使以最低的領(lǐng)先優(yōu)勢,Ampele A100仍比Volta V100 GPU提升了50%,令人印象深刻。此處的芯片規(guī)模已標(biāo)準(zhǔn)化為單個GPU,以便在Ampere和Volta之間進(jìn)行合理的比較。
華為Ascend芯片只能及時完成一項測試,而且性能也比Volta V100差,而Google的TPU V3只能及時完成兩項測試。在一項測試中,該芯片比NVIDIA Volta V100領(lǐng)先20%,而在第二項測試中,它比V100慢10%。
與Cooper Lake-SP 8插槽配置可在1104.53分鐘內(nèi)完成圖像分類測試相比,雙NVIDIA A100系統(tǒng)僅需33.37分鐘即可完成同一測試。NVIDIA還繼續(xù)將其Ampere A100的性能與尚未發(fā)布的Google TPU V4進(jìn)行比較,Google TPU V4仍處于研究階段,并且距離上市至少一年。
NVIDIA還展示了其GPU加速器的性能如何隨著AI的最新全棧創(chuàng)新而不斷提高。與在Volta V100上運行的MLPerf 0.5相比,與Ampere A100一起運行的MLPerf 0.7套件提供了驚人的4.2倍性能提升。
這證明了NVIDIA Ampere A100 GPU的芯片在AI社區(qū)中所有主要玩家認(rèn)可的套件中的真實基準(zhǔn)中的表現(xiàn)令人印象深刻。即使與Turing GPU相比,Ampele A100 GPU也被認(rèn)為是另一個基準(zhǔn)測試中最快的GPU,圖靈GPU的硬件加速技術(shù)能夠提供更好的性能,但仍然無法與Ampere A100及其強大的性能輸出相提并論。所有這些基準(zhǔn)功能使我們更加高興地看到以消費者形式的安培,這肯定會在幾個月后發(fā)生。