除了所有CPU和GPU公告外,NVIDIA今天還發(fā)布了其全新的基于Ampere的A10和A30 Tensor Core GPU。這兩個(gè)GPU面向數(shù)據(jù)中心,并且主要面向虛擬化平臺(tái)。
這些全新的Tensor Core GPU有趣的是它們的規(guī)格。A10使用GA102 GPU,而A30使用GA100 GPU。雖然這兩個(gè)都是基于Ampere的,但兩個(gè)GPU的內(nèi)存子系統(tǒng)都將大不相同,因?yàn)樘峁〨DDR6的A10和提供數(shù)據(jù)中心的標(biāo)準(zhǔn)HBM2內(nèi)存標(biāo)準(zhǔn)的A30。因此,讓我們?cè)敿?xì)了解一下規(guī)格。
NVIDIA A10 Tensor Core GPU由GA102-890 SKU驅(qū)動(dòng)。它具有72個(gè)SM,共計(jì)9216個(gè)CUDA內(nèi)核。GPU的基本時(shí)鐘頻率為885 MHz,最高可提升至1695 MHz。它具有PCIe Gen 4.0合規(guī)性,并且在內(nèi)存方面具有24 GB GDDR6 VRAM,可在384位寬的總線接口上以12.5 Gbps的速度運(yùn)行。GPU提供600 GB / s的帶寬。
至于卡的設(shè)計(jì),它使用了香檳金色外罩,采用單槽,全長(zhǎng)尺寸。由于這是一個(gè)被動(dòng)冷卻卡,因此它上沒有風(fēng)扇,并且通過單個(gè)8針連接器提供電源,并且該卡通過單個(gè)8針連接器運(yùn)行,從而滿足其150W TDP需求。在性能方面,NVIDIA A10 Tensor Core GPU最多可提供31.2 TF FP32、62.5 TF TF32、125 TF BFLOAT16、250 TOPS INT8、500 TOPS INT4以及兩倍的稀疏率。
NVIDIA A30 Ampere Tensor Core GPU
另一方面,NVIDIA A30 Tensor Core GPU使用GA100 SKU,但尚不知道確切的變種。這似乎是一個(gè)相當(dāng)精簡(jiǎn)的變體,具有930 MHz的基本時(shí)鐘和高達(dá)1440 MHz的升壓時(shí)鐘。GPU配備了24 GB的HBM2 VRAM,可在3072位寬的總線接口上以1215 MHz的速度運(yùn)行。這意味著我們僅查看三個(gè)活動(dòng)的HBM2存儲(chǔ)器堆棧。堆??商峁└哌_(dá)933 GB / s的內(nèi)存帶寬。
與A10不同,NVIDIA A30 Tensor Core GPU具有雙插槽和全長(zhǎng)設(shè)計(jì)。它也由單個(gè)8針連接器供電,但額定TDP更高,為165W。在性能方面,NVIDIA A30 Tensor Core GPU提供高達(dá)5.2 TF FP64、10.3 TF Peak FP64TF,10.3 TF FP32、82 TF TF32、165 TF BFLOAT16、330 TOPS INT8、661 TOPS INT4以及兩倍的稀疏率。
NVIDIA Tensor Core Ampere GPU | ||
---|---|---|
A10 | A30 | |
顯卡 | GA102-890 | GA100 |
FP64 | – | 5.2兆 |
FP64張量核心 | – | 10.3兆 |
FP32 | 31.2兆 | 10.3兆 |
TF32張量核心 | 62.5 teraFLOPS |125 teraFLOPS * | 82 teraFLOPS |165 teraFLOPS * |
BFLOAT16張量核心 | 125 teraFLOPS |250 teraFLOPS * | 165 teraFLOPS |330 teraFLOPS * |
FP16張量核心 | 125 teraFLOPS |250 teraFLOPS * | 165 teraFLOPS |330 teraFLOPS * |
INT8張量核心 | 250 TOPS |500 TOPS * | 330 TOPS |661 TOPS * |
INT4張量核心 | 500 TOPS |1,000 TOPS * | 661 TOPS |1321 TOPS * |
RT核心 | 72個(gè)RT內(nèi)核 | – |
編碼/解碼 | 1個(gè)編碼器 2個(gè)解碼器(+ AV1解碼) |
1個(gè)光流加速器(OFA) 1個(gè)JPEG解碼器(NVJPEG) 4個(gè)視頻解碼器(NVDEC) |
GPU內(nèi)存 | 24GB GDDR6 | 24GB HBM2 |
GPU內(nèi)存帶寬 | 600GB /秒 | 933GB /秒 |
互連線 | PCIe Gen4 64GB /秒 | PCIe Gen4:64GB / s 第三代NVLINK:200GB / s ** |
外形尺寸 | 單槽全高全長(zhǎng)(FHFL) | 雙插槽,全高,全長(zhǎng)(FHFL) |
最大散熱設(shè)計(jì)功率(TDP) | 150瓦 | 165瓦 |
多實(shí)例GPU(MIG) | – | 4個(gè)GPU實(shí)例@每個(gè)6GB每個(gè) 2個(gè)GPU實(shí)例@每個(gè)12GB每個(gè) 1個(gè)GPU實(shí)例@ 24GB |
vGPU軟件支持 | NVIDIA虛擬PC,NVIDIA虛擬應(yīng)用程序,NVIDIA RTX虛擬 工作站,NVIDIA虛擬計(jì)算服務(wù)器 |
適用于VMware NVIDIA Virtual Compute Server的NVIDIA AI Enterprise |
浪潮支持A30,A10和A100的全新GPU服務(wù)器
超靈活的AI工作負(fù)載,支持2個(gè)Intel第三代Intel Xeon可擴(kuò)展處理器和8個(gè)NVIDIA A100 / A40 / A30 GPU,16個(gè)NVIDIA A10 GPU或20個(gè)NVIDIA T4 GPU;在4U機(jī)箱中最多支持12個(gè)3.5英寸硬盤驅(qū)動(dòng)器,用于大型本地存儲(chǔ);靈活適應(yīng)最新的AI加速器和智能NIC,并具有一鍵式切換拓?fù)涞莫?dú)特功能,適用于各種AI應(yīng)用程序,包括AI云,IVA(智能視頻分析),視頻處理等。
NF5468A5:
多功能AI服務(wù)器,具有2個(gè)AMD Rome / Milan CPU和8個(gè)NVIDIA A100 / A40 / A30 GPU;N + N冗余設(shè)計(jì)可在全速運(yùn)行中使用8個(gè)350W AI加速器,從而具有出色的可靠性;CPU到GPU的非阻塞設(shè)計(jì)允許在不進(jìn)行PCIe交換機(jī)通信的情況下進(jìn)行互連,從而實(shí)現(xiàn)更快的計(jì)算效率。
NF5280M6:
專為所有場(chǎng)景而打造,在2U機(jī)箱中配備2個(gè)Intel第三代Intel Xeon可擴(kuò)展處理器和4個(gè)NVIDIA A100 / A40 / A30 / A10 GPU或8個(gè)NVIDIA T4 Tensor Core GPU,能夠在45°下長(zhǎng)期穩(wěn)定運(yùn)行C。NF5280M6配備了最新的PFR / SGX技術(shù)和可信賴的安全模塊設(shè)計(jì),適用于要求苛刻的AI應(yīng)用。
此外,浪潮還宣布了全新的浪潮M6 AI服務(wù)器,完全支持NVIDIA Bluefield-2 DPU。展望未來,浪潮計(jì)劃將NVIDIA Bluefield-2 DPU集成到其下一代AI服務(wù)器中,這將為AI,大數(shù)據(jù)分析,云計(jì)算等場(chǎng)景提供更快,更高效的用戶和集群管理以及互連的數(shù)據(jù)訪問。和虛擬化。
可用性
全球計(jì)算機(jī)制造商現(xiàn)已提供20多個(gè)NVIDIA認(rèn)證系統(tǒng)。具有NVIDIA A30和NVIDIA A10 GPU的NVIDIA認(rèn)證系統(tǒng)將于今年晚些時(shí)候從制造商處上市。
NVIDIA AI Enterprise是永久許可,每個(gè)CPU插槽的價(jià)格為3,595美元。NVIDIA AI Enterprise的企業(yè)業(yè)務(wù)標(biāo)準(zhǔn)支持費(fèi)用為每個(gè)許可每年899美元??蛻艨梢栽谟?jì)劃升級(jí)到VMware vSphere 7 Update 2時(shí)申請(qǐng)NVIDIA AI Enterprise的早期訪問。