微軟為AI工作負(fù)載擴(kuò)展Azure的GPU處理選項(xiàng)

2019-10-14 14:35:57    來源:    作者:

微軟正在從硬核PC游戲玩家那里尋求線索,并升級其圖形硬件。但是,這家軟件巨頭沒有將引人注目的視覺效果投放到計(jì)算機(jī)顯示器上,而是在云上加速了人工智能(AI)工作負(fù)載。

該公司本周宣布,將Microsoft的GPU輔助虛擬機(jī)用于其AI應(yīng)用程序的Azure客戶將于今年晚些時(shí)候擁有更新,性能更快的選項(xiàng)。

微軟利用計(jì)算機(jī)圖形硬件制造商N(yùn)vidia的最新GPU創(chuàng)新技術(shù),宣布了新的ND系列Azure虛擬機(jī),并承諾將在當(dāng)前產(chǎn)品上大幅度提高性能。

像Google和其他使用圖形處理單元(GPU)來驅(qū)動(dòng)人工智能的公司一樣,微軟已經(jīng)采用了該技術(shù)來加速其云上的機(jī)器學(xué)習(xí),深度學(xué)習(xí)和其他AI工作負(fù)載。GPU非常適合這些任務(wù),這要?dú)w功于大規(guī)模并行的微體系結(jié)構(gòu),這些體系結(jié)構(gòu)適合于AI應(yīng)用程序,這些應(yīng)用程序在本質(zhì)上也通常是并行的。

由基于新Pascal架構(gòu)的Nvidia Tesla P40 GPU驅(qū)動(dòng)的這個(gè)新系列非常適合培訓(xùn)和推理,” Microsoft Azure計(jì)算主管Corey Sanders在5月8日發(fā)布的聲明中說。“這些實(shí)例為使用CNTK [Microsoft Cognitive Toolkit],TensorFlow,Caffe和其他框架的AI工作負(fù)載提供了比上一代FP32(單精度浮點(diǎn)運(yùn)算)高出2倍的性能。”

除了提高性能外,新虛擬機(jī)還為具有更大AI野心的客戶提供了更大的擴(kuò)展空間。

“ ND系列還提供了更大的GPU內(nèi)存大小(24GB),使客戶能夠適應(yīng)更大的神經(jīng)網(wǎng)絡(luò)模型,” Sanders繼續(xù)說道。“最后,像我們的NC系列一樣,ND系列將提供RDMA和InfiniBand連接,因此您可以運(yùn)行跨越數(shù)百個(gè)GPU的大規(guī)模培訓(xùn)工作。” InfiniBand是一種高性能,低延遲的網(wǎng)絡(luò)標(biāo)準(zhǔn),受到高性能計(jì)算(HPC)環(huán)境的青睞。

ND系列虛擬機(jī)還可用于加速某些非AI,HPC工作負(fù)載。候選者包括DNA測序,蛋白質(zhì)分析和圖形繪制,Sanders補(bǔ)充說。

當(dāng)前的NC系列產(chǎn)品正在升級。桑德斯稱,新產(chǎn)品很快被稱為NCv2,它們由Nvidia Tesla P100 GPU提供支持,其計(jì)算性能是其前代產(chǎn)品的兩倍。

此博客文章中提供了有關(guān)即將推出的ND系列和NCv2系列虛擬機(jī)的技術(shù)規(guī)范。

同時(shí),隨著基于云的AI解決方案的業(yè)務(wù)需求升溫,微軟面臨著更加激烈的競爭。

今年2月,Google宣布允許某些地區(qū)的云客戶將Nvidia GPU附加到其Google Compute Engine虛擬機(jī)。一個(gè)明顯的好處是,客戶不再需要構(gòu)建或獲取自己的GPU集群并在其數(shù)據(jù)中心為其騰出空間。另一個(gè)是使用該系統(tǒng)的分布式方法訓(xùn)練機(jī)器學(xué)習(xí)模型所需的時(shí)間大大縮短。

去年秋天,亞馬遜開始提供帶有多達(dá)16個(gè)Nvidia GPU的新EC2(彈性計(jì)算云)實(shí)例。該公司還推出了一個(gè)新的深度學(xué)習(xí)AMI(亞馬遜機(jī)器映像),其中包含Caffe,MXNet,TensorFlow,Theano和Torch框架。

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。