vidia Research今天推出了GauGAN,這是一種生成性的對(duì)抗性AI系統(tǒng),可以讓您創(chuàng)建從未存在過(guò)的逼真的風(fēng)景圖像。今天在加利福尼亞州圣何塞舉行的GPU技術(shù)大會(huì)(GTC)上展示了新系統(tǒng)的研究和演示。
應(yīng)用深度學(xué)習(xí)研究Bryan Catanzaro的Nvidia副總裁說(shuō),GauGAN建立在去年推出的能夠呈現(xiàn)虛擬世界的Pix2Pix系統(tǒng)的基礎(chǔ)上,但是Pix2Pix無(wú)法描繪風(fēng)景,因?yàn)檫@樣做會(huì)在最終圖像中留下瑕疵。
GauGAN的神經(jīng)網(wǎng)絡(luò)通過(guò)一百萬(wàn)個(gè)開(kāi)源Flickr圖像進(jìn)行訓(xùn)練,并且充滿了對(duì)超過(guò)180個(gè)物體(如雪,樹(shù)木,水,花,灌木,丘陵或山脈)之間關(guān)系的理解。
對(duì)物體如何相互關(guān)聯(lián)的理解意味著水旁的樹(shù)將顯示反射,或者當(dāng)季節(jié)變化并且地面上有雪時(shí),樹(shù)木將被描繪成沒(méi)有葉子。
風(fēng)格轉(zhuǎn)移也是可能的,因此圖像可以采用溫暖的夕陽(yáng)光或顯示城市天際線的冷光。
GauGAN應(yīng)用程序使用分割圖,它有點(diǎn)像著色書(shū),描述對(duì)象的位置但不提供細(xì)節(jié),如下所示。
Nvidia主要研究科學(xué)家Ming-Yu Liu和其他人詳細(xì)介紹了GauGAN的創(chuàng)建及其用于照片處理的空間自適應(yīng)非規(guī)范化方法的論文今天發(fā)布。該論文還于6月在加利福尼亞州長(zhǎng)灘舉行的計(jì)算機(jī)視覺(jué)和模式識(shí)別(CVPR)2019年會(huì)議上接受口頭報(bào)告。
今天首次亮相的還有Nvidia AI Playground,這是一個(gè)網(wǎng)站,人們可以修補(bǔ)各種訓(xùn)練有素的神經(jīng)網(wǎng)絡(luò),如GauGAN,使用強(qiáng)大的AI來(lái)扭曲視覺(jué)效果或創(chuàng)造逼真的圖像。
GauGAN是來(lái)自Nvidia的最新逼真的人工智能系統(tǒng),它是像StyleGAN這樣的深度技術(shù)的創(chuàng)造者,可以生成從未存在的人的逼真圖像,而Nvidia上個(gè)月開(kāi)源。
在回答Nvidia釋放另一個(gè)可以讓人質(zhì)疑真實(shí)情況的系統(tǒng)的問(wèn)題時(shí),Catanzaro說(shuō)作為一名研究人員,“這是我的夢(mèng)想”,因?yàn)閷?shí)現(xiàn)這些結(jié)果所必需的技術(shù)代表了進(jìn)步 - 但另一方面,它是有些人可能濫用的技術(shù)。
“就個(gè)人而言,我認(rèn)為這是一個(gè)信任問(wèn)題,而不是技術(shù)問(wèn)題,”卡坦扎羅說(shuō)。
Catanzaro表示,他最為興奮的是,GauGAN被視頻游戲設(shè)計(jì)師采用,創(chuàng)造了虛擬世界的景觀,并設(shè)想將這項(xiàng)技術(shù)應(yīng)用于使用故事板來(lái)展示他們創(chuàng)作的創(chuàng)意人。