AI是什么樣的?您可能會說它看起來像機(jī)器人,閃爍的LED或屏幕上的波形。但是AI會說AI看起來像什么?為了找出答案,IBM Research要求AI給我們畫一張自己的圖畫。AI的自畫像今天在《紐約時(shí)報(bào)》上發(fā)表,看著這張圖片,我不僅對結(jié)果感到驚訝,而且對我們到達(dá)那里的旅程感到驚訝。
《紐約時(shí)報(bào)》于9月下旬聯(lián)系了IBM Research,要求我們提供幫助,幫助他們以巧妙的方式使用AI來為即將到來的AI專欄創(chuàng)作藝術(shù)。由于時(shí)間緊迫,無法保證成功,因此我們著手教導(dǎo)AI創(chuàng)造原創(chuàng)藝術(shù)。僅需執(zhí)行一項(xiàng)高級任務(wù)-識別AI中的重要概念,創(chuàng)建一個(gè)原始圖像即可捕獲它,并以與《紐約時(shí)報(bào)》的視覺風(fēng)格相匹配的方式進(jìn)行展示-我們開發(fā)了一種將AI與人類的創(chuàng)造力。
為什么繪制自畫像會對AI構(gòu)成挑戰(zhàn)?畢竟,人工智能可以駕駛汽車,玩視頻游戲甚至制作電影預(yù)告片。不同之處在于,這些任務(wù)不需要AI來創(chuàng)建新材料,僅需分析手頭的信息并根據(jù)其培訓(xùn)做出決策或選擇即可。我們已經(jīng)知道,人工智能可以在語言和圖像分析方面表現(xiàn)出色。另一方面,創(chuàng)建新內(nèi)容是一項(xiàng)更具實(shí)驗(yàn)性的活動。
為了應(yīng)對這一挑戰(zhàn),我們迅速在IBM Research內(nèi)部組建了一個(gè)多學(xué)科團(tuán)隊(duì),其中包括Alfio Gliozzo,Mauro Martino,Michele Merler和Cicero Nogueira dos santos。所需的專業(yè)知識與任務(wù)的性質(zhì)有關(guān):深入的科學(xué)思維,動手的技術(shù)和工程技能以及設(shè)計(jì)和可視化人才對于我們的工作至關(guān)重要。本質(zhì)上,我們需要明確定義創(chuàng)作過程。結(jié)果形成了細(xì)微的流水線,其中AI在分析和綜合中執(zhí)行關(guān)鍵功能,以創(chuàng)造出真正新穎而迷人的東西。
該過程包括以下三個(gè)主要步驟:
1.確定人工智能中的核心視覺概念:
摘錄了《紐約時(shí)報(bào)》(NYT)上約3,000篇有關(guān)“人工智能”的過往文章
應(yīng)用自然語言處理工具來識別“ AI”的前30個(gè)區(qū)分語義概念
針對前30個(gè)概念訓(xùn)練了基于圖像的視覺識別神經(jīng)網(wǎng)絡(luò)
應(yīng)用網(wǎng)絡(luò)為NYT文章中的圖像描繪或表示“ AI”的強(qiáng)度評分
從前10張圖片中選擇了一張:人類和機(jī)器人握手的圖片
2.創(chuàng)建捕捉AI概念的原始圖像:
建立了包含超過1,000張人類和機(jī)器人手圖像的訓(xùn)練數(shù)據(jù)集
訓(xùn)練了一個(gè)生成神經(jīng)網(wǎng)絡(luò)(GAN),以繪制人類和機(jī)器人手的新圖像,該圖像在晝夜中進(jìn)行了近一周的時(shí)間
3.以適合NYT視覺風(fēng)格的方式呈現(xiàn):
從NYT收集了一個(gè)封面藝術(shù)樣本,并培訓(xùn)了一個(gè)風(fēng)格轉(zhuǎn)移網(wǎng)絡(luò)
應(yīng)用網(wǎng)絡(luò)自動生成AI生成的手形圖像的樣式化版本,以匹配NYT的“視覺語言”進(jìn)行封面裝飾
根據(jù)整體概念的清晰度和藝術(shù)風(fēng)格選擇此處顯示的最終圖像
該管道為我們提供了令人矚目的協(xié)作創(chuàng)造力新功能,該功能也可以應(yīng)用于其他任務(wù)。想象一下使用AI根據(jù)音樂家的歌曲,歌詞和歷史為新專輯設(shè)計(jì)藝術(shù)品。
更重要的是,結(jié)果顯示了AI和人類如何攜手合作探索全新的領(lǐng)域。從藥物發(fā)現(xiàn)到金融市場預(yù)測再到惡意軟件檢測,我們已經(jīng)在各種環(huán)境中看到了這種協(xié)同作用。將這種范式擴(kuò)展到創(chuàng)造力領(lǐng)域,強(qiáng)調(diào)了人工智能可以增強(qiáng)人類能力的多種方式。