長期以來,游戲一直被用作人工智能的試驗臺和基準,近幾個月來,成就不乏不足。谷歌DeepMind的AlphaGo和卡內(nèi)基梅隆大學(xué)的撲克機器人Libratus在傳統(tǒng)上對AI很難的游戲中都擊敗了人類專家-在IBM的DeepBlue 在國際象棋上取得了同樣的成就大約20年之后。
這樣的游戲具有明確定義的規(guī)則的吸引力。它們對于AI研究人員來說相對簡單且便宜,并且以任何期望的難度提供了各種認知挑戰(zhàn)。通過發(fā)明可以發(fā)揮作用的算法,研究人員希望能夠深入了解自動運行所需的機制。
隨著AI和機器學(xué)習(xí)的最新技術(shù)的到來,現(xiàn)在的注意力已轉(zhuǎn)移到視覺上詳細的計算機游戲上,包括3-D射擊游戲Doom,各種2-D Atari游戲(例如Pong和Space Invaders)以及實時策略。游戲《星際爭霸》。
這當然是所有的進步,但是更大的AI畫面的關(guān)鍵部分卻被忽略了。研究優(yōu)先考慮了游戲,在這些游戲中,預(yù)先知道可以執(zhí)行的所有動作,無論是移動騎士還是發(fā)射武器。從一開始就為計算機提供了所有選項,重點是在它們之間進行選擇的程度。問題在于,這使AI研究脫離了使計算機真正具有自主性的任務(wù)。
香蕉皮
讓計算機確定在給定背景下甚至存在的動作提出了概念和實際挑戰(zhàn),到目前為止,游戲研究人員幾乎沒有嘗試解決這些挑戰(zhàn)。“猴子和香蕉”問題是一個長期以來人工智能難題的例子,其中最近沒有取得任何進展。
這個問題最初是由AI的創(chuàng)始者之一約翰·麥卡錫(John McCarthy)在1963年提出的:一個房間里有一張椅子,一根棍子,一只猴子和一堆香蕉掛在天花板上。任務(wù)是讓計算機提出一系列動作,使猴子能夠獲取香蕉。
麥卡錫在人工智能方面區(qū)分了該任務(wù)的兩個方面。物理可行性–確定特定的動作序列在物理上是否可以實現(xiàn);以及與認識論或知識相關(guān)的可行性–確定猴子實際上可能采取的行動。
如果事先告知所有可能的動作–“爬上椅子”,“波浪棒”等,對于計算機來說,確定對猴子來說在物理上可行的方法非常容易。一個簡單的程序指示計算機逐個執(zhí)行所有可能的操作順序,將迅速獲得最佳解決方案。
但是,如果計算機必須首先確定甚至可以執(zhí)行哪些操作,則將面臨更大的挑戰(zhàn)。它提出了關(guān)于我們?nèi)绾伪硎局R,知道某物的必要條件和充分條件以及我們?nèi)绾沃篮螘r獲得足夠知識的問題。在強調(diào)這些問題時,麥卡錫說:“我們的最終目標是使程序像人類一樣有效地學(xué)習(xí)經(jīng)驗。”
除非計算機在未對可能的操作進行任何預(yù)先描述的情況下解決問題,否則就無法實現(xiàn)此目標。不幸的是,AI研究人員忽略了這一點:不僅這些問題變得更加困難和有趣,而且它們看起來像是在該領(lǐng)域取得更有意義進展的前提。
文字申訴
為了在復(fù)雜的環(huán)境中自主運行,不可能預(yù)先描述如何最好地操縱甚至表征那里的物體。教計算機克服這些困難會立即引發(fā)有關(guān)從以前的經(jīng)驗中學(xué)習(xí)的深刻問題。
與其專注于可以避免這個問題的Doom或StarCraft之類的游戲,不如對現(xiàn)代AI進行更有希望的測試,可能是1970年代和1980年代的不起眼的文字冒險。
在計算機具備復(fù)雜的圖形功能之前的日子,像Colossal Cave和Zork這樣的游戲很流行。屏幕上的消息告訴玩家他們的環(huán)境:
他們必須以簡單的指令做出響應(yīng),通常以動詞或動詞加名詞的形式進行響應(yīng)–“ look”,“ take box”等。挑戰(zhàn)的一部分是弄清楚哪些行動是可能的和有用的,并做出相應(yīng)的響應(yīng)。
對于現(xiàn)代AI來說,一個很好的挑戰(zhàn)是在這樣的冒險中扮演玩家的角色。計算機將不得不理解屏幕上的文本描述,并使用某種預(yù)測機制來確定其可能的效果,并通過動作對它們進行響應(yīng)。
計算機上更復(fù)雜的行為包括探索環(huán)境,定義目標,做出面向目標的動作選擇以及解決通常需要進行的各種智力挑戰(zhàn)。
由IBM,Google,F(xiàn)acebook或Microsoft之類的技術(shù)巨頭推廣的現(xiàn)代AI方法在這些文字冒險中的表現(xiàn)如何是一個懸而未決的問題–每個新場景他們將需要多少專業(yè)的人類知識。
為了衡量該領(lǐng)域的進展,過去兩年來,我們一直在今年 8月在荷蘭馬斯特里赫特舉行的IEEE計算智能和游戲大會上進行競賽。參賽者需要提前提交參賽作品,并且可以使用自己選擇的AI技術(shù)來構(gòu)建程序,以通過理解文字描述并輸出適當?shù)奈淖置顏硗孢@些游戲。
簡而言之,如果AI要保持進步,研究人員需要重新考慮他們的優(yōu)先事項。如果發(fā)現(xiàn)該學(xué)科被忽視的根源是富有成果的,那只猴子畢竟可能最終得到了他的香蕉。