Facebook AI研究人員將CraftAssist開源,這是一個為Minecraft視頻游戲構(gòu)建交互式助手機(jī)器人的框架。這些機(jī)器人使用自然語言理解(NLU)來解析和執(zhí)行人類玩家的文本命令,例如在游戲世界中建造房屋的請求。研究人員可以擴(kuò)展該框架的模塊化結(jié)構(gòu),以執(zhí)行自己的ML實驗。
研究團(tuán)隊在最近的博客文章中對該系統(tǒng)進(jìn)行了概述。CraftAssist機(jī)器人使用與標(biāo)準(zhǔn)游戲客戶端相同的協(xié)議連接到游戲,因此可以執(zhí)行人類玩家可以執(zhí)行的任何操作。機(jī)器人使用Minecraft的內(nèi)置基于文本的聊天界面與其他玩家進(jìn)行交互。人類可以向機(jī)器人發(fā)出命令,包括高級指令,例如“在藍(lán)色立方體旁邊蓋房子”。該發(fā)行版的目的是幫助改善人與人工智能的協(xié)作:
該平臺旨在支持對與人類參與者指定和評估的各種任務(wù)交互有趣并有用的代理的研究。為了鼓勵更廣泛的AI研究社區(qū)將Craftcraft平臺用于他們自己的實驗,我們正在開放框架,基線助手以及用于構(gòu)建它的工具和數(shù)據(jù)的外包。
從廣義上講,機(jī)器人控制系統(tǒng)由感知和動作選擇子系統(tǒng)組成。感知是將原始傳感器數(shù)據(jù)轉(zhuǎn)換為更抽象的表示;例如,圖像識別是一種感知任務(wù),它將圖像像素轉(zhuǎn)換為描述圖像內(nèi)容的文本標(biāo)簽。當(dāng)對包含許多傳感器輸入示例和所需輸出的示例的數(shù)據(jù)集進(jìn)行訓(xùn)練時,現(xiàn)代的深度學(xué)習(xí)模型可以在許多視覺和NLU任務(wù)上實現(xiàn)接近人類水平的性能。
動作選擇是機(jī)器人“決定”如何與世界互動以實現(xiàn)某個目標(biāo)的過程。例如,為了贏得圍棋而做出的舉動。許多成功的系統(tǒng)都使用強化學(xué)習(xí)(RL),在這種學(xué)習(xí)中,機(jī)器人會反復(fù)嘗試執(zhí)行任務(wù),每次嘗試都會給出數(shù)值獎勵 結(jié)果。游戲是RL的常見測試平臺,因為它們具有明確的動作和結(jié)果集,而經(jīng)過RL訓(xùn)練的現(xiàn)代機(jī)器人在許多不同的游戲中通常都可以勝過人類的頂級能力。某些研究小組(例如Google的DeepMind)將感知和動作選擇子系統(tǒng)組合到一個由受訓(xùn)者訓(xùn)練的單一“端到端”系統(tǒng)中深度強化學(xué)習(xí),還有許多用于訓(xùn)練這些系統(tǒng)的虛擬環(huán)境,包括 Facebook開發(fā)的模擬棲息地。微軟已經(jīng)為Minecraft開源了一個名為Project Malmo的“ AI-gym”界面以及一個大型數(shù)據(jù)集,以鼓勵將Minecraft用作RL研究的測試平臺。