使用自適應(yīng)深度強(qiáng)化學(xué)習(xí)卷曲的AI機(jī)器人

2021-01-11 15:02:20    來(lái)源:新經(jīng)網(wǎng)    作者:阿威

在冰壺運(yùn)動(dòng)中,由于涉及的策略和精確度而被稱為“冰上比賽”,一個(gè)名為Curly的機(jī)器人在四場(chǎng)正式比賽中的三場(chǎng)擊敗了韓國(guó)國(guó)家隊(duì)。機(jī)器人當(dāng)然已經(jīng)走了很長(zhǎng)一段路,但是它們?nèi)匀缓鼙孔荆⑶掖蠖鄶?shù)都缺少人體的靈巧性。因此,掌握卷曲的機(jī)器人Curly令人印象深刻。

使用自適應(yīng)深度強(qiáng)化學(xué)習(xí)卷曲的AI機(jī)器人

要充分欣賞這項(xiàng)技術(shù)的壯舉,了解卷曲的運(yùn)動(dòng)很重要。冰壺運(yùn)動(dòng)需要保齡球的物理性,因?yàn)橥婕覍?0磅重的石頭從稱為hogline的邊界向下推到冰上,朝著100英尺遠(yuǎn)的目標(biāo)滑下。石頭的目標(biāo)稱為具有同心圓的房屋-越靠近目標(biāo),您得到的點(diǎn)就越多。

在冰壺比賽中,您與一個(gè)團(tuán)隊(duì)競(jìng)爭(zhēng),該團(tuán)隊(duì)的球員還試圖將他們的花崗巖冰球扔向更靠近目標(biāo)的位置,或?qū)⒛幕◢弾r冰球擊倒以獲取最多的積分。冰壺策略是要弄清楚如何通過(guò)將對(duì)手的石頭撞到適當(dāng)?shù)奈恢蒙希瑫r(shí)將對(duì)手的石頭撞到適當(dāng)?shù)奈恢?,以使?duì)手的石頭在房屋中對(duì)準(zhǔn)最佳位置。訣竅在于,石頭和冰塊的摩擦使比賽者所面對(duì)的元素在比賽中始終變化。冰壺對(duì)于人類來(lái)說(shuō)并不是一件容易的事,對(duì)于一臺(tái)機(jī)器而言也是一項(xiàng)令人難以置信的成就。

德國(guó)柏林理工學(xué)院的克勞斯-羅伯特·穆勒(Klaus-RobertMüller)和他的同事們是Curly創(chuàng)作的幕后功臣。Curly由人工智能驅(qū)動(dòng),特別是自適應(yīng)深度強(qiáng)化學(xué)習(xí)框架。該機(jī)器人的前部有兩個(gè)輪子,后部有一個(gè)腳輪。它有一個(gè)伸縮式攝像機(jī),可以到達(dá)空中7英尺,以幫助機(jī)器人看到房子,并在前輪正上方找到另一個(gè)攝像機(jī),以便它可以看到hogline。連同四個(gè)U形,由傳送帶驅(qū)動(dòng)的較小的輪子,機(jī)器人用其前輪抓緊石頭。U型輪使機(jī)器人能夠旋轉(zhuǎn)石頭,使石頭向右或向左旋轉(zhuǎn)的卷曲是這項(xiàng)運(yùn)動(dòng)中的一項(xiàng)關(guān)鍵技術(shù)。

為了幫助Curly學(xué)習(xí)冰壺的策略,開(kāi)發(fā)團(tuán)隊(duì)創(chuàng)建了一個(gè)冰壺游戲的仿真模型,Curly可以與之競(jìng)爭(zhēng)并從中學(xué)習(xí)。模擬中具有挑戰(zhàn)性的事情是每場(chǎng)比賽中不斷變化的條件-冰況,石頭的拋光和這項(xiàng)運(yùn)動(dòng)的其他物理性質(zhì)。人類競(jìng)爭(zhēng)者必須不斷適應(yīng)不斷變化的條件。結(jié)果,模擬與現(xiàn)實(shí)之間存在差距。

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。