Google Research和加州大學(xué)伯克利分校的研究人員最近開發(fā)了一種模仿學(xué)習(xí)系統(tǒng),可以在機(jī)器人中實現(xiàn)各種敏捷的運動行為。他們的技術(shù)發(fā)表在arXiv上的一篇論文中,該技術(shù)使機(jī)器人可以通過模仿動物來獲得新技能。
進(jìn)行這項研究的研究人員之一賈森·彭(Jason Peng)對TechXplore表示:“該項目建立在計算機(jī)圖形學(xué)的一些先前作品的基礎(chǔ)上,該圖形學(xué)通過模仿人體運動捕捉數(shù)據(jù)來訓(xùn)練模擬角色進(jìn)行移動。” “這些技術(shù)大多數(shù)主要用于仿真,但是在我們最近的項目中,我們邁出了將其應(yīng)用于真實機(jī)器人的第一步。”
Peng和他的同事最初訓(xùn)練了四足機(jī)器人,以模仿狗在模擬環(huán)境中的運動和行走方式。他們的系統(tǒng)使用稱為強(qiáng)化學(xué)習(xí)的方法接受了從真實狗身上記錄的運動數(shù)據(jù)的訓(xùn)練。
Peng解釋說:“模擬訓(xùn)練的優(yōu)點之一是它非??欤虼宋覀兛梢栽趲滋熘畠?nèi)模擬數(shù)月的訓(xùn)練。” “一旦對機(jī)器人進(jìn)行了模擬訓(xùn)練,我們就可以使用在現(xiàn)實世界中收集到的幾分鐘數(shù)據(jù),將其學(xué)到的東西應(yīng)用于真正的機(jī)器人。”
Peng和他的同事采用的模仿學(xué)習(xí)方法比設(shè)計機(jī)器人控制器的傳統(tǒng)技術(shù)更具擴(kuò)展性。實際上,與其為一個機(jī)器人試圖復(fù)制的每種技能設(shè)計一種新的控制器,他們的方法還可以通過向動物展示一些動物執(zhí)行期望動作的示例,簡單地訓(xùn)練機(jī)器人以實現(xiàn)特定的運動風(fēng)格。然后,機(jī)器人只需觀察這些示例即可自動學(xué)習(xí)新的運動技能。
Peng和他的同事在一系列實驗中評估了他們的方法,訓(xùn)練了18自由度四足機(jī)器人Laikago,以重現(xiàn)不同的動物運動行為,包括不同的奔跑,跳躍和轉(zhuǎn)彎方式。值得注意的是,他們的技術(shù)使機(jī)器人可以自動合成各種動物運動風(fēng)格的控制器,從而將在模擬環(huán)境中學(xué)習(xí)到的技能有效地轉(zhuǎn)移到現(xiàn)實世界中。
“對我們來說,最令人興奮的結(jié)果是,相同的基礎(chǔ)方法可以學(xué)習(xí)從步行到動態(tài)跳躍和轉(zhuǎn)彎的各種技能,并且在模擬中學(xué)習(xí)的所有技能也可以轉(zhuǎn)移到真正的機(jī)器人上,” Peng說。“這些模仿學(xué)習(xí)技術(shù)可以使為機(jī)器人建立大量技能庫變得更加容易,從而使它們能夠與現(xiàn)實世界更加靈活地移動和交互。”
將來,Peng和他的同事開發(fā)的模仿學(xué)習(xí)系統(tǒng)可以在受動物啟發(fā)的機(jī)器人中實現(xiàn)更多種類的敏捷動作。目前,他們的技術(shù)只能使用運動數(shù)據(jù)進(jìn)行訓(xùn)練,但研究人員正在嘗試進(jìn)一步開發(fā)它,以便它也可以從動物視頻中學(xué)習(xí)。
Peng說:“我們現(xiàn)在有興趣嘗試讓機(jī)器人模仿不同種類的運動數(shù)據(jù),例如視頻剪輯。” “運動捕捉數(shù)據(jù)有時可能很難記錄,尤其是從動物身上記錄下來,因為把狗帶入Mocap工作室可能很棘手。如果我們只用手機(jī)記錄一些我們想要的機(jī)器人的視頻片段,那就太好了。然后讓機(jī)器人學(xué)習(xí)如何自動重現(xiàn)這些技能。”