優(yōu)化軟機器人以執(zhí)行特定任務(wù)是一個巨大的計算問題

2020-02-05 17:01:29    來源:    作者:

麻省理工學(xué)院的研究人員發(fā)明了一種方法,可以有效地優(yōu)化用于目標任務(wù)的軟機器人的控制和設(shè)計,這在傳統(tǒng)上是一項艱巨的任務(wù)。

軟機器人具有彈性,柔性,可拉伸的主體,這些主體在任何給定時刻基本上可以移動無數(shù)種方式。從計算上講,這表示一個非常復(fù)雜的“狀態(tài)表示”,它描述了機器人各部分的運動方式。軟機器人的狀態(tài)表示可能具有數(shù)百萬個維度,這使得很難計算出使機器人完成復(fù)雜任務(wù)的最佳方式。

優(yōu)化軟機器人以執(zhí)行特定任務(wù)是一個巨大的計算問題

在下個月的神經(jīng)信息處理系統(tǒng)會議上,麻省理工學(xué)院的研究人員將提出一個模型,該模型根據(jù)機器人及其環(huán)境的基本物理特性,學(xué)習(xí)緊湊的或“低維”的,詳細的狀態(tài)表示形式。 。這有助于模型迭代地優(yōu)化滿足特定任務(wù)的運動控制和材料設(shè)計參數(shù)。

“軟機器人是無限維的生物,在任何給定的時刻都會以十億種不同的方式彎曲,”第一作者安德魯·斯皮爾伯格(Andrew Spielberg)說,他是計算機科學(xué)和人工智能實驗室(CSAIL)的研究生。“但是,實際上,軟物體可能會自然彎曲。我們發(fā)現(xiàn)可以在低維描述中非常緊湊地描述軟機器人的自然狀態(tài)。通過學(xué)習(xí)對可能狀態(tài)的良好描述,我們優(yōu)化了軟機器人的控制和設(shè)計。”

在仿真中,該模型使2D和3D軟機器人能夠比當前最新技術(shù)更快,更準確地完成任務(wù),例如移動一定距離或到達目標位置。研究人員接下來計劃在真正的軟機器人中實施該模型。

優(yōu)化軟機器人以執(zhí)行特定任務(wù)是一個巨大的計算問題

CSAIL的研究生Allan Zhao,Tao Du和Huyuanming則是與Spielberg一同加入本文的人。CSAIL總監(jiān)Daniela Rus以及電機工程和計算機科學(xué)系的Andrew and Erna Viterbi教授;麻省理工學(xué)院電氣工程和計算機科學(xué)副教授,計算制造小組負責人Wojciech Matusik。

“在環(huán)學(xué)習(xí)”

軟機器人技術(shù)是一個相對較新的研究領(lǐng)域,但它對高級機器人技術(shù)有希望。例如,柔性車身可以提供與人類更安全的交互,更好的對象操縱和更大的可操縱性,以及其他好處。

在仿真中對機器人的控制依賴于一個“觀察者”,它是一個計算變量的程序,該變量可查看軟機器人如何移動以完成任務(wù)。在先前的工作中,研究人員將軟機器人分解為手工設(shè)計的模擬粒子簇。粒子包含重要信息,有助于縮小機器人的可能運動范圍。例如,如果機器人試圖以某種方式彎曲,則執(zhí)行器可能會對該移動進行足夠的抵抗,以至于可以忽略不計。但是,對于這種復(fù)雜的機器人,在仿真過程中手動選擇要跟蹤的集群可能很棘手。

在這項工作的基礎(chǔ)上,研究人員設(shè)計了一種“循環(huán)中學(xué)習(xí)優(yōu)化”方法,其中,所有優(yōu)化參數(shù)都是在多次模擬的單個反饋循環(huán)中學(xué)習(xí)的。而且,在學(xué)習(xí)優(yōu)化(或“在循環(huán)中”)的同時,該方法還可以學(xué)習(xí)狀態(tài)表示。

該模型采用一種稱為“材料點方法”(MPM)的技術(shù),該技術(shù)可模擬被背景網(wǎng)格包圍的連續(xù)材料(例如泡沫和液體)顆粒的行為。這樣,它無需任何額外的計算就可以將機器人的粒子及其可觀察的環(huán)境捕獲為像素或3D像素(稱為體素)。

在學(xué)習(xí)階段,此原始粒子網(wǎng)格信息被饋送到機器學(xué)習(xí)組件,該組件學(xué)習(xí)輸入圖像,將其壓縮為低維表示,然后將表示解壓縮回輸入圖像。如果此“自動編碼器”在壓縮輸入圖像時保留了足夠的細節(jié),則可以從壓縮中準確地重新創(chuàng)建輸入圖像。

優(yōu)化軟機器人以執(zhí)行特定任務(wù)是一個巨大的計算問題

在研究人員的工作中,自動編碼器學(xué)習(xí)到的壓縮表示形式用作機器人的低維狀態(tài)表示形式。在優(yōu)化階段,該壓縮表示形式將返回到控制器,該控制器將為機器人的每個粒子在下一個MPM模擬步驟中應(yīng)如何運動輸出計算出的驅(qū)動力。

同時,控制器使用該信息來調(diào)整每個粒子的最佳剛度,以實現(xiàn)其所需的運動。將來,該材料信息可能會用于3D打印軟機器人,在該3D打印軟機器人中,每個粒子點的打印硬度可能會略有不同。斯皮爾伯格說:“這允許根據(jù)機器人的動作創(chuàng)建與特定任務(wù)相關(guān)的機器人設(shè)計。” “通過一起學(xué)習(xí)這些參數(shù),您可以使所有內(nèi)容盡可能地保持同步,從而使設(shè)計過程更加容易。”

優(yōu)化軟機器人以執(zhí)行特定任務(wù)是一個巨大的計算問題

優(yōu)化更快

依次將所有優(yōu)化信息反饋到循環(huán)的起點,以訓(xùn)練自動編碼器。在許多模擬中,控制器學(xué)習(xí)最佳運動和材料設(shè)計,而自動編碼器學(xué)習(xí)越來越詳細的狀態(tài)表示。斯皮爾伯格說:“關(guān)鍵是我們希望低維狀態(tài)具有很好的描述性。”

機器人在設(shè)定的時間段內(nèi)達到其模擬的最終狀態(tài)(例如,盡可能接近目標位置)后,將更新“損失函數(shù)”。這是機器學(xué)習(xí)的重要組成部分,它試圖最大程度地減少一些錯誤。在這種情況下,它可以使機器人距目標的距離最小化。該損失函數(shù)流回到控制器,該控制器使用誤差信號調(diào)整所有優(yōu)化的參數(shù),以最好地完成任務(wù)。

斯皮爾伯格說,如果研究人員試圖將模擬的所有原始粒子直接送入控制器,而沒有壓縮步驟,則“運行和優(yōu)化時間將會激增”。使用壓縮表示,研究人員能夠?qū)⒚看蝺?yōu)化迭代的運行時間從幾分鐘減少到大約10秒。

研究人員通過對各種2D和3D兩足動物和四足機器人的仿真驗證了他們的模型。他們的研究人員還發(fā)現(xiàn),雖然使用傳統(tǒng)方法的機器人最多可以進行30,000個仿真來優(yōu)化這些參數(shù),但是在模型上訓(xùn)練的機器人僅進行了約400個仿真。

優(yōu)化軟機器人以執(zhí)行特定任務(wù)是一個巨大的計算問題

“我們的目標是實現(xiàn)工程師從規(guī)格到軟機器人的設(shè)計,原型設(shè)計和編程的方式上的飛躍。在本文中,我們探索了共同優(yōu)化軟機器人的主體和控制系統(tǒng)的潛力,可以引領(lǐng)軟機器人的發(fā)展??焖賱?chuàng)建根據(jù)其任務(wù)定制的軟體機器人。” Rus說。

將模型部署到實際的軟機器人中意味著解決現(xiàn)實噪聲和不確定性問題,這可能會降低模型的效率和準確性。但是,將來,研究人員希望為軟機器人設(shè)計從仿真到制造的完整流水線。

分享

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。