這項聰明的技術可以幫助機器人識別和區(qū)分物體

2020-02-07 16:39:38    來源:    作者:

導航方法可以加快自主最后一英里的交付速度。

在不久的將來,可能會派遣機器人作為最后一英里的送貨車輛,在您可以找到門時,在您家門口放下您的外賣訂單,包裹或飯菜包。

這項聰明的技術可以幫助機器人識別和區(qū)分物體

機器人導航的標準方法包括提前繪制區(qū)域,然后使用算法將機器人引導至地圖上的特定目標或GPS坐標。盡管這種方法對于探索特定環(huán)境(例如特定建筑物的布局或計劃的障礙物路線)可能很有意義,但在最后一英里交付的情況下可能變得笨拙。

例如,想象一下,必須預先繪制機器人交付區(qū)域內(nèi)的每個鄰居,包括該鄰居內(nèi)每個房子的配置以及每個房子前門的特定坐標。這樣的任務可能難以擴展到整個城市,尤其是隨著房屋的外觀經(jīng)常隨季節(jié)變化而變化時。繪制每所房屋的地圖也可能會遇到安全和隱私問題。

現(xiàn)在,麻省理工學院的工程師已經(jīng)開發(fā)出一種導航方法,不需要提前繪制區(qū)域。取而代之的是,他們的方法使機器人能夠利用其環(huán)境中的線索來規(guī)劃到達目的地的路線,這可以用一般的語義術語(例如“前門”或“車庫”)來描述,而不是作為地圖上的坐標來描述。例如,如果指示機器人將包裹運送到某人的前門,則它可能會在道路上啟動并看到一條車道,該車道已經(jīng)過訓練,可以識別出可能通往人行道,進而又可能導致人行道到前門。

這項聰明的技術可以幫助機器人識別和區(qū)分物體

這項新技術可以大大減少機器人在確定目標之前花費在探索某處上的時間,而且它不依賴于特定住宅的地圖。

麻省理工學院機械工程系的研究生邁克爾·埃弗里特(Michael Everett)說:“我們不需要為每座需要參觀的建筑物繪制地圖。” “通過這種技術,我們希望將機器人放到任何車道的盡頭,讓它找到一扇門。”

埃弗里特(Everett)將在本周的國際智能機器人與系統(tǒng)會議上介紹該小組的成果。該論文由麻省理工學院的航空與航天學教授喬納森·霍(Jonathan How)和福特汽車公司的賈斯汀·米勒(Justin Miller)合著,是“認知機器人最佳論文”的決賽入圍者。

“對事物的感覺”

近年來,研究人員致力于將自然的語義語言引入機器人系統(tǒng),訓練機器人通過其語義標簽識別對象,以便他們可以視覺上將門當作門,例如,而不是簡單地作為堅固的矩形障礙物進行處理。 。

“現(xiàn)在,我們有能力使機器人實時了解事物的狀態(tài),”埃弗里特說。

Everett,How和Miller將類似的語義技術用作其新導航方法的跳板,該方法利用了現(xiàn)有的算法,這些算法從可視數(shù)據(jù)中提取特征,以生成同一場景的新地圖,以語義線索或上下文表示。

在他們的案例中,研究人員使用一種算法在機器人四處移動時使用每個對象的語義標簽和深度圖像來構建環(huán)境圖。該算法稱為語義SLAM(同步本地化和映射)。

盡管其他語義算法使機器人能夠識別并映射環(huán)境中的對象,但它們并不允許機器人在導航新環(huán)境時即以最有效的路徑到達語義目的地時做出決定。例如“前門”。

“在進行探索之前,先放下一個機器人,然后說'開始',它會四處走動并最終到達那里,但是速度會很慢,” How說。

成本去

研究人員希望通過語義,上下文彩色的世界來加快機器人的路徑規(guī)劃。他們開發(fā)了一種新的“待售成本估算器”,該算法將通過預先存在的SLAM算法創(chuàng)建的語義圖轉換為第二張圖,表示任何給定位置接近目標的可能性。

Everett說:“這是受到圖像到圖像轉換的啟發(fā),您可以在其中拍攝貓的照片并使它看起來像狗。” “在這里發(fā)生了相同類型的想法,您拍攝一張看起來像世界地圖的圖像,然后將其轉換為另一張看起來看起來像世界地圖的圖像,但是現(xiàn)在根據(jù)地圖上不同點的接近程度對其進行著色達到最終目標。”

這項聰明的技術可以幫助機器人識別和區(qū)分物體

此“成本計算”地圖以彩色著色,以將較暗的區(qū)域表示為遠離目標的位置,將較亮的區(qū)域表示為靠近目標的區(qū)域。例如,在語義地圖中以黃色編碼的人行道,可以通過成本核算算法轉換為新地圖中較暗的區(qū)域,而車道則在接近前門時逐漸變輕,新地圖中最亮的區(qū)域。

研究人員在來自Bing地圖的衛(wèi)星圖像上訓練了這種新算法,該圖像包含來自一個城市和三個郊區(qū)的77棟房屋。該系統(tǒng)將語義圖轉換為可使用的成本圖,并按照最輕的區(qū)域映射出最有效的路徑,直至最終目標。對于每個衛(wèi)星圖像,埃弗里特為典型的前院中的環(huán)境特征分配語義標簽和顏色,例如前門為灰色,車道為藍色,綠籬為綠色。

在此培訓過程中,團隊還對每個圖像應用了蒙版,以模仿機器人的攝像機經(jīng)過院子時可能具有的局部視圖。

“我們方法的部分技巧是[提供系統(tǒng)]許多局部圖像,” How解釋道。“因此,它真的必須弄清楚所有這些東西是如何相互關聯(lián)的。這就是使這項工作穩(wěn)定進行的部分原因。”

然后,研究人員在訓練數(shù)據(jù)集之外的一所全新房屋的圖像模擬中測試了他們的方法,首先使用預先存在的SLAM算法生成語義圖,然后使用其新的成本估算器生成第二張地圖和通往目標的路徑(在這種情況下為前門)。

該小組的新的成本管理技術發(fā)現(xiàn)前門的速度比經(jīng)典導航算法快了189%,后者沒有考慮上下文或語義,而是花了過多的步驟來探索不太可能達到其目標的區(qū)域。

埃弗里特(Everett)說,結果說明了即使在陌生,未映射的環(huán)境中,機器人也可以使用上下文有效地定位目標。

埃弗里特說:“即使機器人將包裹運送到從未去過的環(huán)境中,也可能會有與所見過的其他地方相同的線索。” “因此,世界的布局可能有所不同,但是可能存在一些共同點。”

這項研究得到福特汽車公司的部分支持。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。