一種用于增強機器人在操縱任務上的性能的系統(tǒng)

2020-01-29 11:05:25    來源:    作者:

在過去的十年左右的時間里,機器學習的進步推動了自動駕駛系統(tǒng),虛擬助手和移動機器人等系統(tǒng)的發(fā)展,這些系統(tǒng)越來越具有自主性。除其他事項外,開發(fā)自主系統(tǒng)的研究人員需要找出方法來集成旨在解決不同但又互補的子任務的組件。

一種用于增強機器人在操縱任務上的性能的系統(tǒng)

例如,在人類用戶家中完成手動任務的機器人應該能夠感知其環(huán)境中的對象,同時還可以獲取有關這些對象的信息,這些信息隨后可用于計劃其動作和動作。這個過程也被稱為“感知-認知-行動”范例,具有至關重要的意義,因為它最終使機器人能夠提出有用的策略并有效地完成任務。

到目前為止,大多數(shù)在機器人中實現(xiàn)這種感知-認知-行動范例的方法都將這三個任務視為幾乎完全獨立的模塊,彼此之間互為黑匣子。但是,不來梅大學和德國慕尼黑大學的一組研究人員認為,將機器人的“感知”系統(tǒng)與其認知(即“推理”或檢索周圍環(huán)境中物體信息的能力)聯(lián)系起來可以大大改善其整體性能。

一種用于增強機器人在操縱任務上的性能的系統(tǒng)

考慮到這一點,研究人員最近開發(fā)了一種認知感知系統(tǒng),可以增強移動機器人在日常操縱任務中的性能。這個被稱為ROBOSHERLOCK的系統(tǒng)通過內容分析(CA)獲得感知,該策略需要使用統(tǒng)計方法來分析大量數(shù)據(jù)。

ROBOSHERLOCK分析的數(shù)據(jù)是“非結構化”的,因為其結構不能像在數(shù)據(jù)庫或電子表格中那樣反映與之關聯(lián)的語義。因此,該系統(tǒng)使用一種稱為非結構化信息管理(UIM)的策略,這實質上意味著它可以使用一組信息提取算法來處理大量非結構化數(shù)據(jù)(例如,文本文檔,音頻文件,圖像等)。這些算法中的每一種都根據(jù)其“專業(yè)知識”提取不同類型的知識,隨后對其進行評級和組合以得出一個一致的決策。

研究人員在論文中寫道:“在ROBOSHERLOCK中,對現(xiàn)實場景的感知和解釋被制定為非結構化信息管理(UIM)問題。” “ UIM原理的應用支持感知系統(tǒng)的實施,該感知系統(tǒng)可以回答與場景中對象有關的任務相關查詢,通過結合多種感知算法的優(yōu)勢來提高對象識別性能,支持基于知識的對象推理,并實現(xiàn)自動和知識驅動的處理管道生成。”

一種用于增強機器人在操縱任務上的性能的系統(tǒng)

研究人員通過一系列測試評估了他們的框架,并將其應用于現(xiàn)實世界場景感知的不同系統(tǒng)。他們發(fā)現(xiàn),“推理”有關(即處理)通過其算法檢索到的背景知識可以使ROBOSHERLOCK回答各種各樣的問題,而在周圍環(huán)境中則是可以直接感知到的。

研究人員在最近的研究中介紹的ROBOSHERLOCK組件可被視為其核心功能。隨后,研究人員還開發(fā)了一些擴展,以增強系統(tǒng)的認知能力。例如,他們創(chuàng)建了一個擴展,該擴展允許系統(tǒng)同時檢測人類和物體,從而推斷人類正在執(zhí)行的動作以及這些動作的意圖。

研究人員在論文中寫道:“最近,我們已經研究了ROBOSHERLOCK框架如何使代理能夠'夢想',并使用最先進的游戲引擎生成任務的變體并學習新的感知模型。” “所有這些擴展都是從機器人執(zhí)行任務的角度著眼于機器人感知,如果沒有此處介紹的核心框架,這是不可能的。”

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。