新的深度學(xué)習(xí)研究打破了自動(dòng)駕駛汽車圖像識(shí)別能力的記錄

2020-05-17 14:10:39 來源：新經(jīng)網(wǎng) 作者：馮思韻

人，自行車，汽車或道路，天空，草地：圖像的哪些像素代表無人駕駛汽車前的不同前景人物或物體，哪些像素代表背景類別?這項(xiàng)稱為全景分割的任務(wù)是一個(gè)基本問題，已在許多領(lǐng)域中應(yīng)用，例如自動(dòng)駕駛汽車，機(jī)器人技術(shù)，增強(qiáng)現(xiàn)實(shí)，甚至在生物醫(yī)學(xué)圖像分析中。在弗萊堡大學(xué)計(jì)算機(jī)科學(xué)系，Abhinav Valada博士是機(jī)器人學(xué)習(xí)的助理教授，也是BrainLinks-BrainTools的成員，他專注于這個(gè)研究問題。Valada和他的團(tuán)隊(duì)開發(fā)了最先進(jìn)的“ EfficientPS”人工智能(AI)模型，該模型可以更快，更有效地對(duì)視覺場(chǎng)景進(jìn)行連貫識(shí)別。

這項(xiàng)任務(wù)通常使用稱為深度學(xué)習(xí)的機(jī)器學(xué)習(xí)技術(shù)來解決，其中人工神經(jīng)網(wǎng)絡(luò)弗賴堡研究人員解釋說，它們是從人腦中汲取靈感，從大量數(shù)據(jù)中學(xué)習(xí)。諸如Cityscapes之類的公共基準(zhǔn)在衡量這些技術(shù)的進(jìn)步方面起著重要作用。Valada團(tuán)隊(duì)的成員Rohit Mohan說：“多年來，來自Google或Uber的研究團(tuán)隊(duì)一直在這些基準(zhǔn)測(cè)試中爭(zhēng)奪榜首。” 來自弗萊堡(Freiburg)的計(jì)算機(jī)科學(xué)家的方法已被開發(fā)出來，用于理解城市的城市場(chǎng)景，在“城市景觀”(Cityscapes)中排名第一，Cityscapes是最有影響力的自動(dòng)駕駛場(chǎng)景理解研究的排行榜。EfficientPS還始終在其他標(biāo)準(zhǔn)基準(zhǔn)數(shù)據(jù)集(例如KITTI，Mapillary Vistas和IDD)上設(shè)置新的最新技術(shù)。

在項(xiàng)目網(wǎng)站上，Valada展示了團(tuán)隊(duì)如何在各種數(shù)據(jù)集上訓(xùn)練不同AI模型的示例。結(jié)果疊加在相應(yīng)的輸入圖像上，其中顏色顯示模型將像素分配給的對(duì)象類別。例如，汽車標(biāo)記為藍(lán)色，人物標(biāo)記為紅色，樹木標(biāo)記為綠色，建筑物標(biāo)記為灰色。此外，AI模型還在每個(gè)被視為獨(dú)立實(shí)體的對(duì)象周圍繪制邊框。弗萊堡大學(xué)的研究人員成功地訓(xùn)練了該模型，以將所學(xué)的城市場(chǎng)景信息從斯圖加特轉(zhuǎn)移到紐約市。盡管AI模型不知道美國(guó)的城市長(zhǎng)什么樣，但它能夠準(zhǔn)確識(shí)別紐約市的場(chǎng)景。

Valada解釋說，以前解決該問題的大多數(shù)方法都具有較大的模型尺寸，并且在實(shí)際應(yīng)用中(例如受資源嚴(yán)重限制的機(jī)器人技術(shù))在計(jì)算上非常昂貴，“我們的EfficientPS不僅可以實(shí)現(xiàn)最新的性能，而且這也是計(jì)算效率最高，最快的方法。這進(jìn)一步擴(kuò)展了可以使用EfficientPS的應(yīng)用程序。”

鄭重聲明：本文版權(quán)歸原作者所有，轉(zhuǎn)載文章僅為傳播更多信息之目的，如作者信息標(biāo)記有誤，請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除，多謝。

標(biāo)簽：AI 自動(dòng)駕駛汽車