向駕駛員顯示有關(guān)其路線的更多詳細(xì)信息通??梢詭椭麄?cè)谀吧奈恢脤?dǎo)航。例如,車(chē)道計(jì)數(shù)可以使GPS系統(tǒng)警告駕駛員偏離或合并車(chē)道。合并有關(guān)停車(chē)位的信息可以幫助駕駛員提前計(jì)劃,而繪制自行車(chē)道則可以幫助騎自行車(chē)的人談判繁忙的城市街道。提供有關(guān)道路狀況的最新信息也可以改善救災(zāi)計(jì)劃。
但是創(chuàng)建詳細(xì)的地圖是一個(gè)昂貴且耗時(shí)的過(guò)程,大部分由大公司(例如Google)完成,該過(guò)程會(huì)用綁在引擎蓋上的攝像頭向車(chē)輛發(fā)送來(lái)捕獲該區(qū)域道路的視頻和圖像。將其與其他數(shù)據(jù)結(jié)合可以創(chuàng)建準(zhǔn)確的最新地圖。但是,由于此過(guò)程很昂貴,因此世界上的某些地區(qū)被忽略了。
一種解決方案是在衛(wèi)星圖像上釋放機(jī)器學(xué)習(xí)模型(更易于定期獲取和更新),以自動(dòng)標(biāo)記道路特征。但是道路可能會(huì)被樹(shù)木和建筑物遮擋,這是一項(xiàng)艱巨的任務(wù)。麻省理工學(xué)院和QCRI研究人員在人工智能促進(jìn)協(xié)會(huì)會(huì)議上發(fā)表的一篇論文中描述了“ RoadTagger”,它使用神經(jīng)網(wǎng)絡(luò)架構(gòu)的組合來(lái)自動(dòng)預(yù)測(cè)后面的車(chē)道和道路類(lèi)型(住宅或高速公路)的數(shù)量障礙物。
在對(duì)美國(guó)20個(gè)城市的數(shù)字地圖上被遮擋的道路上測(cè)試RoadTagger時(shí),該模型對(duì)車(chē)道號(hào)的準(zhǔn)確度為77%,對(duì)推斷的道路類(lèi)型的準(zhǔn)確度為93%。研究人員還計(jì)劃使RoadTagger能夠預(yù)測(cè)其他特征,例如停車(chē)位和自行車(chē)道。
“最新的數(shù)字地圖來(lái)自大公司最關(guān)心的地方。如果您在他們不太在意的地方,則在地圖質(zhì)量方面處于劣勢(shì)。”合著者,電機(jī)工程和計(jì)算機(jī)科學(xué)系(EECS)的教授Sam Madden說(shuō)。以及計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的研究員。“我們的目標(biāo)是使生成高質(zhì)量數(shù)字地圖的過(guò)程自動(dòng)化,以便可以在任何國(guó)家/地區(qū)使用。”
該論文的共同作者是CSAIL研究生何松濤,F(xiàn)avyan Bastani和Edward Park。EECS本科生Satvat Jagwani;CSAIL教授Mohammad Alizadeh和Hari Balakrishnan教授;QCRI研究人員Sanjay Chawla,Sofiane Abbar和Mohammad Amin Sadeghi。
結(jié)合CNN和GNN
Madden說(shuō),QCRI所基于的Quatar“對(duì)于構(gòu)建數(shù)字地圖的大公司而言不是優(yōu)先事項(xiàng)”。然而,它正在不斷地建設(shè)新的道路,并改善舊的道路,尤其是為主辦2022年FIFA世界杯做準(zhǔn)備。
麥登說(shuō):“在訪問(wèn)卡塔爾時(shí),我們經(jīng)歷了Uber司機(jī)無(wú)法弄清楚自己要去哪里的經(jīng)歷,因?yàn)榈貓D太近了,” “如果導(dǎo)航應(yīng)用程序沒(méi)有正確的信息,那么對(duì)于諸如車(chē)道合并之類(lèi)的事情,這可能會(huì)令人沮喪甚至更糟。”
RoadTagger依賴(lài)于通常用于圖像處理任務(wù)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)和圖神經(jīng)網(wǎng)絡(luò)(GNN)的新穎組合。GNN在圖中連接的節(jié)點(diǎn)之間建立模型關(guān)系,并已廣泛用于分析諸如社交網(wǎng)絡(luò)和分子動(dòng)力學(xué)之類(lèi)的事物。該模型是“端到端”的,這意味著它僅饋送原始數(shù)據(jù)并自動(dòng)產(chǎn)生輸出,而無(wú)需人工干預(yù)。
CNN將目標(biāo)道路的原始衛(wèi)星圖像作為輸入。GNN將道路分為大約20米的路段(或“平鋪”)。每個(gè)圖塊都是一個(gè)單獨(dú)的圖形節(jié)點(diǎn),通過(guò)沿道路的線連接。對(duì)于每個(gè)節(jié)點(diǎn),CNN都會(huì)提取道路特征,并與其直接鄰居共享該信息。道路信息會(huì)沿著整個(gè)圖形傳播,每個(gè)節(jié)點(diǎn)都會(huì)收到其他每個(gè)節(jié)點(diǎn)有關(guān)道路屬性的信息。如果圖像中遮擋了某個(gè)圖塊,RoadTagger將使用道路上所有圖塊的信息來(lái)預(yù)測(cè)遮擋的背后。
研究人員說(shuō),這種組合架構(gòu)代表了更像人類(lèi)的直覺(jué)。假設(shè)四車(chē)道的道路的一部分被樹(shù)木遮擋,因此某些圖塊僅顯示兩條車(chē)道。人們可以輕易地推測(cè)出樹(shù)木背后隱藏著兩條車(chē)道。傳統(tǒng)的機(jī)器學(xué)習(xí)模型(例如CNN)僅提取單個(gè)圖塊的特征,最有可能預(yù)測(cè)被遮擋的圖塊是一條兩條車(chē)道。
他說(shuō):“人類(lèi)可以使用相鄰圖塊中的信息來(lái)猜測(cè)被遮擋的圖塊中的車(chē)道數(shù)量,但是網(wǎng)絡(luò)無(wú)法做到這一點(diǎn)。” “我們的方法試圖模仿人類(lèi)的自然行為,我們從CNN捕獲本地信息,從GNN捕獲全球信息,以做出更好的預(yù)測(cè)。”
學(xué)習(xí)權(quán)重
為了訓(xùn)練和測(cè)試RoadTagger,研究人員使用了稱(chēng)為OpenStreetMap的真實(shí)世界地圖數(shù)據(jù)集,該數(shù)據(jù)集使用戶可以編輯和管理全球數(shù)字地圖。他們從該數(shù)據(jù)集中,從包括波士頓,芝加哥,華盛頓和西雅圖在內(nèi)的20個(gè)美國(guó)城市的688平方公里地圖上收集了已確認(rèn)的道路屬性。然后,他們從Google Maps數(shù)據(jù)集中收集了相應(yīng)的衛(wèi)星圖像。
在培訓(xùn)中,RoadTagger學(xué)習(xí)了CNN和GNN的權(quán)重-這些權(quán)重為特征和節(jié)點(diǎn)連接分配了不同的重要性。CNN從圖塊的像素圖案中提取特征,而GNN沿圖傳播學(xué)習(xí)的特征。從道路的隨機(jī)選擇子圖中,系統(tǒng)學(xué)習(xí)預(yù)測(cè)每個(gè)圖塊的道路特征。這樣,它會(huì)自動(dòng)了解哪些圖像特征有用,以及如何沿圖傳播這些特征。例如,如果目標(biāo)圖塊具有不清晰的車(chē)道標(biāo)記,但是其相鄰圖塊具有四個(gè)具有清晰車(chē)道標(biāo)記的車(chē)道,并且共享相同的道路寬度,則目標(biāo)圖塊很可能也具有四個(gè)車(chē)道。在這種情況下,模型會(huì)自動(dòng)獲悉道路寬度是有用的圖像特征,因此,如果兩個(gè)相鄰的圖塊共享相同的道路寬度,
給定OpenStreetMap訓(xùn)練中未見(jiàn)的道路,該模型將道路分解為小塊,并使用其學(xué)習(xí)的權(quán)重進(jìn)行預(yù)測(cè)。該模型的任務(wù)是預(yù)測(cè)被遮擋的圖塊中的車(chē)道數(shù)量,該模型指出相鄰圖塊具有匹配的像素模式,因此共享信息的可能性很高。因此,如果這些圖塊具有四個(gè)車(chē)道,則被遮擋的圖塊也必須具有四個(gè)車(chē)道。
在另一個(gè)結(jié)果中,RoadTagger在合成的,極具挑戰(zhàn)性的道路中斷數(shù)據(jù)集中準(zhǔn)確預(yù)測(cè)了車(chē)道號(hào)。作為一個(gè)示例,具有兩個(gè)車(chē)道的立交橋覆蓋了具有四個(gè)車(chē)道的目標(biāo)道路的幾塊瓷磚。該模型檢測(cè)到立交橋的像素模式不匹配,因此它忽略了覆蓋圖塊上的兩條車(chē)道,準(zhǔn)確地預(yù)測(cè)了下面的四個(gè)車(chē)道。
研究人員希望使用RoadTagger來(lái)幫助人們快速驗(yàn)證并批準(zhǔn)對(duì)數(shù)據(jù)集(如OpenStreetMap)中基礎(chǔ)結(jié)構(gòu)的持續(xù)修改,其中許多地圖都不包含車(chē)道數(shù)或其他詳細(xì)信息。Bastani說(shuō),一個(gè)特別感興趣的地區(qū)是泰國(guó),那里的道路在不斷變化,但是數(shù)據(jù)集中幾乎沒(méi)有更新。
“曾經(jīng)被標(biāo)記為土路的道路已經(jīng)鋪好,所以最好繼續(xù)行駛,并且一些交叉路口已經(jīng)完全建成。每年都有變化,但是數(shù)字地圖已經(jīng)過(guò)時(shí)了。”他說(shuō)。“我們希望根據(jù)最新圖像不斷更新此類(lèi)道路屬性。”