根據(jù)Google的聲明,近幾年來(lái)3D傳感器(如激光雷達(dá),深度感應(yīng)攝像頭和雷達(dá))的增長(zhǎng),導(dǎo)致需要一種可以處理這些設(shè)備捕獲的數(shù)據(jù)的場(chǎng)景理解技術(shù)。Google認(rèn)為,這種需求技術(shù)可以使使用這些傳感器的機(jī)器學(xué)習(xí)系統(tǒng)(例如自動(dòng)駕駛汽車和機(jī)器人)在現(xiàn)實(shí)世界中導(dǎo)航和操作,從而在移動(dòng)設(shè)備上創(chuàng)造增強(qiáng)的增強(qiáng)現(xiàn)實(shí)體驗(yàn)。
搜索引擎提供商Google指出,計(jì)算機(jī)視覺(jué)領(lǐng)域最近在理解3D風(fēng)景方面取得了良好的進(jìn)展,其中包括用于移動(dòng)3D對(duì)象檢測(cè),透明對(duì)象檢測(cè)的模型等等。但是,該公司在其博客文章中指出,由于可用性工具和資源有限,可能難以在現(xiàn)場(chǎng)進(jìn)行操作。
科技巨頭Google已發(fā)布TensorFlow 3D,這是一個(gè)模塊化且高效的庫(kù),旨在為TensorFlow帶來(lái)三維深度學(xué)習(xí)功能,以進(jìn)一步發(fā)展和改善對(duì)三維場(chǎng)景的理解,并減少感興趣的研究人員的進(jìn)入障礙。
由技術(shù)公司開(kāi)發(fā)的TensorFlow 3D庫(kù)允許更廣泛的研究社區(qū)開(kāi)發(fā),訓(xùn)練和分發(fā)前沿的3D場(chǎng)景理解模型。此外,新庫(kù)提供了流行的交易,損失功能,數(shù)據(jù)處理工具,模型和指標(biāo)。
TF 3D還可以啟用其他潛在應(yīng)用程序,例如3D對(duì)象形狀預(yù)測(cè),點(diǎn)云記錄和點(diǎn)云凝結(jié)。此外,它提供了統(tǒng)一的數(shù)據(jù)集功能和配置,用于訓(xùn)練和評(píng)估標(biāo)準(zhǔn)3D場(chǎng)景洞察數(shù)據(jù)集。
由Google在博客文章中宣布的新庫(kù)目前支持Waymo Open,ScanNet和Rio數(shù)據(jù)集。但是,用戶可以將其他流行的數(shù)據(jù)集(例如NuScenes和Kitti)自由轉(zhuǎn)換為相似的格式,并在預(yù)先存在的或定制的管道中使用它們。
Google還指出,用戶可以利用TF 3D進(jìn)行各種3D深度學(xué)習(xí)研究和應(yīng)用,通過(guò)快速構(gòu)建原型并嘗試新想法來(lái)實(shí)施實(shí)時(shí)推理系統(tǒng)。
要了解有關(guān)由Google創(chuàng)建的TensorFlow 3D的更多信息,以進(jìn)一步發(fā)展和改善對(duì)三維場(chǎng)景的理解,您可以訪問(wèn)Google發(fā)布的有關(guān)該主題的博客文章。