谷歌AI發(fā)布TensorFlow 3D

2021-02-13 13:18:24 來(lái)源：新經(jīng)網(wǎng) 作者：阿威

根據(jù)Google的聲明，近幾年來(lái)3D傳感器（如激光雷達(dá)，深度感應(yīng)攝像頭和雷達(dá)）的增長(zhǎng)，導(dǎo)致需要一種可以處理這些設(shè)備捕獲的數(shù)據(jù)的場(chǎng)景理解技術(shù)。Google認(rèn)為，這種需求技術(shù)可以使使用這些傳感器的機(jī)器學(xué)習(xí)系統(tǒng)（例如自動(dòng)駕駛汽車和機(jī)器人）在現(xiàn)實(shí)世界中導(dǎo)航和操作，從而在移動(dòng)設(shè)備上創(chuàng)造增強(qiáng)的增強(qiáng)現(xiàn)實(shí)體驗(yàn)。

搜索引擎提供商Google指出，計(jì)算機(jī)視覺(jué)領(lǐng)域最近在理解3D風(fēng)景方面取得了良好的進(jìn)展，其中包括用于移動(dòng)3D對(duì)象檢測(cè)，透明對(duì)象檢測(cè)的模型等等。但是，該公司在其博客文章中指出，由于可用性工具和資源有限，可能難以在現(xiàn)場(chǎng)進(jìn)行操作。

科技巨頭Google已發(fā)布TensorFlow 3D，這是一個(gè)模塊化且高效的庫(kù)，旨在為TensorFlow帶來(lái)三維深度學(xué)習(xí)功能，以進(jìn)一步發(fā)展和改善對(duì)三維場(chǎng)景的理解，并減少感興趣的研究人員的進(jìn)入障礙。

由技術(shù)公司開(kāi)發(fā)的TensorFlow 3D庫(kù)允許更廣泛的研究社區(qū)開(kāi)發(fā)，訓(xùn)練和分發(fā)前沿的3D場(chǎng)景理解模型。此外，新庫(kù)提供了流行的交易，損失功能，數(shù)據(jù)處理工具，模型和指標(biāo)。

TF 3D還可以啟用其他潛在應(yīng)用程序，例如3D對(duì)象形狀預(yù)測(cè)，點(diǎn)云記錄和點(diǎn)云凝結(jié)。此外，它提供了統(tǒng)一的數(shù)據(jù)集功能和配置，用于訓(xùn)練和評(píng)估標(biāo)準(zhǔn)3D場(chǎng)景洞察數(shù)據(jù)集。

由Google在博客文章中宣布的新庫(kù)目前支持Waymo Open，ScanNet和Rio數(shù)據(jù)集。但是，用戶可以將其他流行的數(shù)據(jù)集(例如NuScenes和Kitti)自由轉(zhuǎn)換為相似的格式，并在預(yù)先存在的或定制的管道中使用它們。

Google還指出，用戶可以利用TF 3D進(jìn)行各種3D深度學(xué)習(xí)研究和應(yīng)用，通過(guò)快速構(gòu)建原型并嘗試新想法來(lái)實(shí)施實(shí)時(shí)推理系統(tǒng)。

要了解有關(guān)由Google創(chuàng)建的TensorFlow 3D的更多信息，以進(jìn)一步發(fā)展和改善對(duì)三維場(chǎng)景的理解，您可以訪問(wèn)Google發(fā)布的有關(guān)該主題的博客文章。

鄭重聲明：本文版權(quán)歸原作者所有，轉(zhuǎn)載文章僅為傳播更多信息之目的，如作者信息標(biāo)記有誤，請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除，多謝。

標(biāo)簽：AI 谷歌