在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌AI研發TensorFlow3D操作速度竟提高二十倍

新機器視覺 ? 來源:Google AI ? 作者:Google AI ? 2021-03-12 09:33 ? 次閱讀

導讀

Google AI發布了TensorFlow 3D,將3D深度學習能力引入TensorFlow,加入3D稀疏卷積網絡,在Waymo Open數據集上的實驗表明,這種實現比預先設計好的TensorFlow操作提速「20倍」。隨著自動駕駛汽車與機器人的深入發展,激光雷達、深度傳感攝像機、雷達等3D傳感器已經成為了獲取道路數據的必要設備。而利用這些傳感器的機器學習系統則顯得尤為重要,因為它可以幫助硬件在現實世界中進行導航等操作。

近期,包括目標檢測、透明目標檢測等模型的3D場景理解方面取得了很大進展,但是由于3D數據可用的工具和資源有限,這個領域仍面臨挑戰。

TensorFlow 3D:TensorFlow與3D深度學習合體

為了進一步提高對3D場景的建模,簡化研究人員的工作,Google AI發布了TensorFlow 3D (TF 3D) ,一個高度模塊化、高效的庫,旨在將3D深度學習能力引入TensorFlow. TF 3D提供了一系列當下常用的操作、損失函數、數據處理工具、模型和度量,使更多的研究團隊能夠開發、培訓和部署最先進的3D場景理解模型。TF 3D包含用于最先進的3D語義分割、3D目標檢測和3D實例分割的培訓和評估任務,還支持分布式訓練。

另外,TF 3D還支持其他潛在的應用,如三維物體形狀預測、點云配準和點云增密。此外,它提供了一個統一的數據集規范和訓練、評價標準三維場景理解數據集的配置。

目前,TF 3D支持Waymo Open、 ScanNet和Rio數據集。然而,用戶可以自由地將其他流行的數據集,如NuScenes和Kitti,轉換成類似的格式,并將其用于已有或自定義的pipeline模型中,還可以利用TF 3D進行各種3D深度學習研究和應用,從快速原型設計到部署實時推理系統。

左邊顯示的是TF 3D中3D物體檢測模型在Waymo Open Dataset的一幀畫面上的輸出示例。右邊是ScanNet數據集上3D實例分割模型的輸出示例。

在這里,我們將介紹在TF 3D中提供的高效且可配置的稀疏卷積骨干,這是在各種3D場景理解任務中獲得最先進結果的關鍵。此外,我們將逐一介紹TF 3D目前支持的3個流水線任務: 3D語義分割、3D目標檢測分割和3D實例分割。

3D稀疏卷積網絡

傳感器采集到的3D數據通常包含一個場景,該場景包含一組感興趣的物體(如汽車、行人等),其周圍大多是開放空間。所以,3D數據本質上是稀疏的。在這樣的環境中,卷積的標準實現將需要大量的計算、消耗大量的內存。因此,在TF 3D 中,我們采用了流形稀疏卷積(submanifold sparse convolution)和池操作,這些操作可以更有效地處理3D稀疏數據。稀疏卷積模型是大多數戶外自動駕駛(如Waymo,NuScenes)和室內基準測試(如 ScanNet)中應用的sota方法的關鍵。

谷歌還應用了各種CUDA技術來加快計算速度(如hash、在共享內存中分區/緩存過濾器以及使用位操作)。在Waymo Open數據集上的實驗表明,這種實現比預先設計好的TensorFlow操作要快「20倍」左右。

圖源:Waymo Open Dataset on GitHub

然后,TF 3D使用3D流形稀疏U-Net架構來提取每個voxel的特征。通過讓網絡提取粗細特征并將它們組合起來進行預測,U-Net架構已被證明是有效的。

U-Net網絡由編碼器、瓶頸和解碼器三個模塊組成,每個模塊都由許多稀疏卷積塊組成,并可能進行池化或非池化操作。

一個3D稀疏體素U-Net架構。注意,一個水平的箭頭接收體素特征,并對其應用流形稀疏卷積。向下移動的箭頭會執行流形稀疏池化。向上移動的箭頭將收集池化的特征,與水平方向箭頭的特征進行concat,并對concat后的特征進行流形稀疏卷積。

上述稀疏卷積網絡是TF 3D提供的3D場景理解pipeline模型的backbone。

下面描述的每個模型使用這個骨干網絡提取稀疏體素特征,然后添加一個或多個額外的預測頭來推斷感興趣的任務。

用戶可以通過改變編碼器/解碼器層數和每層卷積的數量來配置U-Net網絡,并通過修改卷積濾波器的尺寸,從而能夠通過不同的網絡配置來權衡的速度和精度。

三維語義分割

三維語義分割模型只有一個輸出,用于預測每一個點的語義分數,將其映射回點,預測每一個點的語義標簽從ScanNet數據集對室內場景進行3D語義分割。

三維實例分割

在三維實例分割中,除了要預測語義,更重要的是將同一對象的體素組合在一起。在TF 3D中使用的3D實例分割算法是基于用深度度量學習方法進行的2D圖像分割工作。這種模型預測能預測每個體素的實例嵌入向量以及每個體素的語義評分。

實例嵌入向量將體素映射到一個嵌入空間,其中對應于同一對象實例的體素相距很近,而對應于不同對象的體素相距很遠。在這種情況下,輸入是一個點云而不是一個圖像,并且他將使用一個三維稀疏網絡而不是一個二維圖像網絡。在推理過程中利用貪心算法選取實例種子,并利用體素嵌入的距離函數將不同的體素聚合到對應的實例上去。

三維目標檢測

目標檢測模型可以預測每個體素的大小、中心和旋轉矩陣以及對象的語義評分。在推理時,推選機制將給出的多個候選框處理為少數幾個精確的3D目標框。在訓練時使用了預測與GT間的Huber Loss距離來計算損失。由于利用大小、中心和旋轉矩陣估算框邊角是可差分過程,損失可以自然地傳遞到預測過程的權重中。研究人員利用動態框分類損失來對預測的框進行正例和負例進行區分。

ScanNet數據集上的3D物體檢測結果

TF 3D只是市場上的3D深度學習擴展之一。2020年,Facebook推出了PyTorch3D,專注于3D渲染和虛擬現實。另一個是英偉達的Kaolin,這是一個模塊化的可分辨渲染的應用,如高分辨率模擬環境。

從這個概述來看,TF 3D應用程序似乎更專注于機器人感知和映射,而其他選項則更專注于3D模擬和渲染。為了實現3D渲染,Google推出了TensorFlow Graphics.

參考資料

https://ai.googleblog.com/2021/02/3d-scene-understanding-with-tensorflow.html

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    2878

    瀏覽量

    107538
  • tensorflow
    +關注

    關注

    13

    文章

    329

    瀏覽量

    60536

原文標題:提速20倍!谷歌AI發布TensorFlow 3D,智能汽車場景親測好用

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    中興通訊全場景AI終端應用與裸眼3D新品亮相

    ”的產品戰略與理念,終端業務六大AI主題展示吸引了眾多關注,內容覆蓋全球領先的AI裸眼3DAI同聲傳譯和方言互譯、AI安全反詐、
    的頭像 發表于 10-15 10:00 ?879次閱讀

    谷歌Gemini 1.5 Flash模型升級,AI聊天速度飆升50%

    谷歌近期對其Gemini AI系列進行了重大更新,推出了Gemini 1.5 Flash模型。此次升級的核心亮點在于顯著提升了AI聊天的響應速度,官方宣稱最高可達50%的增速,為用戶帶
    的頭像 發表于 09-06 18:06 ?757次閱讀

    stm32mp135d的板子可不可以跑tensorflow的模型啊?

    請問是stm32mp135d的板子可不可以跑tensorflow的模型啊?
    發表于 07-18 06:49

    tensorflow和pytorch哪個更簡單?

    TensorFlow和PyTorch都是用于深度學習和機器學習的開源框架。TensorFlow由Google Brain團隊開發,而PyTorch由Facebook的AI研究團隊開發。 易用性:
    的頭像 發表于 07-05 09:45 ?870次閱讀

    TensorFlow的定義和使用方法

    TensorFlow是一個由谷歌人工智能團隊谷歌大腦(Google Brain)開發和維護的開源機器學習庫。它基于數據流編程(dataflow programming)的概念,將復雜的數學運算表示為
    的頭像 發表于 07-02 14:14 ?780次閱讀

    微軟被曝將AI研發外包給OpenAI

    網絡安全公司Okta的首席執行官托德·麥金農(Todd McKinnon)在CNBC的專訪中分享了關于當前科技巨頭在人工智能(AI)領域的戰略布局的見解。他特別指出,谷歌在捍衛其搜索引擎霸主地位的同時,正努力保持AI
    的頭像 發表于 06-12 15:57 ?378次閱讀

    谷歌CEO皮查伊探討AI革命:影響深遠,AI將融入日常工作

    在訪談中,主持人首先詢問皮查伊為何選擇使用谷歌AI,他回應稱,AI將對我們的生活產生深遠影響。“AI的應用多種多樣,能提升用戶體驗,簡化工作流程,還能與
    的頭像 發表于 05-28 15:00 ?580次閱讀

    谷歌推出Trillium AI芯片,性能提高近5倍

    谷歌推出了其最新的人工智能數據中心芯片——Trillium。這款芯片是谷歌的第六代產品,與上一代TPU v5e相比,Trillium在每個芯片上的峰值計算性能提高了4.7倍,節能67%以上。
    的頭像 發表于 05-16 10:39 ?780次閱讀

    谷歌錢包提高適配門檻,部分舊機型無法使用

    谷歌錢包是谷歌專為安卓設備研發的支付應用,用戶可借助NFC和商店通行證/門票實現快捷支付功能。目前,谷歌錢包要求設備至少搭載Android 9及以上版本
    的頭像 發表于 05-13 15:31 ?559次閱讀

    谷歌DeepMind推出新一代藥物研發AI模型AlphaFold 3

    谷歌DeepMind公司近日重磅推出了一款名為AlphaFold 3的全新藥物研發AI模型,這一創新技術將為科學家們提供前所未有的幫助,使他們能更精確地理解疾病機制,進而開發出更高效的
    的頭像 發表于 05-10 09:35 ?396次閱讀

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開發的用于機器學習和人工智能的軟件框架,其中最著名的是TensorFlowTensorFlow是一個開源的機器學習框架,由
    的頭像 發表于 03-01 16:25 ?883次閱讀

    谷歌模型合成工具怎么用

    谷歌模型合成工具主要是指Dreamfusion,這是Google的大型AI圖像模型Imagen與NeRF的3D功能相結合的一種技術。Dreamfusion是Dream Fields的演變,Dream Fields是
    的頭像 發表于 02-29 17:33 ?800次閱讀

    谷歌DeepMind推新AI模型Genie,能生成2D游戲平臺

    據報道,谷歌公司的DeepMind團隊近期發布了AI模型Genie,此模型擁有多達110億個參數,能夠依據用戶提供的圖片及提示詞創建出相當完整的2D游戲場景。
    的頭像 發表于 02-27 14:53 ?785次閱讀

    谷歌推出AI擴散模型Lumiere

    近日,谷歌研究院重磅推出全新AI擴散模型Lumiere,這款模型基于谷歌自主研發的“Space-Time U-Net”基礎架構,旨在實現視頻生成的一次性完成,同時保證視頻的真實性和動作
    的頭像 發表于 02-04 13:49 ?1039次閱讀

    AMD發布適用于Linux系統的XDNA驅動,助力APU AI引擎

    AMD于去年推出了Ryzen 7040“鳳凰城”系列APU,其中首次搭載了基于Xilinx IP的XDNA架構AI引擎。借助此引擎,PyTorch和TensorFlow等機器學習框架的運行速度得以顯著
    的頭像 發表于 01-30 14:04 ?954次閱讀
    主站蜘蛛池模板: 三级特黄视频| 黄频网站免费大全在线观看| 国产专区日韩精品欧美色| 日本黄黄| 久久久久国产一级毛片高清板| 日本中文字幕在线播放| 91p0rn永久备用地址二| 性欧美1819| 手机在线黄色网址| 丁香六月在线观看| 1024手机看片国产| 五月天情网| 一丝不遮视频免费观看| 黄色的网站在线观看| 色播六月| 天天操天天射天天色| 轻点灬大ji巴太粗太长了爽文| 欧美日韩一级视频| 手机视频在线播放| 99久久国产综合精品国| 久久精品亚瑟全部免费观看| 久久伊人影视| 亚洲ay| 一区二区精品| 日本免费一区视频| 久久99精品久久久久久臀蜜桃| 国产综合在线观看| 亚洲jizzjizz在线播放久| 91高清在线成人免费观看| 在线观看一区二区三区四区| 欧美性生交xxxxx久久久| 欧美天天| 性做久久久久久久久| aaaaaaaaa在线观看| 色女人综合| 国产婷婷综合丁香亚洲欧洲 | 四虎影永久在线观看网址| 夜夜操网站| 综合网 色天使| 在线视频久久| 久久精品人人爽人人爽快|