3.2.4語義分割
圖3-7所示為機器視覺語義分割示例。
計算機視覺的核心是分割,它將整個圖像分成一個個像素組,然后對其進行標記和分類。語義分割試圖在語義上理解圖像中每個像素的角色(例如,識別它是道路、汽車還是其他類別)。如圖3-7所示,除識別人、道路、汽車、樹木等外,還必須確定每個物體的邊界。因此,與分類不同,需要用模型對密集的像素進行預測。
與其他計算機視覺任務一樣,卷積神經網絡在分割任務上取得了巨大成功。最流行的原始方法之一是通過滑動窗口進行塊分類,利用每個像素周圍的圖像塊,對每個像素
分別進行分類。但是其計算效率非常低,因為我們不能在重疊塊之間重用共享特征。解決方案之一就是加州大學伯克利分校提出的全卷積網絡(FCN),它提出了端到端的卷積神經網絡體系結構,在沒有任何全連接層的情況下進行密集預測,如圖3-8所示。
圖3-8 全卷積網絡(FCN)實現像素分類演示
這種方法允許針對任何尺寸的圖像生成分割映射,并且比塊分類算法快得多,幾乎后續所有的語義分割算法都采用了這種范式。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
智慧燈桿
+關注
關注
1文章
810瀏覽量
11722
發布評論請先 登錄
相關推薦
圖像分割與語義分割中的CNN模型綜述
圖像分割與語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡(CNN)作為深度學習的
智慧燈桿未來發展
智慧燈桿作為智慧城市建設的重要組成部分,以其獨特的功能和優勢正逐漸融入人們的日常生活中。隨著科技的不斷進步和人們對城市生活質量的要求不斷提高,智慧
評論