欢乐颂小说,玄幻小说完本,怎样写网络小说

圖像分割（Image Segmentation）是計(jì)算機(jī)視覺領(lǐng)域中的一項(xiàng)重要基礎(chǔ)技術(shù)，是圖像理解中的重要一環(huán)。近日，數(shù)據(jù)科學(xué)家Derrick Mwiti在一篇文章中，就什么是圖像分割、圖像分割架構(gòu)、圖像分割損失函數(shù)以及圖像分割工具和框架等問題進(jìn)行了討論，讓我們一探究竟吧。

什么是圖像分割?

顧名思義，這是將一個(gè)圖像分割成多個(gè)片段的過程。在這個(gè)過程中，圖像中的每個(gè)像素都與一個(gè)對(duì)象類型相關(guān)聯(lián)。圖像分割主要有兩種類型:語義分割和實(shí)例分割。

在語義分割中，同一類型的所有對(duì)象都使用一個(gè)類標(biāo)簽進(jìn)行標(biāo)記，而在實(shí)例分割中，相似的對(duì)象使用各自獨(dú)立的標(biāo)簽。

?

圖像分割的體系結(jié)構(gòu)

圖像分割的基本結(jié)構(gòu)包括編碼器和解碼器。

?

編碼器通過過濾器從圖像中提取特征。解碼器負(fù)責(zé)生成最終的輸出，通常是一個(gè)包含對(duì)象輪廓的分割掩碼。大多數(shù)體系結(jié)構(gòu)都有這種結(jié)構(gòu)或其變體，看幾個(gè)例子：

U-Net

U-Net是最初用于分割生物醫(yī)學(xué)圖像的卷積神經(jīng)網(wǎng)絡(luò)。可視化時(shí)，其架構(gòu)看起來像字母U，因此名稱為U-Net。

它的體系結(jié)構(gòu)由兩部分組成，左邊部分是收縮路徑，右邊部分是擴(kuò)展路徑。收縮路徑的目的是捕獲上下文，而擴(kuò)展路徑的作用是幫助精確定位。

?

U-Net由右邊的擴(kuò)展路徑和左邊的收縮路徑組成。收縮路徑由兩個(gè)3×3的卷積組成，卷積之后是一個(gè)整流的線性單元和一個(gè)用于降采樣的兩乘二最大池計(jì)算。

FastFCN —Fast Fully-connected network

在這種結(jié)構(gòu)中，聯(lián)合金字塔上采樣(JPU)模塊被用來代替擴(kuò)展卷積，因?yàn)樗鼈兿拇罅康膬?nèi)存和時(shí)間。它的核心是一個(gè)全連接網(wǎng)絡(luò)，同時(shí)使用JPU進(jìn)行上采樣。JPU將低分辨率特征圖提升為高分辨率特征圖。

?

Gated-SCNN

該架構(gòu)由雙流CNN架構(gòu)組成。在此模型中，一個(gè)單獨(dú)的分支用于處理圖像形狀信息。形狀流用于處理邊界信息。

?

DeepLab

在這種結(jié)構(gòu)中，卷積與上采樣濾波器用于涉及密集預(yù)測(cè)的任務(wù)。多個(gè)對(duì)象的分割是通過空間金字塔池來完成的。

最后，用DCNNs改進(jìn)對(duì)象邊界的定位。通過插入零點(diǎn)或?qū)斎胩卣鲌D進(jìn)行稀疏采樣來對(duì)濾波器進(jìn)行上采樣，從而實(shí)現(xiàn)空洞卷積。

?

可以在PyTorch或TensorFlow上嘗試其實(shí)現(xiàn)。

Mask R-CNN

在這種體系結(jié)構(gòu)中，使用bounding box和語義分割對(duì)對(duì)象進(jìn)行分類和定位，并將每個(gè)像素分類為一組類別。每個(gè)感興趣的區(qū)域都有一個(gè)分割掩碼，最終的輸出是一個(gè)類標(biāo)簽和一個(gè)bounding box。

該體系結(jié)構(gòu)是Faster R-CNN的擴(kuò)展，F(xiàn)aster R-CNN由提出區(qū)域的深度卷積網(wǎng)絡(luò)和利用區(qū)域的檢測(cè)器組成。

這是在COCO測(cè)試集上得到的結(jié)果的圖像

?

圖像分割損失函數(shù)

語義分割模型在訓(xùn)練過程中通常使用一個(gè)簡(jiǎn)單的交叉熵?fù)p失函數(shù)。但是，如果對(duì)獲取圖像的粒度信息感興趣，則必須恢復(fù)到稍微高級(jí)一些的損失函數(shù)，來看幾個(gè)例子：

Focal Loss

這種損失是對(duì)標(biāo)準(zhǔn)交叉熵準(zhǔn)則的改進(jìn)。這是通過改變其形狀來實(shí)現(xiàn)的，使得分配給分類良好的示例的損失權(quán)重降低了。最終，確保不存在類不平衡。

在這個(gè)損失函數(shù)中，交叉熵?fù)p失是會(huì)隨著縮放系數(shù)衰減為零而縮，訓(xùn)練時(shí)，比例因數(shù)自動(dòng)降低了簡(jiǎn)單示例的權(quán)重，并將重點(diǎn)放在困難示例上。

?

Dice loss

該損失是通過計(jì)算平滑dice coefficient函數(shù)獲得的。這種損失是最常用的損失，是分割問題。

?

Intersection over Union (IoU)-balanced Loss

IoU平衡分類損失的目的是增加高IoU樣本的梯度，降低低IoU樣本的梯度。從而提高了機(jī)器學(xué)習(xí)模型的定位精度。

?

Boundary loss

Boundary loss的一種變體應(yīng)用于具有高度不平衡分段的任務(wù)。

這種損失的形式是空間輪廓而非區(qū)域上的距離度量。通過這種方式，它解決了高度不平衡的分割任務(wù)的區(qū)域損失所帶來的問題。

Weighted cross-entropy

在交叉熵的一個(gè)變體中，所有正例均按一定系數(shù)加權(quán)。它用于涉及類不平衡的方案。

?

Lovász-Softmaxloss

該損失基于子模塊損失的convex Lovasz擴(kuò)展，對(duì)神經(jīng)網(wǎng)絡(luò)中的intersection-over-union loss進(jìn)行了直接優(yōu)化。

?

其他值得一提的損失有:

TopK loss：其目標(biāo)是確保網(wǎng)絡(luò)在訓(xùn)練過程中專注于困難樣本。

Distance penalized CE loss：它將網(wǎng)絡(luò)引向難以分割的邊界區(qū)域。

Sensitivity-Specificity (SS) loss：計(jì)算特異性和敏感性的均方差的加權(quán)和。

Hausdorff distance(HD) loss：可從卷積神經(jīng)網(wǎng)絡(luò)估計(jì)Hausdorff距離。

這些是在圖像分割中使用的一些損失函數(shù)。

圖像分割的數(shù)據(jù)集

Common Objects in COntext—Coco Dataset

COCO是一個(gè)大型的對(duì)象檢測(cè)、分割和字幕數(shù)據(jù)集。數(shù)據(jù)集包含91個(gè)類。它有25萬人，都有自己的關(guān)鍵點(diǎn)。它的下載大小是37.57 GiB。它包含80個(gè)對(duì)象類別。它在Apache 2.0的許可下可用。

PASCAL Visual Object Classes (PASCAL VOC)

PASCAL有20個(gè)不同的類，9963張圖片。訓(xùn)練/驗(yàn)證集是一個(gè)2GB的tar文件。

The Cityscapes Dataset

這個(gè)數(shù)據(jù)集包含城市場(chǎng)景的圖像。該方法可用于評(píng)價(jià)視覺算法在城市場(chǎng)景中的性能。

The Cambridge-driving Labeled Video Database?—?CamVid

這是一個(gè)基于動(dòng)作的分割和識(shí)別數(shù)據(jù)集。它包含32個(gè)語義類。以下鏈接包含數(shù)據(jù)集的進(jìn)一步說明和下載鏈接。

圖像分割框架

如果準(zhǔn)備好了數(shù)據(jù)集，那么來談?wù)勔恍┛捎糜谌腴T的工具/框架。

FastAI庫：給定一個(gè)圖像，該庫能夠?yàn)閳D像中的對(duì)象創(chuàng)建掩碼。

Sefexa圖像分割工具：可用于半自動(dòng)圖像分割，圖像分析和創(chuàng)建地面實(shí)況。

Deepmask：Facebook Research的Deepmask是DeepMask和SharpMask的Torch實(shí)現(xiàn)。

MultiPath：這是一個(gè)Torch實(shí)現(xiàn)，從“用于目標(biāo)檢測(cè)的多路徑網(wǎng)絡(luò)”中提取目標(biāo)檢測(cè)網(wǎng)絡(luò)。

OpenCV：這是一個(gè)開放源代碼的計(jì)算機(jī)視覺庫，具有2500多種優(yōu)化算法。

MIScnn：醫(yī)學(xué)圖像分割開源庫。它允許在幾行代碼中使用最新的卷積神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)模型建立管道。

Fritz：提供了多種計(jì)算機(jī)視覺工具，包括用于移動(dòng)設(shè)備的圖像分割工具。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

解碼器

解碼器

+關(guān)注

關(guān)注
9

文章
1143

瀏覽量
40742
編碼器

編碼器

+關(guān)注

關(guān)注
45

文章
3643

瀏覽量
134526
圖像分割

圖像分割

+關(guān)注

關(guān)注
4

文章
182

瀏覽量
18002
計(jì)算機(jī)視覺

計(jì)算機(jī)視覺

+關(guān)注

關(guān)注
8

文章
1698

瀏覽量
45994
cnn

cnn

+關(guān)注

關(guān)注
3

文章
352

瀏覽量
22215

原文標(biāo)題：沒你想的那么難 | 一文讀懂圖像分割

文章出處：【微信號(hào)：vision263com，微信公眾號(hào)：新機(jī)器視覺】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

一文讀懂單燈控制器工作原理

發(fā)表于 11-11 13:13 ?242次閱讀

<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>單燈控制器工作原理

一文讀懂MSA(測(cè)量系統(tǒng)分析)

發(fā)表于 11-01 11:08 ?911次閱讀

<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>MSA(測(cè)量系統(tǒng)分析)

語義分割25種損失函數(shù)綜述和展望

本綜述提供了對(duì)25種用于圖像分割的損失函數(shù)的全面且統(tǒng)一的回顧。我們提供了一種新穎的分類法，并詳細(xì)審查了這些損失函數(shù)如何在圖像

發(fā)表于 10-22 08:04 ?550次閱讀

語義<b class='flag-5'>分割</b>25種損失函數(shù)綜述和展望

一文讀懂新能源汽車的功能安全

電子發(fā)燒友網(wǎng)站提供《一文讀懂新能源汽車的功能安全.pdf》資料免費(fèi)下載

發(fā)表于 09-04 09:22 ?3次下載

一文讀懂圖像傳感器的選型

圖像傳感器是將光信號(hào)轉(zhuǎn)換為電信號(hào)的芯片，在相機(jī)、智能手機(jī)、安防監(jiān)控、汽車電子和機(jī)器視覺等市場(chǎng)中有著廣泛的應(yīng)用。圖像傳感器的工作原理主要基于光電效應(yīng)。光子通過鏡頭進(jìn)入傳感器，并被傳感器中的光電二極管

發(fā)表于 08-09 16:14 ?836次閱讀

<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b><b class='flag-5'>圖像</b>傳感器的選型

圖像語義分割的實(shí)用性是什么

圖像語義分割是一種重要的計(jì)算機(jī)視覺任務(wù)，它旨在將圖像中的每個(gè)像素分配到相應(yīng)的語義類別中。這項(xiàng)技術(shù)在許多領(lǐng)域都有廣泛的應(yīng)用，如自動(dòng)駕駛、醫(yī)學(xué)圖像

發(fā)表于 07-17 09:56 ?432次閱讀

圖像分割和語義分割的區(qū)別與聯(lián)系

、亮度等。圖像分割的目的是將圖像中感興趣的部分與背景分離，以便進(jìn)行進(jìn)一步的處理和分析。 1.1 圖像分割

發(fā)表于 07-17 09:55 ?955次閱讀

圖像分割與目標(biāo)檢測(cè)的區(qū)別是什么

的區(qū)別。定義圖像分割是將圖像劃分為若干個(gè)區(qū)域或?qū)ο蟮倪^程，這些區(qū)域或?qū)ο缶哂邢嗨频膶傩?，如顏色、紋理或形狀。圖像分割的目的是將

發(fā)表于 07-17 09:53 ?1336次閱讀

圖像分割與語義分割中的CNN模型綜述

圖像分割與語義分割是計(jì)算機(jī)視覺領(lǐng)域的重要任務(wù)，旨在將圖像劃分為多個(gè)具有特定語義含義的區(qū)域或?qū)ο?。卷積神經(jīng)網(wǎng)絡(luò)（CNN）作為深度學(xué)習(xí)的一種核心

發(fā)表于 07-09 11:51 ?903次閱讀

機(jī)器人視覺技術(shù)中常見的圖像分割方法

機(jī)器人視覺技術(shù)中的圖像分割方法是一個(gè)廣泛且深入的研究領(lǐng)域。圖像分割是將圖像劃分為多個(gè)區(qū)域或?qū)ο蟮?/div>
發(fā)表于 07-09 09:31 ?702次閱讀

機(jī)器人視覺技術(shù)中圖像分割方法有哪些

機(jī)器人視覺技術(shù)是人工智能領(lǐng)域的一個(gè)重要分支，它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等多個(gè)學(xué)科。圖像分割是機(jī)器人視覺技術(shù)中的一個(gè)重要環(huán)節(jié)，它的目

發(fā)表于 07-04 11:34 ?990次閱讀

電主軸：教您如何一文讀懂？|深圳恒興隆機(jī)電.

電主軸：教您如何一文讀懂？|深圳恒興隆機(jī)電電主軸是一種利用電機(jī)作為驅(qū)動(dòng)源的主軸。它具有高速、高精度和高剛性等特點(diǎn)，廣泛應(yīng)用于機(jī)械加工、數(shù)控機(jī)床、機(jī)器人等領(lǐng)域。本文將詳細(xì)介紹電主軸的原理

發(fā)表于 03-27 10:30

一文讀懂寬帶、帶寬、網(wǎng)速之間的區(qū)別與關(guān)系

一文讀懂寬帶、帶寬、網(wǎng)速之間的區(qū)別與關(guān)系? 寬帶、帶寬和網(wǎng)速是在網(wǎng)絡(luò)領(lǐng)域中經(jīng)常使用的術(shù)語，它們之間有一定的區(qū)別和關(guān)系。在深入理解寬帶、帶寬和網(wǎng)速之間的關(guān)系之前，讓我們先了解

發(fā)表于 01-31 09:11 ?7161次閱讀

一文讀懂：圖像特征檢測(cè)算法！

而斑點(diǎn)與角點(diǎn)是兩類局部特征點(diǎn)。斑點(diǎn)通常是指與周圍有著顏色和灰度差別的區(qū)域，如草原上的一棵樹或一棟房子。它是一個(gè)區(qū)域，所以它比角點(diǎn)的噪能力要強(qiáng)，穩(wěn)定性要好。而角點(diǎn)則是圖像中

發(fā)表于 01-18 16:37 ?1563次閱讀

改進(jìn)棉花根系圖像分割方法

的重要方法，受限于圖像質(zhì)量、復(fù)雜土壤環(huán)境、低效傳統(tǒng)方法，根系圖像分割存在一定挑戰(zhàn)。河北農(nóng)業(yè)大學(xué)機(jī)電工程學(xué)院、河北省教育考試院、河北農(nóng)業(yè)大學(xué)農(nóng)學(xué)院組成王楠科研團(tuán)隊(duì)，為提高根系

發(fā)表于 01-18 16:18 ?304次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

一文讀懂圖像分割

評(píng)論

一文讀懂單燈控制器工作原理

一文讀懂MSA(測(cè)量系統(tǒng)分析)

語義分割25種損失函數(shù)綜述和展望

一文讀懂新能源汽車的功能安全

一文讀懂圖像傳感器的選型

圖像語義分割的實(shí)用性是什么

圖像分割和語義分割的區(qū)別與聯(lián)系

圖像分割與目標(biāo)檢測(cè)的區(qū)別是什么

圖像分割與語義分割中的CNN模型綜述

機(jī)器人視覺技術(shù)中常見的圖像分割方法

機(jī)器人視覺技術(shù)中圖像分割方法有哪些

電主軸：教您如何一文讀懂？|深圳恒興隆機(jī)電.

一文讀懂寬帶、帶寬、網(wǎng)速之間的區(qū)別與關(guān)系

一文讀懂：圖像特征檢測(cè)算法！

改進(jìn)棉花根系圖像分割方法