新寡妇村传奇,盗墓笔记小说,完美世界辰东

回憶一下圖 7.2.1中的卷積示例。輸入的高度和寬度均為 3，卷積核的高度和寬度均為 2，從而產(chǎn)生具有維度的輸出表示2×2. 假設(shè)輸入形狀是 nh×nw卷積核形狀為 kh×kw，輸出形狀將是 (nh?kh+1)×(nw?kw+1)：我們只能將卷積核移動到它用完像素以應(yīng)用卷積為止。

在下文中，我們將探索許多技術(shù)，包括填充和跨步卷積，它們可以更好地控制輸出的大小。作為動機，請注意，由于內(nèi)核的寬度和高度通常大于1，在應(yīng)用許多連續(xù)的卷積之后，我們往往會得到比輸入小得多的輸出。如果我們從一個240×240像素圖像，10層層5×5卷積將圖像縮小為200×200像素，切片30%的圖像，并用它抹掉原始圖像邊界上的任何有趣信息。填充是處理此問題的最流行的工具。在其他情況下，我們可能希望大幅降低維數(shù)，例如，如果我們發(fā)現(xiàn)原始輸入分辨率很笨重。跨步卷積是一種流行的技術(shù)，可以在這些情況下提供幫助。

import torch
from torch import nn

from mxnet import np, npx
from mxnet.gluon import nn

npx.set_np()

import jax
from flax import linen as nn
from jax import numpy as jnp
from d2l import jax as d2l

No GPU/TPU found, falling back to CPU. (Set TF_CPP_MIN_LOG_LEVEL=0 and rerun for more info.)

import tensorflow as tf

7.3.1. 填充

如上所述，應(yīng)用卷積層時的一個棘手問題是我們往往會丟失圖像周邊的像素。考慮圖 7.3.1，該圖將像素利用率描述為卷積核大小和圖像內(nèi)位置的函數(shù)。角落里的像素幾乎沒有被使用。

圖 7.3.1尺寸卷積的像素利用1×1, 2×2，和3×3分別。

由于我們通常使用小內(nèi)核，對于任何給定的卷積，我們可能只會丟失幾個像素，但是當(dāng)我們應(yīng)用許多連續(xù)的卷積層時，這可能會累加起來。這個問題的一個直接解決方案是在輸入圖像的邊界周圍添加額外的填充像素，從而增加圖像的有效尺寸。通常，我們將額外像素的值設(shè)置為零。在圖 7.3.2中，我們填充一個3×3輸入，將其大小增加到5×5. 相應(yīng)的輸出然后增加到4×4矩陣。陰影部分是第一個輸出元素以及用于輸出計算的輸入和內(nèi)核張量元素：0×0+0×1+0×2+0×3=0.

圖 7.3.2帶填充的二維互相關(guān)。

一般來說，如果我們總共添加ph填充行（大約一半在頂部，一半在底部）和總共pw填充列（大約一半在左邊，一半在右邊），輸出形狀將是

(7.3.1)(nh?kh+ph+1)×(nw?kw+pw+1).

這意味著輸出的高度和寬度將增加 ph和pw，分別。

在許多情況下，我們會想要設(shè)置ph=kh?1和 pw=kw?1給輸入和輸出相同的高度和寬度。這樣在構(gòu)建網(wǎng)絡(luò)時更容易預(yù)測每一層的輸出形狀。假如說kh這里很奇怪，我們會墊ph/2高度兩側(cè)的行。如果 kh是偶數(shù)，一種可能是填充 ?ph/2?輸入頂部的行和 ?ph/2?底部的行。我們將以相同的方式填充寬度的兩側(cè)。

CNN 通常使用具有奇數(shù)高度和寬度值的卷積核，例如 1、3、5 或 7。選擇奇數(shù)核大小的好處是我們可以保留維度，同時在頂部和底部填充相同數(shù)量的行，并且左右的列數(shù)相同。

此外，這種使用奇數(shù)內(nèi)核和填充來精確保持維度的做法提供了文書上的好處。對于任意一個二維張量X，當(dāng)核的大小為奇數(shù)，且各邊的padding行數(shù)和列數(shù)相同時，產(chǎn)生與輸入等高等寬的輸出，我們知道輸出是通過cross計算的-輸入和卷積核與以為中心的窗口的相關(guān)性。Y[i, j]X[i, j]

在下面的示例中，我們創(chuàng)建了一個二維卷積層，其高度和寬度均為 3，并在所有邊上應(yīng)用 1 個像素的填充。給定一個高度和寬度為 8 的輸入，我們發(fā)現(xiàn)輸出的高度和寬度也為 8。

# We define a helper function to calculate convolutions. It initializes the
# convolutional layer weights and performs corresponding dimensionality
# elevations and reductions on the input and output
def comp_conv2d(conv2d, X):
  # (1, 1) indicates that batch size and the number of channels are both 1
  X = X.reshape((1, 1) + X.shape)
  Y = conv2d(X)
  # Strip the first two dimensions: examples and channels
  return Y.reshape(Y.shape[2:])

# 1 row and column is padded on either side, so a total of 2 rows or columns
# are added
conv2d = nn.LazyConv2d(1, kernel_size=3, padding=1)
X = torch.rand(size=(8, 8))
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

# We define a helper function to calculate convolutions. It initializes
# the convolutional layer weights and performs corresponding dimensionality
# elevations and reductions on the input and output
def comp_conv2d(conv2d, X):
  conv2d.initialize()
  # (1, 1) indicates that batch size and the number of channels are both 1
  X = X.reshape((1, 1) + X.shape)
  Y = conv2d(X)
  # Strip the first two dimensions: examples and channels
  return Y.reshape(Y.shape[2:])

# 1 row and column is padded on either side, so a total of 2 rows or columns are added
conv2d = nn.Conv2D(1, kernel_size=3, padding=1)
X = np.random.uniform(size=(8, 8))
comp_conv2d(conv2d, X).shape

(8, 8)

# We define a helper function to calculate convolutions. It initializes
# the convolutional layer weights and performs corresponding dimensionality
# elevations and reductions on the input and output
def comp_conv2d(conv2d, X):
  # (1, X.shape, 1) indicates that batch size and the number of channels are both 1
  key = jax.random.PRNGKey(d2l.get_seed())
  X = X.reshape((1,) + X.shape + (1,))
  Y, _ = conv2d.init_with_output(key, X)
  # Strip the dimensions: examples and channels
  return Y.reshape(Y.shape[1:3])
# 1 row and column is padded on either side, so a total of 2 rows or columns are added
conv2d = nn.Conv(1, kernel_size=(3, 3), padding='SAME')
X = jax.random.uniform(jax.random.PRNGKey(d2l.get_seed()), shape=(8, 8))
comp_conv2d(conv2d, X).shape

(8, 8)

# We define a helper function to calculate convolutions. It initializes
# the convolutional layer weights and performs corresponding dimensionality
# elevations and reductions on the input and output
def comp_conv2d(conv2d, X):
  # (1, 1) indicates that batch size and the number of channels are both 1
  X = tf.reshape(X, (1, ) + X.shape + (1, ))
  Y = conv2d(X)
  # Strip the first two dimensions: examples and channels
  return tf.reshape(Y, Y.shape[1:3])
# 1 row and column is padded on either side, so a total of 2 rows or columns
# are added
conv2d = tf.keras.layers.Conv2D(1, kernel_size=3, padding='same')
X = tf.random.uniform(shape=(8, 8))
comp_conv2d(conv2d, X).shape

TensorShape([8, 8])

當(dāng)卷積核的高和寬不同時，我們可以通過為高和寬設(shè)置不同的填充數(shù)，使輸出和輸入具有相同的高和寬。

# We use a convolution kernel with height 5 and width 3. The padding on either
# side of the height and width are 2 and 1, respectively
conv2d = nn.LazyConv2d(1, kernel_size=(5, 3), padding=(2, 1))
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

# We use a convolution kernel with height 5 and width 3. The padding on
# either side of the height and width are 2 and 1, respectively
conv2d = nn.Conv2D(1, kernel_size=(5, 3), padding=(2, 1))
comp_conv2d(conv2d, X).shape

(8, 8)

# We use a convolution kernel with height 5 and width 3. The padding on
# either side of the height and width are 2 and 1, respectively
conv2d = nn.Conv(1, kernel_size=(5, 3), padding=(2, 1))
comp_conv2d(conv2d, X).shape

(8, 8)

# We use a convolution kernel with height 5 and width 3. The padding on
# either side of the height and width are 2 and 1, respectively
conv2d = tf.keras.layers.Conv2D(1, kernel_size=(5, 3), padding='same')
comp_conv2d(conv2d, X).shape

TensorShape([8, 8])

7.3.2. 步幅

在計算互相關(guān)時，我們從輸入張量左上角的卷積窗口開始，然后將其滑過所有位置，包括向下和向右。在前面的示例中，我們默認(rèn)一次滑動一個元素。然而，有時，無論是為了提高計算效率還是因為我們希望下采樣，我們一次將窗口移動一個以上的元素，跳過中間位置。如果卷積核很大，這是特別有用的，因為它捕獲了大面積的底層圖像。

我們將每張幻燈片遍歷的行數(shù)和列數(shù)稱為步幅。到目前為止，我們對高度和寬度都使用了 1 的步幅。有時，我們可能想使用更大的步幅。圖 7.3.3顯示了垂直步長為 3，水平步長為 2 的二維互相關(guān)運算。陰影部分是輸出元素以及用于輸出計算的輸入和內(nèi)核張量元素： 0×0+0×1+1×2+2×3=8, 0×0+6×1+0×2+0×3=6. 我們可以看到，當(dāng)?shù)谝涣械牡诙€元素生成時，卷積窗口向下滑動了三行。當(dāng)生成第一行的第二個元素時，卷積窗口向右滑動兩列。當(dāng)卷積窗口在輸入上繼續(xù)向右滑動兩列時，就沒有輸出了，因為輸入元素?zé)o法填滿窗口（除非我們再添加一列padding）。

圖 7.3.3高度和寬度的步長分別為 3 和 2 的互相關(guān)。

一般來說，當(dāng)高度的步幅為sh寬度的步幅是sw，輸出形狀為

(7.3.2)?(nh?kh+ph+sh)/sh?×?(nw?kw+pw+sw)/sw?.

如果我們設(shè)置ph=kh?1和pw=kw?1, 那么輸出形狀可以簡化為 ?(nh+sh?1)/sh?×?(nw+sw?1)/sw?. 更進一步，如果輸入的高度和寬度可以被高度和寬度的步幅整除，那么輸出形狀將是 (nh/sh)×(nw/sw).

下面，我們將高度和寬度的步幅都設(shè)置為 2，從而將輸入的高度和寬度減半。

conv2d = nn.LazyConv2d(1, kernel_size=3, padding=1, stride=2)
comp_conv2d(conv2d, X).shape

torch.Size([4, 4])

conv2d = nn.Conv2D(1, kernel_size=3, padding=1, strides=2)
comp_conv2d(conv2d, X).shape

(4, 4)

conv2d = nn.Conv(1, kernel_size=(3, 3), padding=1, strides=2)
comp_conv2d(conv2d, X).shape

(4, 4)

conv2d = tf.keras.layers.Conv2D(1, kernel_size=3, padding='same', strides=2)
comp_conv2d(conv2d, X).shape

TensorShape([4, 4])

讓我們看一個稍微復(fù)雜一點的例子。

conv2d = nn.LazyConv2d(1, kernel_size=(3, 5), padding=(0, 1), stride=(3, 4))
comp_conv2d(conv2d, X).shape

torch.Size([2, 2])

conv2d = nn.Conv2D(1, kernel_size=(3, 5), padding=(0, 1), strides=(3, 4))
comp_conv2d(conv2d, X).shape

(2, 2)

conv2d = nn.Conv(1, kernel_size=(3, 5), padding=(0, 1), strides=(3, 4))
comp_conv2d(conv2d, X).shape

(2, 2)

conv2d = tf.keras.layers.Conv2D(1, kernel_size=(3,5), padding='valid',
                strides=(3, 4))
comp_conv2d(conv2d, X).shape

TensorShape([2, 1])

7.3.3. 總結(jié)與討論

填充可以增加輸出的高度和寬度。這通常用于為輸出提供與輸入相同的高度和寬度，以避免不希望的輸出收縮。此外，它確保所有像素的使用頻率相同。通常我們在輸入高度和寬度的兩側(cè)選擇對稱填充。在這種情況下，我們指的是 (ph,pw)填充。最常見的是我們設(shè)置ph=pw，在這種情況下，我們只是聲明我們選擇填充p.

類似的約定適用于步幅。橫步時 sh和垂直步幅swmatch，我們簡單說說strides. 步幅可以降低輸出的分辨率，例如將輸出的高度和寬度降低到僅 1/n輸入的高度和寬度n>1. 默認(rèn)情況下，填充為 0，步幅為 1。

到目前為止，我們討論的所有填充都只是用零擴展圖像。這具有顯著的計算優(yōu)勢，因為它很容易實現(xiàn)。此外，可以將運算符設(shè)計為隱式利用此填充，而無需分配額外的內(nèi)存。同時，它允許 CNN 對圖像中的隱式位置信息進行編碼，只需了解“空白”的位置即可。零填充有很多替代方法。 Alsallakh等人。( 2020 )提供了替代方案的廣泛概述（盡管沒有明確的案例使用非零填充，除非出現(xiàn)偽影）。

7.3.4. 練習(xí)

給定本節(jié)中最后一個具有內(nèi)核大小的代碼示例 (3,5), 填充(0,1), 和大步(3,4), 計算輸出形狀以檢查它是否與實驗結(jié)果一致。

對于音頻信號，stride為2對應(yīng)什么？

實施鏡像填充，即邊界值被簡單地鏡像以擴展張量的填充。

步幅大于 1 的計算優(yōu)勢是什么？

大于 1 的步幅在統(tǒng)計上有什么好處？

你將如何實現(xiàn)一大步12？它對應(yīng)什么？這什么時候有用？

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

pytorch

pytorch

+關(guān)注

關(guān)注
2

文章
808

瀏覽量
13283

Pytorch模型訓(xùn)練實用PDF教程【中文】

？模型部分？還是優(yōu)化器？只有這樣不斷的通過可視化診斷你的模型，不斷的對癥下藥，才能訓(xùn)練出一個較滿意的模型。本教程內(nèi)容及結(jié)構(gòu)：本教程內(nèi)容主要為在 PyTorch 中訓(xùn)練一個模型所可能涉及到的方法及函數(shù)，并且

發(fā)表于 12-21 09:18

Pytorch自動求導(dǎo)示例

Pytorch自動微分的幾個例子

發(fā)表于 08-09 11:56

Pytorch入門之的基本操作

Pytorch入門之基本操作

發(fā)表于 05-22 17:15

PyTorch如何入門

PyTorch 入門實戰(zhàn)（一）——Tensor

發(fā)表于 06-01 09:58

PyTorch10的基礎(chǔ)教程

PyTorch 10 基礎(chǔ)教程（4）：訓(xùn)練分類器

發(fā)表于 06-05 17:42

Pytorch AI語音助手

想做一個Pytorch AI語音助手，有沒有好的思路呀？

發(fā)表于 03-06 13:00

如何安裝TensorFlow2 Pytorch？

如何安裝TensorFlow2 Pytorch？

發(fā)表于 03-07 07:32

如何往星光2板子里裝pytorch？

如題,想先gpu版本的pytorch只安裝cpu版本的pytorch,pytorch官網(wǎng)提供了基于conda和pip兩種安裝方式。因為咱是risc架構(gòu)沒對應(yīng)的conda，而使用pip安裝提示也沒有

發(fā)表于 09-12 06:30

CEA R7.3 標(biāo)準(zhǔn),CEA R7.3 標(biāo)準(zhǔn)是什么意思

CEA R7.3 標(biāo)準(zhǔn),CEA R7.3 標(biāo)準(zhǔn)是什么意思電力線通信在家庭中應(yīng)用最早的是家庭組網(wǎng)。在家庭中，各種信息家電例如空調(diào)、照明系統(tǒng)、視頻

發(fā)表于 04-09 11:15 ?1509次閱讀

基于步數(shù)步幅統(tǒng)計的測距方法

結(jié)構(gòu)構(gòu)建是室內(nèi)地圖構(gòu)建的基礎(chǔ)，而室內(nèi)測距是結(jié)構(gòu)構(gòu)建中的核心問題。為克服現(xiàn)有測距方法中成本高或精度低的不足，在融合了多種智能手機傳感器數(shù)據(jù)的基礎(chǔ)上，重新設(shè)計了基于步數(shù)步幅統(tǒng)計的測距方法。在步數(shù)統(tǒng)計階段

發(fā)表于 11-30 17:33 ?1次下載

基于步數(shù)<b class='flag-5'>步幅</b>統(tǒng)計的測距方法

基于PyTorch的深度學(xué)習(xí)入門教程之PyTorch簡單知識

本文參考PyTorch官網(wǎng)的教程，分為五個基本模塊來介紹PyTorch。為了避免文章過長，這五個模塊分別在五篇博文中介紹。 Part1：PyTorch簡單知識 Part2：PyTorch

發(fā)表于 02-16 15:20 ?2284次閱讀

底部填充膠膠水如何填充芯片

什么是底部填充膠？底部填充膠簡單來說就是底部填充用的膠水，主要是以主要成份為環(huán)氧樹脂的膠水對BGA 封裝模式的芯片進行底部填充，利用加熱的固化形式，將BGA芯片底部空隙大面積 (一般覆

發(fā)表于 07-19 09:30 ?8249次閱讀

PyTorch教程7.3之填充和步幅

電子發(fā)燒友網(wǎng)站提供《PyTorch教程7.3之填充和步幅.pdf》資料免費下載

發(fā)表于 06-05 10:15 ?0次下載

tensorflow和pytorch哪個更簡單?

PyTorch更簡單。選擇TensorFlow還是PyTorch取決于您的具體需求和偏好。如果您需要一個易于使用、靈活且具有強大社區(qū)支持的框架，PyTorch可能是一個更好的選擇。如果您需要一個在

發(fā)表于 07-05 09:45 ?921次閱讀

pytorch怎么在pycharm中運行

第一部分：PyTorch和PyCharm的安裝 1.1 安裝PyTorch PyTorch是一個開源的機器學(xué)習(xí)庫，用于構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)。要在PyCharm中使用PyTorch，首先需

發(fā)表于 08-01 16:22 ?1509次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

PyTorch教程-7.3. 填充和步幅

評論