在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

像學習編程一樣學習深度學習模型開發

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-06-06 09:19 ? 次閱讀

作為一個程序員,我們可以像學習編程一樣學習深度學習模型開發。我們以 Keras 為例來說明。

我們可以用 5 步 + 4 種基本元素 + 9 種基本層結構,這 5-4-9 模型來總結。

5步法:

1. 構造網絡模型2. 編譯模型3. 訓練模型4. 評估模型5. 使用模型進行預測

4種基本元素:

1. 網絡結構:由10種基本層結構和其他層結構組成2. 激活函數:如relu, softmax。口訣: 最后輸出用softmax,其余基本都用relu3. 損失函數:categorical_crossentropy多分類對數損失,binary_crossentropy對數損失,mean_squared_error平均方差損失, mean_absolute_error平均絕對值損失4. 優化器:如SGD隨機梯度下降, RMSProp, Adagrad, Adam, Adadelta等

9種基本層模型

包括3種主模型:

1. 全連接層Dense2. 卷積層:如conv1d, conv2d3. 循環層:如lstm, gru

3種輔助層:1. Activation層2. Dropout層3. 池化層

3種異構網絡互聯層:

1. 嵌入層:用于第一層,輸入數據到其他網絡的轉換2. Flatten層:用于卷積層到全連接層之間的過渡3. Permute層:用于RNN與CNN之間的接口

我們通過一張圖來理解下它們之間的關系

▌五步法

五步法是用深度學習來解決問題的五個步驟:

1. 構造網絡模型2. 編譯模型3. 訓練模型4. 評估模型5. 使用模型進行預測

在這五步之中,其實關鍵的步驟主要只有第一步,這一步確定了,后面的參數都可以根據它來設置。

過程化方法構造網絡模型

我們先學習最容易理解的,過程化方法構造網絡模型的過程。

Keras中提供了Sequential容器來實現過程式構造。只要用Sequential的add方法把層結構加進來就可以了。10種基本層結構我們會在后面詳細講。

例:

from keras.models import Sequentialfrom keras.layers import Dense, Activationmodel = Sequential()model.add(Dense(units=64, input_dim=100))model.add(Activation("relu"))model.add(Dense(units=10))model.add(Activation("softmax"))

對于什么樣的問題構造什么樣的層結構,我們會在后面的例子中介紹。

編譯模型

模型構造好之后,下一步就可以調用Sequential的compile方法來編譯它。

model.compile(loss='categorical_crossentropy', optimizer='sgd', metrics=['accuracy'])

編譯時需要指定兩個基本元素:loss是損失函數,optimizer是優化函數。

如果只想用最基本的功能,只要指定字符串的名字就可以了。如果想配置更多的參數,調用相應的類來生成對象。例:我們想為隨機梯度下降配上Nesterov動量,就生成一個SGD的對象就好了:

from keras.optimizers import SGDmodel.compile(loss='categorical_crossentropy', optimizer=SGD(lr=0.01, momentum=0.9, nesterov=True))

lr是學習率,learning rate。

訓練模型

調用fit函數,將輸出的值X,打好標簽的值y,epochs訓練輪數,batch_size批次大小設置一下就可以了:

model.fit(x_train, y_train, epochs=5, batch_size=32)

評估模型

模型訓練的好不好,訓練數據不算數,需要用測試數據來評估一下:

loss_and_metrics = model.evaluate(x_test, y_test, batch_size=128)

用模型來預測

一切訓練的目的是在于預測:

classes = model.predict(x_test, batch_size=128)

▌4種基本元素

網絡結構

主要用后面的層結構來拼裝。網絡結構如何設計呢? 可以參考論文,比如這篇中不管是左邊的19層的VGG-19,還是右邊34層的resnet,只要按圖去實現就好了。

激活函數

對于多分類的情況,最后一層是softmax。

其它深度學習層中多用relu。

二分類可以用sigmoid。

另外淺層神經網絡也可以用tanh。

損失函數

categorical_crossentropy:多分類對數損失

binary_crossentropy:對數損失

mean_squared_error:均方差

mean_absolute_error:平均絕對值損失

對于多分類來說,主要用categorical_crossentropy。

優化器

SGD:隨機梯度下降

Adagrad:Adaptive Gradient自適應梯度下降

Adadelta:對于Adagrad的進一步改進

RMSProp

Adam

本文將著重介紹后兩種教程

深度學習中的函數式編程

前面介紹的各種基本層,除了可以add進Sequential容器串聯之外,它們本身也是callable對象,被調用之后,返回的還是callable對象。所以可以將它們視為函數,通過調用的方式來進行串聯。

來個官方例子:

from keras.layers import Input, Densefrom keras.models import Modelinputs = Input(shape=(784,))x = Dense(64, activation='relu')(inputs)x = Dense(64, activation='relu')(x)predictions = Dense(10, activation='softmax')(x)model = Model(inputs=inputs, outputs=predictions)model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])model.fit(data, labels)

為什么要用函數式編程?

答案是,復雜的網絡結構并不是都是線性的add進容器中的。并行的,重用的,什么情況都有。這時候callable的優勢就發揮出來了。

比如下面的Google Inception模型,就是帶并聯的:

我們的代碼自然是以并聯應對并聯了,一個輸入input_img被三個模型所重用:

from keras.layers import Conv2D, MaxPooling2D, Inputinput_img = Input(shape=(256, 256, 3))tower_1 = Conv2D(64, (1, 1), padding='same', activation='relu')(input_img)tower_1 = Conv2D(64, (3, 3), padding='same', activation='relu')(tower_1)tower_2 = Conv2D(64, (1, 1), padding='same', activation='relu')(input_img)tower_2 = Conv2D(64, (5, 5), padding='same', activation='relu')(tower_2)tower_3 = MaxPooling2D((3, 3), strides=(1, 1), padding='same')(input_img)tower_3 = Conv2D(64, (1, 1), padding='same', activation='relu')(tower_3)output = keras.layers.concatenate([tower_1, tower_2, tower_3], axis=1)

▌案例教程

CNN處理MNIST手寫識別

光說不練是假把式。我們來看看符合五步法的處理MNIST的例子。

首先解析一下核心模型代碼,因為模型是線性的,我們還是用Sequential容器

model = Sequential()

核心是兩個卷積層:

model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=input_shape))model.add(Conv2D(64, (3, 3), activation='relu'))

為了防止過擬合,我們加上一個最大池化層,再加上一個Dropout層:

model.add(MaxPooling2D(pool_size=(2, 2)))model.add(Dropout(0.25))

下面要進入全連接層輸出了,這兩個中間的數據轉換需要一個Flatten層:

model.add(Flatten())

下面是全連接層,激活函數是relu。

還怕過擬合,再來個Dropout層!

model.add(Dense(128, activation='relu'))model.add(Dropout(0.5))

最后通過一個softmax激活函數的全連接網絡輸出:

model.add(Dense(num_classes, activation='softmax'))

下面是編譯這個模型,損失函數是categorical_crossentropy多類對數損失函數,優化器選用Adadelta。

model.compile(loss=keras.losses.categorical_crossentropy, optimizer=keras.optimizers.Adadelta(), metrics=['accuracy'])

下面是可以運行的完整代碼:

from __future__ import print_functionimport kerasfrom keras.datasets import mnistfrom keras.models import Sequentialfrom keras.layers import Dense, Dropout, Flattenfrom keras.layers import Conv2D, MaxPooling2Dfrom keras import backend as Kbatch_size = 128num_classes = 10epochs = 12# input image dimensionsimg_rows, img_cols = 28, 28# the data, split between train and test sets(x_train, y_train), (x_test, y_test) = mnist.load_data()if K.image_data_format() == 'channels_first': x_train = x_train.reshape(x_train.shape[0], 1, img_rows, img_cols) x_test = x_test.reshape(x_test.shape[0], 1, img_rows, img_cols) input_shape = (1, img_rows, img_cols)else: x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1) x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1) input_shape = (img_rows, img_cols, 1) x_train = x_train.astype('float32')x_test = x_test.astype('float32')x_train /= 255x_test /= 255print('x_train shape:', x_train.shape)print(x_train.shape[0], 'train samples')print(x_test.shape[0], 'test samples')# convert class vectors to binary class matricesy_train = keras.utils.to_categorical(y_train, num_classes)y_test = keras.utils.to_categorical(y_test, num_classes)model = Sequential()model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=input_shape))model.add(Conv2D(64, (3, 3), activation='relu'))model.add(MaxPooling2D(pool_size=(2, 2)))model.add(Dropout(0.25))model.add(Flatten())model.add(Dense(128, activation='relu'))model.add(Dropout(0.5))model.add(Dense(num_classes, activation='softmax'))model.compile(loss=keras.losses.categorical_crossentropy, optimizer=keras.optimizers.Adadelta(), metrics=['accuracy'])model.fit(x_train, y_train, batch_size=batch_size, epochs=epochs, verbose=1, validation_data=(x_test, y_test))score = model.evaluate(x_test, y_test, verbose=0)print('Test loss:', score[0])print('Test accuracy:', score[1])

下面我們來個surprise例子,處理一下各種語言之間的翻譯。

機器翻譯:多語種互譯

英譯漢,漢譯英之類的事情,在學生時代是不是一直難為這你呢?

現在不用擔心了,只要有兩種語言的對照表,我們就可以訓練一個模型來像做一個機器翻譯。

首先得下載一個字典:http://www.manythings.org/anki/

然后我們還是老辦法,我們先看一下核心代碼。沒啥說的,這類序列化處理的問題用的一定是RNN,通常都是用LSTM.

encoder_inputs = Input(shape=(None, num_encoder_tokens))encoder = LSTM(latent_dim, return_state=True)encoder_outputs, state_h, state_c = encoder(encoder_inputs)encoder_states = [state_h, state_c]decoder_inputs = Input(shape=(None, num_decoder_tokens))decoder_lstm = LSTM(latent_dim, return_sequences=True, return_state=True)decoder_outputs, _, _ = decoder_lstm(decoder_inputs, initial_state=encoder_states)decoder_dense = Dense(num_decoder_tokens, activation='softmax')decoder_outputs = decoder_dense(decoder_outputs)model = Model([encoder_inputs, decoder_inputs], decoder_outputs)

優化器選用rmsprop,損失函數還是categorical_crossentropy.

validation_split是將一個集合隨機分成訓練集和測試集。

# Run trainingmodel.compile(optimizer='rmsprop', loss='categorical_crossentropy')model.fit([encoder_input_data, decoder_input_data], decoder_target_data, batch_size=batch_size, epochs=epochs, validation_split=0.2)

最后,訓練一個模型不容易,我們將其存儲起來。

model.save('s2s.h5')

最后,附上完整的實現了機器翻譯功能的代碼,加上注釋和空行有100多行,供有需要的同學取用。

from __future__ import print_functionfrom keras.models import Modelfrom keras.layers import Input, LSTM, Denseimport numpy as npbatch_size = 64 # Batch size for training.epochs = 100 # Number of epochs to train for.latent_dim = 256 # Latent dimensionality of the encoding space.num_samples = 10000 # Number of samples to train on.# Path to the data txt file on disk.data_path = 'fra-eng/fra.txt'# Vectorize the data.input_texts = []target_texts = []input_characters = set()target_characters = set()with open(data_path, 'r', encoding='utf-8') as f: lines = f.read().split(' ')for line in lines[: min(num_samples, len(lines) - 1)]: input_text, target_text = line.split(' ')

# We use "tab" as the "start sequence" character # for the targets, and " " as "end sequence" character.

target_text = ' ' + target_text + ' ' input_texts.append(input_text) target_texts.append(target_text) for char in input_text:

if char not in input_characters:

input_characters.add(char) for char in target_text:

if char not in target_characters:

target_characters.add(char)input_characters = sorted(list(input_characters))target_characters = sorted(list(target_characters))num_encoder_tokens = len(input_characters)num_decoder_tokens = len(target_characters)max_encoder_seq_length = max([len(txt) for txt in input_texts])max_decoder_seq_length = max([len(txt) for txt in target_texts])print('Number of samples:', len(input_texts))print('Number of unique input tokens:', num_encoder_tokens)print('Number of unique output tokens:', num_decoder_tokens)print('Max sequence length for inputs:', max_encoder_seq_length)print('Max sequence length for outputs:', max_decoder_seq_length)input_token_index = dict( [(char, i) for i, char in enumerate(input_characters)])target_token_index = dict( [(char, i) for i, char in enumerate(target_characters)])encoder_input_data = np.zeros( (len(input_texts), max_encoder_seq_length, num_encoder_tokens), dtype='float32')decoder_input_data = np.zeros( (len(input_texts), max_decoder_seq_length, num_decoder_tokens), dtype='float32')decoder_target_data = np.zeros( (len(input_texts), max_decoder_seq_length, num_decoder_tokens),

dtype='float32')for i, (input_text, target_text) in enumerate(zip(input_texts, target_texts)): for t, char in enumerate(input_text): encoder_input_data[i, t, input_token_index[char]] = 1. for t, char in enumerate(target_text):

# decoder_target_data is ahead of decoder_input_data by one timestep decoder_input_data[i, t, target_token_index[char]] = 1.

if t > 0:

# decoder_target_data will be ahead by one timestep

# and will not include the start character.

decoder_target_data[i, t - 1, target_token_index[char]] = 1.# Define an input sequence and process it.encoder_inputs = Input(shape=(None, num_encoder_tokens))encoder = LSTM(latent_dim, return_state=True)encoder_outputs, state_h, state_c = encoder(encoder_inputs)# We discard `encoder_outputs` and only keep the states.encoder_states = [state_h, state_c]# Set up the decoder, using `encoder_states` as initial state.decoder_inputs = Input(shape=(None, num_decoder_tokens))# We set up our decoder to return full output sequences,# and to return internal states as well. We don't use the# return states in the training model, but we will use them in inference.decoder_lstm = LSTM(latent_dim, return_sequences=True, return_state=True)decoder_outputs, _, _ = decoder_lstm(decoder_inputs,

initial_state=encoder_states)decoder_dense = Dense(num_decoder_tokens, activation='softmax')decoder_outputs = decoder_dense(decoder_outputs)# Define the model that will turn# `encoder_input_data` & `decoder_input_data` into `decoder_target_data`model = Model([encoder_inputs, decoder_inputs], decoder_outputs)# Run trainingmodel.compile(optimizer='rmsprop', loss='categorical_crossentropy')model.fit([encoder_input_data, decoder_input_data], decoder_target_data, batch_size=batch_size, epochs=epochs,

validation_split=0.2)# Save modelmodel.save('s2s.h5')encoder_model = Model(encoder_inputs, encoder_states)decoder_state_input_h = Input(shape=(latent_dim,))decoder_state_input_c = Input(shape=(latent_dim,))decoder_states_inputs = [decoder_state_input_h, decoder_state_input_c]decoder_outputs, state_h, state_c = decoder_lstm( decoder_inputs, initial_state=decoder_states_inputs)decoder_states = [state_h, state_c]decoder_outputs = decoder_dense(decoder_outputs)decoder_model = Model( [decoder_inputs] + decoder_states_inputs, [decoder_outputs] + decoder_states)# Reverse-lookup token index to decode sequences back to# something readable.reverse_input_char_index = dict( (i, char) for char, i in input_token_index.items())reverse_target_char_index = dict( (i, char) for char, i in target_token_index.items())def decode_sequence(input_seq): # Encode the input as state vectors. states_value = encoder_model.predict(input_seq) # Generate empty target sequence of length 1.

target_seq = np.zeros((1, 1, num_decoder_tokens)) # Populate the first character of target sequence with the start character. target_seq[0, 0, target_token_index[' ']] = 1.

# Sampling loop for a batch of sequences # (to simplify, here we assume a batch of size 1). stop_condition = False decoded_sentence = '' while not stop_condition:

output_tokens, h, c = decoder_model.predict(

[target_seq] + states_value)

# Sample a token

sampled_token_index = np.argmax(output_tokens[0, -1, :])

sampled_char = reverse_target_char_index[sampled_token_index]

decoded_sentence += sampled_char

# Exit condition: either hit max length

# or find stop character.

if (sampled_char == ' ' or

len(decoded_sentence) > max_decoder_seq_length):

stop_condition = True

# Update the target sequence (of length 1).

target_seq = np.zeros((1, 1, num_decoder_tokens))

target_seq[0, 0, sampled_token_index] = 1.

# Update states

states_value = [h, c] return decoded_sentencefor seq_index in range(100):

# Take one sequence (part of the training set)

# for trying out decoding. input_seq = encoder_input_data[seq_index: seq_index + 1] decoded_sentence = decode_sequence(input_seq) print('-') print('Input sentence:', input_texts[seq_index]) print('Decoded sentence:', decoded_sentence)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 網絡結構
    +關注

    關注

    0

    文章

    48

    瀏覽量

    11112
  • 深度學習
    +關注

    關注

    73

    文章

    5504

    瀏覽量

    121229

原文標題:TensorFlow快餐教程:程序員快速入門深度學習五步法

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    文詳解機器學習深度學習的區別

    深度學習這幾年特別火,就像5年前的大數據一樣,不過深度學習其主要還是屬于機器學習的范疇領域內,所
    發表于 09-06 12:48 ?2507次閱讀
    <b class='flag-5'>一</b>文詳解機器<b class='flag-5'>學習</b>和<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的區別

    深度學習模型是如何創建的?

    具有深度學習模型的嵌入式系統應用程序帶來了巨大的好處。深度學習嵌入式系統已經改變了各個行業的企業和組織。
    發表于 10-27 06:34

    什么是深度學習?使用FPGA進行深度學習的好處?

    什么是深度學習為了解釋深度學習,有必要了解神經網絡。神經網絡是種模擬人腦的神經元和神經網絡的計算模型
    發表于 02-17 16:56

    將基于FPGA的神經芯片植入深度學習

    深度學習是指通過學習樣本數據的內在規律和深層特征,使神經網絡結構能夠一樣具備分析和自主學習
    發表于 05-05 11:51 ?1850次閱讀

    機器能嬰兒一樣通過眼睛學習世界?

    在Facebook人工智能實驗室負責人楊樂昆(Yann LeCun)看來,人類既然已經教會機器辨別圖片,甚至能做到人臉識別,那么機器也能識別視頻。而教會機器學習視頻的方法與嬰兒學習相似。即讓機器嬰兒
    發表于 05-17 19:21 ?610次閱讀

    模型為什么是深度學習的未來?

    與傳統機器學習相比,深度學習是從數據中學習,而大模型則是通過使用大量的模型來訓練數據。
    的頭像 發表于 02-16 11:32 ?2118次閱讀

    什么是深度學習算法?深度學習算法的應用

    什么是深度學習算法?深度學習算法的應用 深度學習算法被認為是人工智能的核心,它是
    的頭像 發表于 08-17 16:03 ?2174次閱讀

    深度學習框架是什么?深度學習框架有哪些?

    深度學習框架是什么?深度學習框架有哪些?? 深度學習框架是
    的頭像 發表于 08-17 16:03 ?2764次閱讀

    深度學習框架連接技術

    深度學習框架連接技術 深度學習框架是個能夠幫助機器學習和人工智能
    的頭像 發表于 08-17 16:11 ?787次閱讀

    深度學習框架和深度學習算法教程

    深度學習框架和深度學習算法教程 深度學習是機器學習
    的頭像 發表于 08-17 16:11 ?1091次閱讀

    【技術科普】主流的深度學習模型有哪些?AI開發工程師必備!

    接近于人工智能。它通過學習樣本數據的內在規律和表示層次,對文字、圖像和聲音等數據進行解釋。深度學習的目標是讓機器一樣具有分析
    的頭像 發表于 01-30 15:26 ?637次閱讀
    【技術科普】主流的<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>模型</b>有哪些?AI<b class='flag-5'>開發</b>工程師必備!

    深度學習模型訓練過程詳解

    深度學習模型訓練是個復雜且關鍵的過程,它涉及大量的數據、計算資源和精心設計的算法。訓練深度
    的頭像 發表于 07-01 16:13 ?1312次閱讀

    深度學習中的模型權重

    深度學習充滿無限可能性的領域中,模型權重(Weights)作為其核心組成部分,扮演著至關重要的角色。它們不僅是模型
    的頭像 發表于 07-04 11:49 ?1415次閱讀

    AI大模型深度學習的關系

    AI大模型深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 深度
    的頭像 發表于 10-23 15:25 ?852次閱讀

    FPGA加速深度學習模型的案例

    FPGA(現場可編程門陣列)加速深度學習模型是當前硬件加速領域的個熱門研究方向。以下是些FP
    的頭像 發表于 10-25 09:22 ?240次閱讀
    主站蜘蛛池模板: 欧美福利视频网站| 午夜综合网| 欧美成人午夜| 欧美三级 欧美一级| 丁香激情六月| 天天躁狠狠躁夜夜躁2021| 亚洲免费在线观看| 国产在线麻豆自在拍91精品| 在线色网站| 亚洲jizzjizz| 色偷偷88欧美精品久久久| 日本美女黄视频| 久久精品免费观看视频| 大尺度在线| 手机在线看片你懂的| 伊人久久狼人| 午夜片网站| 中文字幕不卡免费高清视频| 黑人性xxxⅹxxbbbbb| 色视频免费观看高清完整| 在线免费观看视频你懂的| 天堂视频网| 毛片免费网| 97视频人人| 久久久夜| 亚洲欧美在线一区二区| 亚洲国产精品综合久久2007| 日韩国产片| 国产免费糟蹋美女视频| 天天爽夜爽免费精品视频| 1000部啪啪| 日本在线看小视频网址| 午夜视频黄色| 美女张开腿露出尿口让男人桶| 五月婷婷激情六月| 美女网站黄页| 午夜久久久久久久| 欧美性满足hd1819| 亚洲免费视频观看| 久久黄网站| 日本美女视频网站|