僅會(huì)一點(diǎn)點(diǎn)python也能自己搭建一個(gè)神經(jīng)網(wǎng)絡(luò)!谷歌開(kāi)發(fā)者博客的 Codelabs 項(xiàng)目上面給出了一份教程,不只是教你搭建神經(jīng)網(wǎng)絡(luò),還給出四個(gè)實(shí)驗(yàn)案例,手把手教你如何使用 keras、TPU、Colab。
想要真的了解深度學(xué)習(xí),除了看視頻,拿數(shù)據(jù)和算力真槍實(shí)彈的練手可能比各種理論知識(shí)更重要。
編程基礎(chǔ)不好?不會(huì)配置環(huán)境?本地 GPU 太貴配置太低?訓(xùn)練速度達(dá)不到要求?這些可能都是阻礙你搭建第一個(gè)神經(jīng)網(wǎng)絡(luò)的原因。
谷歌開(kāi)發(fā)者博客的 Codelabs 項(xiàng)目上面給出了一份教程(課程鏈接在文末),不只是教你搭建神經(jīng)網(wǎng)絡(luò),還給出四個(gè)實(shí)驗(yàn)案例,手把手教你如何使用 keras、TPU、Colab。
這個(gè)練手指南被成為 “僅會(huì)一點(diǎn)點(diǎn) python 也能看懂”,也就是說(shuō),基礎(chǔ)再薄弱都可以直接了解哦。
四次實(shí)驗(yàn)均在谷歌的 Collab 上運(yùn)行,由淺入深、循序漸進(jìn)。無(wú)需進(jìn)行任何設(shè)置,可以用 Chromebook 打開(kāi),實(shí)驗(yàn)環(huán)境都幫你搭建好了。
是時(shí)候搭建一個(gè)屬于自己的神經(jīng)網(wǎng)絡(luò)了!
快速開(kāi)啟!
四次實(shí)驗(yàn)均選擇 TPU 支持,這會(huì)使代碼運(yùn)行速度大大加快,畢竟用了硬件加速。
先教會(huì)你如何在 Tensorflow 框架下快速加載數(shù)據(jù),然后介紹一些 tf.data.Dataset 的基礎(chǔ)知識(shí),包括 eager 模式以及元組數(shù)據(jù)集等。
第二部分,手把手教你實(shí)現(xiàn)遷移學(xué)習(xí),把別人訓(xùn)練好的模型拿過(guò)來(lái)直接使用,不用一步一步搭建也能使用強(qiáng)大的神經(jīng)網(wǎng)絡(luò)。除了遷移學(xué)習(xí),在這部分還會(huì)簡(jiǎn)單介紹一些必要的知識(shí)點(diǎn),包括神經(jīng)元、激活函數(shù)等。
第三部分,進(jìn)入卷積神經(jīng)網(wǎng)絡(luò)部分,在了解卷積層、池化層、Dense 層卷積網(wǎng)絡(luò)三個(gè)必要的組件之后,你將學(xué)會(huì)使用 Keras Sequential 模型構(gòu)建卷積圖像分類器,并使用良好的卷積層選擇來(lái)微調(diào)模型。
第四部分,進(jìn)入到更加前沿的部分,在接受了前面三個(gè)部分的洗禮之后,在這部分你會(huì)實(shí)現(xiàn)在 Keras 中利用 TPU 組建現(xiàn)代卷積網(wǎng)絡(luò)和實(shí)現(xiàn)分類。

和在 Jupyter Notebook 操作方式一樣,同時(shí)按住鍵盤(pán)的 Shift 和 enter 按鈕,便可以運(yùn)行代碼。

如果你是首次執(zhí)行,需要登錄 Google 帳戶進(jìn)行身份驗(yàn)證。注意頁(yè)面提醒就可以啦~

此 notebook 支持目錄功能,點(diǎn)擊網(wǎng)頁(yè)左側(cè)的黑色箭頭可以查看。

利用 Colab 上的 TPU 訓(xùn)練 Keras 模型需要輸入以下代碼?
tpu = tf.contrib.cluster_resolver.TPUClusterResolver(TPU_ADDRESS)strategy = tf.contrib.tpu.TPUDistributionStrategy(tpu)tpu_model = tf.contrib.tpu.keras_to_tpu_model(model, strategy=strategy)tpu_model.fit(get_training_dataset, steps_per_epoch=TRAIN_STEPS, epochs=EPOCHS, validation_data=get_validation_dataset, validation_steps=VALID_STEPS)
本質(zhì)上是在 keras 中調(diào)用 keras_to_tpu_model,部署額外的硬件可以通過(guò)增加訓(xùn)練批次的大小增加訓(xùn)練過(guò)程。需要注意的是目前,Keras 支持僅限于 8 個(gè)核心或一個(gè) Cloud TPU。
注:TPU 可以在神經(jīng)網(wǎng)絡(luò)運(yùn)算上達(dá)到高計(jì)算吞吐量,同時(shí)能耗和物理空間都很小。因?yàn)?TPU 從內(nèi)存加載數(shù)據(jù)。當(dāng)每個(gè)乘法被執(zhí)行后,其結(jié)果將被傳遞到下一個(gè)乘法器,同時(shí)執(zhí)行加法。因此結(jié)果將是所有數(shù)據(jù)和參數(shù)乘積的和。在大量計(jì)算和數(shù)據(jù)傳遞的整個(gè)過(guò)程中,不需要執(zhí)行任何的內(nèi)存訪問(wèn)。
介紹完基本的操作,接下來(lái),看看官方給出的四個(gè)實(shí)驗(yàn)。
Tensorflow 入門(mén):tfrecords 和 tf.data
此實(shí)驗(yàn)涉及兩個(gè) tf 的基礎(chǔ)操作,一個(gè)是使用 tf.data.Dataset API 導(dǎo)入訓(xùn)練數(shù)據(jù),另一個(gè)是使用 TFRecord 格式從 GCS 有效導(dǎo)入訓(xùn)練數(shù)據(jù)。
此次實(shí)驗(yàn)使用花卉圖片的數(shù)據(jù)集,學(xué)習(xí)的目標(biāo)是將其分為 5 種類別。使用 tf.data.Dataset API執(zhí)行數(shù)據(jù)加載。
Keras 和 Tensorflow 在其所有訓(xùn)練和評(píng)估功能中接受數(shù)據(jù)集。在數(shù)據(jù)集中加載數(shù)據(jù)后,API 會(huì)提供對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)有用的所有常用功能:
dataset = ... # load something (see below)dataset = dataset.shuffle(1000) # shuffle the dataset with a buffer of 1000dataset = dataset.cache() # cache the dataset in RAM or on diskdataset = dataset.repeat() # repeat the dataset indefinitelydataset = dataset.batch(128) # batch data elements together in batches of 128dataset = dataset.prefetch(-1) # prefetch next batch(es) while training
了解 API 并試著運(yùn)行:
https://colab.research.google.com/github/GoogleCloudPlatform/training-data-analyst/blob/master/courses/fast-and-lean-data-science/02_Dataset_playground.ipynb
關(guān)于鮮花數(shù)據(jù)集,數(shù)據(jù)集按 5 個(gè)文件夾組織,每個(gè)文件夾都包含一種花。文件夾名為向日葵,雛菊,蒲公英,郁金香和玫瑰。數(shù)據(jù)托管在 Google 云端存儲(chǔ)上的公共存儲(chǔ)區(qū)中。
gs://flowers-public/sunflowers/5139971615_434ff8ed8b_n.jpggs://flowers-public/daisy/8094774544_35465c1c64.jpggs://flowers-public/sunflowers/9309473873_9d62b9082e.jpggs://flowers-public/dandelion/19551343954_83bb52f310_m.jpggs://flowers-public/dandelion/14199664556_188b37e51e.jpggs://flowers-public/tulips/4290566894_c7f061583d_m.jpggs://flowers-public/roses/3065719996_c16ecd5551.jpggs://flowers-public/dandelion/8168031302_6e36f39d87.jpggs://flowers-public/sunflowers/9564240106_0577e919da_n.jpggs://flowers-public/daisy/14167543177_cd36b54ac6_n.jpg
tf.data.Dataset 基礎(chǔ)知識(shí)
數(shù)據(jù)通常包含多個(gè)文件,此處為圖像,通過(guò)調(diào)用以下方法創(chuàng)建文件名數(shù)據(jù)集:
filenames_dataset = tf.data.Dataset.list_files('gs://flowers-public/*/*.jpg')# The parameter is a "glob" pattern that supports the * and ? wildcards.
然后,將函數(shù) “映射” 到每個(gè)文件名,這些文件通常導(dǎo)入文件并解碼為內(nèi)存中的實(shí)際數(shù)據(jù):
def decode_jpeg(filename):bits = tf.read_file(filename)image = tf.image.decode_jpeg(bits)return imageimage_dataset = filenames_dataset.map(decode_jpeg)# this is now a dataset of decoded images (uint8 RGB format)
有關(guān) tf.data.Dataset 的基礎(chǔ)知識(shí)、tf.data.Dataset 和 eager 模式、元組數(shù)據(jù)集的詳細(xì)步驟,請(qǐng)戳:
https://codelabs.developers.google.com/codelabs/keras-flowers-data/#3
但逐個(gè)加載圖像很慢,在迭代此數(shù)據(jù)集時(shí),每秒只可以加載 1-2 個(gè)圖像。我們將用訓(xùn)練的硬件加速器,可以將速率提高很多倍。
快速加載數(shù)據(jù)
我們將在本實(shí)驗(yàn)中使用的 Tensor Processing Unit(TPU)硬件加速器。Google 云端存儲(chǔ)(GCS)能夠保持極高的吞吐量,但與所有云存儲(chǔ)系統(tǒng)一樣,形成連接時(shí)需要來(lái)回請(qǐng)求。因此,將數(shù)據(jù)存儲(chǔ)為數(shù)千個(gè)單獨(dú)的文件并不理想。我們將在少量文件中批量處理它們,并使用 tf.data.Dataset 的強(qiáng)大功能一次性讀取多個(gè)文件。
通過(guò)加載圖像文件的代碼將它們調(diào)整為通用大小,然后將它們存儲(chǔ)在 16 個(gè) TFRecord 文件中,代碼鏈接如下:
https://colab.research.google.com/github/GoogleCloudPlatform/training-data-analyst/blob/master/courses/fast-and-lean-data-science/03_Flower_pictures_to_TFRecords.ipynb
經(jīng)驗(yàn)法則是將數(shù)據(jù)分成幾個(gè)(10s 到 100s)的大文件(10s 到 100s 的 MB)。如果有太多文件,例如數(shù)千個(gè)文件,那么訪問(wèn)每個(gè)文件的時(shí)間可能會(huì)開(kāi)始妨礙。如果文件太少,例如一兩個(gè)文件,那么就無(wú)法并行獲取多個(gè)文件的優(yōu)勢(shì)。
TFRecord 文件格式
Tensorflow 用于存儲(chǔ)數(shù)據(jù)的首選文件格式是基于 protobuf 的 TFRecord 格式。其他序列化格式也可以使用,可以通過(guò)以下方式直接從 TFRecord 文件加載數(shù)據(jù)集:
filenames_dataset = tf.data.Dataset.list_files(FILENAME_PATTERN)tfrecords_dataset = tf.data.TFRecordDataset(filenames,num_parallel_reads = 32)
但你擁有 TFRecords 的數(shù)據(jù)集時(shí),下一步解碼步驟就是從每個(gè)記錄中獲得數(shù)據(jù)。如前所述,你將使用 Dataset.map,并注意 num_parallel_reads=32 參數(shù)。這將從 32 個(gè) TFRecord 文件并行加載數(shù)據(jù),可以獲得最佳性能。
在 Keras 中利用遷移學(xué)習(xí)
本次實(shí)驗(yàn)在 keras 中實(shí)現(xiàn)遷移學(xué)習(xí),將強(qiáng)大的預(yù)訓(xùn)練模型應(yīng)用于我們的數(shù)據(jù)集,不用費(fèi)力重新訓(xùn)練模型。此外,本實(shí)驗(yàn)包含有關(guān)神經(jīng)網(wǎng)絡(luò)的必要理論解釋。
神經(jīng)網(wǎng)絡(luò)分類器是由幾個(gè)層的神經(jīng)元組成。對(duì)于圖像分類,這些可以是 Dense 層,或者更常見(jiàn)的是卷積層。它們通常通過(guò) relu 激活函數(shù)激活。最后一層使用與類相同數(shù)量的神經(jīng)元,并使用 softmax 激活。對(duì)于分類,交叉熵是最常用的損失函數(shù),將獨(dú)熱編碼標(biāo)簽(即正確答案)與神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的概率進(jìn)行比較。例如,為了最大限度地減少損失,最好選擇具有動(dòng)量的優(yōu)化器 AdamOptimizer 并批量訓(xùn)練圖像和標(biāo)簽。
對(duì)于構(gòu)建為層序列的模型,Keras 提供了 Sequential API。例如,使用三個(gè) Dense 層的圖像分類器可以在 Keras 中編寫(xiě)為:
model = tf.keras.Sequential([ tf.keras.layers.Flatten(input_shape=[192, 192, 3]), tf.keras.layers.Dense(500, activation="relu"), tf.keras.layers.Dense(50, activation="relu"), tf.keras.layers.Dense(5, activation='softmax') # classifying into 5 classes])# this configures the training of the model. Keras calls it "compiling" the model.model.compile( optimizer='adam', loss= 'categorical_crossentropy', metrics=['accuracy']) # % of correct answers# train the modelmodel.fit(dataset, ... )
Dense 神經(jīng)網(wǎng)絡(luò)
這是用于分類圖像的最簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)。它由分層排列的 “神經(jīng)元” 組成。第一層處理輸入數(shù)據(jù)并將其輸出饋送到其他層。之所以被稱為 “Dense” 是因?yàn)槊總€(gè)神經(jīng)元都連接到前一層中的所有神經(jīng)元。

你可以將圖像的所有像素的 RGB 值展開(kāi)為長(zhǎng)矢量并將其用作輸入,從而將圖像輸入到此類網(wǎng)絡(luò)中。它不是圖像識(shí)別的最佳技術(shù),但我們稍后會(huì)對(duì)其進(jìn)行改進(jìn)。
神經(jīng)元
“神經(jīng)元” 計(jì)算其所有輸入的并進(jìn)行加權(quán)求和,添加一個(gè)稱為 “偏差” 的值,并通過(guò)所謂的 “激活函數(shù)” 提供結(jié)果。權(quán)重和偏差最初是未知的。它們將被隨機(jī)初始化并通過(guò)在許多已知數(shù)據(jù)上訓(xùn)練神經(jīng)網(wǎng)絡(luò)來(lái) “學(xué)習(xí)”。

最流行的激活函數(shù)被稱為 RELU(Rectified Linear Unit)如上圖所示。
Softmax 激活
我們將花分為 5 類(玫瑰,郁金香,蒲公英,雛菊,向日葵),使用經(jīng)典 RELU 激活函數(shù)。然而,在最后一層,我們想要計(jì)算 0 到 1 之間的數(shù)字,表示這朵花是玫瑰,郁金香等的概率。為此,我們將使用名為 “softmax” 的激活函數(shù)。
在矢量上應(yīng)用 softmax 函數(shù)是通過(guò)取每個(gè)元素的指數(shù)然后歸一化矢量來(lái)完成的,通常使用 L1 范數(shù)(絕對(duì)值之和),使得這些值加起來(lái)可以解釋為概率。


對(duì)于圖像分類問(wèn)題,Dense 層可能是不夠的。但我們也可以另辟蹊徑!有完整的卷積神經(jīng)網(wǎng)絡(luò)可供下載。我們可以切掉它們的最后一層 softmax 分類,并用下載的替換它。所有訓(xùn)練過(guò)的權(quán)重和偏差保持不變,你只需重新訓(xùn)練你添加的 softmax 層。這種技術(shù)被稱為遷移學(xué)習(xí),只要預(yù)先訓(xùn)練神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)集與你的 “足夠接近”,它就可以工作。
請(qǐng)打開(kāi)下面的 notebook,同時(shí)按住 Shift-ENTER 運(yùn)行代碼:
https://codelabs.developers.google.com/codelabs/keras-flowers-convnets/#0

插圖:使用已經(jīng)訓(xùn)練過(guò)的復(fù)雜卷積神經(jīng)網(wǎng)絡(luò)作為黑匣子,僅對(duì)分類的最后一層進(jìn)行再訓(xùn)練。這是遷移學(xué)習(xí)。
通過(guò)遷移學(xué)習(xí),你可以從頂級(jí)研究人員已經(jīng)開(kāi)發(fā)的高級(jí)卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)和大量圖像數(shù)據(jù)集的預(yù)訓(xùn)練中受益。在我們的案例中,我們將從 ImageNet 訓(xùn)練的網(wǎng)絡(luò)遷移學(xué)習(xí)。
在 Keras 中,可以從 tf.keras.applications.* 集合中實(shí)例化預(yù)先訓(xùn)練的模型。例如,MobileNet V2 是一個(gè)非常好的卷積架構(gòu),其尺寸合理。通過(guò)選擇 include_top=False,你可以獲得沒(méi)有最終 softmax 圖層的預(yù)訓(xùn)練模型,以便你可以添加自己的模型:
pretrained_model = tf.keras.applications.MobileNetV2(input_shape=[*IMAGE_SIZE, 3], include_top=False)pretrained_model.trainable = Falsemodel = tf.keras.Sequential([ pretrained_model, tf.keras.layers.Flatten(), tf.keras.layers.Dense(5, activation='softmax')])
另請(qǐng)注意 pretrained_model.trainable = False 設(shè)置。它凍結(jié)了預(yù)訓(xùn)練模型的權(quán)重和偏差,因此你只能訓(xùn)練 softmax 圖層。這通常針對(duì)相對(duì)較少的權(quán)重并且可以快速完成而無(wú)需非常大的數(shù)據(jù)集。但是,如果你確實(shí)擁有大量數(shù)據(jù),那么 pretrained_model.trainable = True 可以讓遷移學(xué)習(xí)更好地工作。然后,經(jīng)過(guò)預(yù)先訓(xùn)練的權(quán)重可提供出色的初始值,并且仍可通過(guò)訓(xùn)練進(jìn)行調(diào)整,以更好地適應(yīng)你的問(wèn)題。
最后,請(qǐng)注意在 dense softmax 層前插入 Flatten()層。Dense 層對(duì)數(shù)據(jù)的平面向量起作用,但我們不知道這是否是預(yù)訓(xùn)練模型返回的內(nèi)容,這就是我們需要扁平化的原因。在下一章中,當(dāng)我們深入研究卷積體系結(jié)構(gòu)時(shí),我們將解釋卷積層返回的數(shù)據(jù)格式。
在 Keras 中利用 TPU 組建卷積神經(jīng)網(wǎng)絡(luò)
本次實(shí)驗(yàn),完成三個(gè)目標(biāo):
使用 Keras Sequential 模型構(gòu)建卷積圖像分類器。
在 TPU 上訓(xùn)練 Keras 模型
使用良好的卷積層選擇來(lái)微調(diào)模型。
卷積將神經(jīng)網(wǎng)絡(luò)將一系列濾波器應(yīng)用于圖像的原始像素?cái)?shù)據(jù)以提取和學(xué)習(xí)更高級(jí)別的特征,使得該模型能夠?qū)⑦@些特征用于分類。卷積將神經(jīng)網(wǎng)絡(luò)包含三個(gè)組件:
卷積層,將特定數(shù)量的卷積濾鏡(convolution filters)應(yīng)用于圖像。對(duì)于每個(gè)子區(qū)域,圖層執(zhí)行一組數(shù)學(xué)運(yùn)算以在輸出特征映射中生成單個(gè)值。
池化層(Pooling layers),負(fù)責(zé)對(duì)由卷積層提取的圖像數(shù)據(jù)進(jìn)行下采樣以減少特征映射的維度以提高處理效率。常用的池化算法是最大池化,其提取特征地圖的子區(qū)域(例如,2×2 像素的塊),保持它們的最大值并丟棄所有其他值。
Dense 層,對(duì)由卷積圖層提取的特征并由共用圖層進(jìn)行下采樣執(zhí)行分類。Dense 層是全連接的神經(jīng)網(wǎng)絡(luò),在 Dense 層中,圖層中的每個(gè)節(jié)點(diǎn)都連接到前一圖層中的每個(gè)節(jié)點(diǎn)。
用最大池化做卷積的動(dòng)畫(huà)示例如下?

用 Softmax 激活函數(shù)連接分類器,典型的卷積分類器如下?

在 keras 中搭建神經(jīng)網(wǎng)絡(luò)代碼如下:
model = tf.keras.Sequential([# input: images of size 192x192x3 pixels (the three stands for RGB channels) tf.keras.layers.Conv2D(kernel_size=3, filters=24, padding='same', activation='relu', input_shape=[192, 192, 3]), tf.keras.layers.Conv2D(kernel_size=3, filters=24, padding='same', activation='relu'), tf.keras.layers.MaxPooling2D(pool_size=2), tf.keras.layers.Conv2D(kernel_size=3, filters=12, padding='same', activation='relu'), tf.keras.layers.MaxPooling2D(pool_size=2), tf.keras.layers.Conv2D(kernel_size=3, filters=6, padding='same', activation='relu'), tf.keras.layers.Flatten(),# classifying into 5 categories tf.keras.layers.Dense(5, activation='softmax')])model.compile( optimizer='adam', loss= 'categorical_crossentropy', metrics=['accuracy'])
在搭建的過(guò)程中,必須在權(quán)重和偏差之間找到適當(dāng)?shù)钠胶恻c(diǎn),如果權(quán)重太大,神經(jīng)網(wǎng)絡(luò)可能無(wú)法代表復(fù)雜性,如果參數(shù)太多,可能導(dǎo)致過(guò)擬合。所以在在 Keras 中,用 model.summary () 函數(shù)顯示模型的結(jié)構(gòu)和參數(shù):

具體代碼地址:
https://colab.research.google.com/github/GoogleCloudPlatform/training-data-analyst/blob/master/courses/fast-and-lean-data-science/07_Keras_Flowers_TPU_playground.ipynb
在 Keras 中利用 TPU 組建現(xiàn)代卷積網(wǎng)絡(luò)和實(shí)現(xiàn)分類
之前三個(gè)實(shí)驗(yàn)已經(jīng)分別介紹了 TPU、遷移學(xué)習(xí)和卷積網(wǎng)絡(luò),是不是已經(jīng)覺(jué)得很厲害了?別著急,最后的大招來(lái)了,本次實(shí)驗(yàn)我們將實(shí)現(xiàn)在 Keras 中利用 TPU 組建現(xiàn)代卷積網(wǎng)絡(luò)和實(shí)現(xiàn)分類。
現(xiàn)代卷積架構(gòu)(Modern convolutions networks)
簡(jiǎn)而言之,從 "Inception" 和 "Inception v2" 開(kāi)始的現(xiàn)代卷積網(wǎng)絡(luò)通常使用 “模塊”,其中在同一輸入上同時(shí)嘗試不同的卷積層,它們的輸出被連接并且網(wǎng)絡(luò)通過(guò)訓(xùn)練決定哪個(gè)層是最有用的。

在 Keras 中,要?jiǎng)?chuàng)建數(shù)據(jù)流可以分支進(jìn)出的模型,必須使用 “functional” 模型。這是一個(gè)例子:
l = tf.keras.layers # syntax shortcuty = l.Conv2D(filters=32, kernel_size=3, padding='same', activation='relu', input_shape=[192, 192, 3])(x) # x=input image# module start: branch outy1 = l.Conv2D(filters=32, kernel_size=1, padding='same', activation='relu')(y)y3 = l.Conv2D(filters=32, kernel_size=3, padding='same', activation='relu')(y)y = l.concatenate([y1, y3]) # output now has 64 channels# module end: concatenation# many more layers ...# Create the model by specifying the input and output tensors.# Keras layers track their connections automatically so that's all that's needed.z = l.Dense(5, activation='softmax')(y)model = tf.keras.Model(x, z)
其他小技巧

小型 3x3 濾波器
在此圖中,你可以看到兩個(gè)連續(xù) 3x3濾波器的結(jié)果。嘗試追溯哪些數(shù)據(jù)點(diǎn)對(duì)結(jié)果有貢獻(xiàn):這兩個(gè)連續(xù)的 3x3濾波器計(jì)算 5x5 區(qū)域的某種組合。它與 5x5 濾波器計(jì)算的組合并不完全相同,但值得嘗試,因?yàn)閮蓚€(gè)連續(xù)的 3x3 濾波器比單個(gè) 5x5 濾波器效率更高。

1x1 卷積?
在數(shù)學(xué)術(shù)語(yǔ)中,“1x1” 卷積是常數(shù)的乘法,而不是非常有用的概念。但是,在卷積神經(jīng)網(wǎng)絡(luò)中,請(qǐng)記住濾波器應(yīng)用于數(shù)據(jù)立方體,而不僅僅是 2D 圖像。因此,“1x1” 濾波器計(jì)算 1x1 數(shù)據(jù)列的加權(quán)和(參見(jiàn)圖示),當(dāng)你在數(shù)據(jù)中滑動(dòng)時(shí),你將獲得輸入通道的線性組合。這實(shí)際上很有用。如果你將通道視為單個(gè)過(guò)濾操作的結(jié)果,例如 “貓耳朵” 的過(guò)濾器,另一個(gè)用于 “貓胡須”,第三個(gè)用于 “貓眼睛”,則 “1x1” 卷積層將計(jì)算多個(gè)這些特征的可能線性組合,在尋找 “貓” 時(shí)可能很有用。
Squeezenet
將這些想法融合在一起的簡(jiǎn)單方法已在 “Squeezenet” 論文中展示,即一種僅使用 1x1 和 3x3 卷積層的卷積模塊設(shè)計(jì)。
https://arxiv.org/abs/1602.07360

基于 “fire model” 的 squeezenet 架構(gòu)。它們交替使用 1x1 層,在垂直維度上 “擠壓” 輸入數(shù)據(jù),然后是兩個(gè)并行的 1x1 和 3x3 卷積層,再次 “擴(kuò)展” 數(shù)據(jù)深度。
構(gòu)建一個(gè)受 squeezenet 啟發(fā)的卷積神經(jīng)網(wǎng)絡(luò)時(shí),我們就不能直接像上面一樣直接堆疊已有模塊,需要將模型代碼更改為 Keras 的 “功能樣式”,來(lái)定義自己的模塊。
想要嘗試 Squeezenet 架構(gòu)練習(xí)的戳以下鏈接:
https://codelabs.developers.google.com/codelabs/keras-flowers-squeezenet/#6
最后,手把手教程運(yùn)行代碼如下:
https://colab.research.google.com/github/GoogleCloudPlatform/training-data-analyst/blob/master/courses/fast-and-lean-data-science/07_Keras_Flowers_TPU_playground.ipynb
最后,再次給出四個(gè)實(shí)驗(yàn)的鏈接,供參考喲~
https://codelabs.developers.google.com/codelabs/keras-flowers-data/#2
https://codelabs.developers.google.com/codelabs/keras-flowers-transfer-learning/#2
https://codelabs.developers.google.com/codelabs/keras-flowers-convnets/#0
https://codelabs.developers.google.com/codelabs/keras-flowers-squeezenet/#0
此項(xiàng)目支持答疑,打開(kāi)下列網(wǎng)址提交你的問(wèn)題
https://colab.research.google.com/github/GoogleCloudPlatform/training-data-analyst/blob/master/courses/fast-and-lean-data-science/07_Keras_Flowers_TPU_squeezenet.ipynb
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4838瀏覽量
107785 -
python
+關(guān)注
關(guān)注
57文章
4876瀏覽量
90038 -
遷移學(xué)習(xí)
+關(guān)注
關(guān)注
0文章
74瀏覽量
5851
原文標(biāo)題:Colab 超火的 Keras/TPU 深度學(xué)習(xí)免費(fèi)實(shí)戰(zhàn),有點(diǎn) Python 基礎(chǔ)就能看懂的快速課程
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
INA301為什么在共模信號(hào)給到5V多一點(diǎn)點(diǎn)的時(shí)候,偏置電流會(huì)突然變大那么多?
什么都感覺(jué)會(huì)一點(diǎn)點(diǎn)腫么辦,求大神支招
一個(gè)顯示溫度的音樂(lè)時(shí)鐘(仿真+代碼),自己一點(diǎn)點(diǎn)敲的....
求altium designer10的教學(xué)視頻,比初學(xué)者高級(jí)一點(diǎn)點(diǎn)的
以前就有過(guò)一點(diǎn)點(diǎn)基礎(chǔ),想要認(rèn)認(rèn)真真學(xué)習(xí)AD這塊東西要怎么開(kāi)始啊
請(qǐng)問(wèn)Allegro中這種像原理圖一樣的外邊框是add line那樣一點(diǎn)點(diǎn)畫(huà)嗎?
如何將現(xiàn)有代碼一點(diǎn)點(diǎn)移植到HC32F460上呢
對(duì)交流共模電壓的一點(diǎn)點(diǎn)認(rèn)識(shí)
Python2.5安裝教程和Python搭建開(kāi)發(fā)環(huán)境的詳細(xì)資料免費(fèi)下載
用Python從頭實(shí)現(xiàn)一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)理解神經(jīng)網(wǎng)絡(luò)的原理1
用Python從頭實(shí)現(xiàn)一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)理解神經(jīng)網(wǎng)絡(luò)的原理2
用Python從頭實(shí)現(xiàn)一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)理解神經(jīng)網(wǎng)絡(luò)的原理3
用Python從頭實(shí)現(xiàn)一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)理解神經(jīng)網(wǎng)絡(luò)的原理4
僅會(huì)一點(diǎn)點(diǎn)python就能自己搭建一個(gè)神經(jīng)網(wǎng)絡(luò)!
評(píng)論