自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="wqsl0"></sub>

<blockquote id="wqsl0"><i id="wqsl0"></i></blockquote>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

【深度學(xué)習(xí)系列】用PaddlePaddle和Tensorflow實(shí)現(xiàn)經(jīng)典CNN網(wǎng)絡(luò)AlexNet

作者：Charlotte77 2018-04-11 09:30:41

人工智能深度學(xué)習(xí) 開發(fā)工具

上周我們用PaddlePaddle和Tensorflow實(shí)現(xiàn)了圖像分類，分別用自己手寫的一個簡單的CNN網(wǎng)絡(luò)simple_cnn和LeNet-5的CNN網(wǎng)絡(luò)識別cifar-10數(shù)據(jù)集。

上周我們用PaddlePaddle和Tensorflow實(shí)現(xiàn)了圖像分類，分別用自己手寫的一個簡單的CNN網(wǎng)絡(luò)simple_cnn和LeNet-5的CNN網(wǎng)絡(luò)識別cifar-10數(shù)據(jù)集。在上周的實(shí)驗(yàn)表現(xiàn)中，經(jīng)過200次迭代后的LeNet-5的準(zhǔn)確率為60%左右，這個結(jié)果差強(qiáng)人意，畢竟是二十年前寫的網(wǎng)絡(luò)結(jié)構(gòu)，結(jié)果簡單，層數(shù)也很少，這一節(jié)中我們講講在2012年的Image比賽中大放異彩的AlexNet，并用AlexNet對cifar-10數(shù)據(jù)進(jìn)行分類，對比上周的LeNet-5的效果。

什么是AlexNet？

　　AlexNet在ILSVRC-2012的比賽中獲得top5錯誤率15.3%的突破（第二名為26.2%），其原理來源于2012年Alex的論文《ImageNet Classification with Deep Convolutional Neural Networks》，這篇論文是深度學(xué)習(xí)火爆發(fā)展的一個里程碑和分水嶺，加上硬件技術(shù)的發(fā)展，深度學(xué)習(xí)還會繼續(xù)火下去。

AlexNet網(wǎng)絡(luò)結(jié)構(gòu)

　　由于受限于當(dāng)時的硬件設(shè)備，AlexNet在GPU粒度都做了設(shè)計(jì)，當(dāng)時的GTX 580只有3G顯存，為了能讓模型在大量數(shù)據(jù)上跑起來，作者使用了兩個GPU并行，并對網(wǎng)絡(luò)結(jié)構(gòu)做了切分，如下：

網(wǎng)絡(luò)結(jié)構(gòu)

Input輸入層

輸入為224×224×3的三通道RGB圖像，為方便后續(xù)計(jì)算，實(shí)際操作中通過padding做預(yù)處理，把圖像變成227×227×3。

C1卷積層

該層由：卷積操作 + Max Pooling + LRN（后面詳細(xì)介紹它）組成。

卷積層：由96個feature map組成，每個feature map由11×11卷積核在stride=4下生成，輸出feature map為55×55×48×2，其中55=(227-11)/4+1，48為分在每個GPU上的feature map數(shù)，2為GPU個數(shù)；

激活函數(shù)：采用ReLU；

Max Pooling：采用stride=2且核大小為3×3（文中實(shí)驗(yàn)表明采用2×2的非重疊模式的Max Pooling相對更容易過擬合，在top 1和top 5下的錯誤率分別高0.4%和0.3%），輸出feature map為27×27×48×2，其中27=(55-3)/2+1，48為分在每個GPU上的feature map數(shù)，2為GPU個數(shù)；

LRN：鄰居數(shù)設(shè)置為5做歸一化。

最終輸出數(shù)據(jù)為歸一化后的：27×27×48×2。

C2卷積層

該層由：卷積操作 + Max Pooling + LRN組成

卷積層：由256個feature map組成，每個feature map由5×5卷積核在stride=1下生成，為使輸入和卷積輸出大小一致，需要做參數(shù)為2的padding，輸出feature map為27×27×128×2，其中27=(27-5+2×2)/1+1，128為分在每個GPU上的feature map數(shù)，2為GPU個數(shù)；

激活函數(shù)：采用ReLU；

Max Pooling：采用stride=2且核大小為3×3，輸出feature map為13×13×128×2，其中13=(27-3)/2+1，128為分在每個GPU上的feature map數(shù)，2為GPU個數(shù)；

LRN：鄰居數(shù)設(shè)置為5做歸一化。

最終輸出數(shù)據(jù)為歸一化后的：13×13×128×2。

C3卷積層

該層由：卷積操作 + LRN組成（注意，沒有Pooling層）

輸入為13×13×256，因?yàn)檫@一層兩個GPU會做通信（途中虛線交叉部分）

卷積層：之后由384個feature map組成，每個feature map由3×3卷積核在stride=1下生成，為使輸入和卷積輸出大小一致，需要做參數(shù)為1的padding，輸出feature map為13×13×192×2，其中13=(13-3+2×1)/1+1，192為分在每個GPU上的feature map數(shù)，2為GPU個數(shù)；

激活函數(shù)：采用ReLU；

最終輸出數(shù)據(jù)為歸一化后的：13×13×192×2。

C4卷積層

該層由：卷積操作 + LRN組成（注意，沒有Pooling層）

卷積層：由384個feature map組成，每個feature map由3×3卷積核在stride=1下生成，為使輸入和卷積輸出大小一致，需要做參數(shù)為1的padding，輸出feature map為13×13×192×2，其中13=(13-3+2×1)/1+1，192為分在每個GPU上的feature map數(shù)，2為GPU個數(shù)；

激活函數(shù)：采用ReLU；

最終輸出數(shù)據(jù)為歸一化后的：13×13×192×2。

C5卷積層

該層由：卷積操作 + Max Pooling組成

卷積層：由256個feature map組成，每個feature map由3×3卷積核在stride=1下生成，為使輸入和卷積輸出大小一致，需要做參數(shù)為1的padding，輸出feature map為13×13×128×2，其中13=(13-3+2×1)/1+1，128為分在每個GPU上的feature map數(shù)，2為GPU個數(shù)；

激活函數(shù)：采用ReLU；

Max Pooling：采用stride=2且核大小為3×3，輸出feature map為6×6×128×2，其中6=(13-3)/2+1，128為分在每個GPU上的feature map數(shù)，2為GPU個數(shù).

最終輸出數(shù)據(jù)為歸一化后的：6×6×128×2。

F6全連接層

該層為全連接層 + Dropout

使用4096個節(jié)點(diǎn)；

激活函數(shù)：采用ReLU；

采用參數(shù)為0.5的Dropout操作

最終輸出數(shù)據(jù)為4096個神經(jīng)元節(jié)點(diǎn)。

F7全連接層

該層為全連接層 + Dropout

使用4096個節(jié)點(diǎn)；

激活函數(shù)：采用ReLU；

采用參數(shù)為0.5的Dropout操作

最終輸出為4096個神經(jīng)元節(jié)點(diǎn)。

輸出層

該層為全連接層 + Softmax

使用1000個輸出的Softmax

最終輸出為1000個分類。

AlexNet的優(yōu)勢

1. 使用了ReLu激活函數(shù)

　　----原始Relu-----

　　AlexNet引入了ReLU激活函數(shù)，這個函數(shù)是神經(jīng)科學(xué)家Dayan、Abott在《Theoretical Neuroscience》一書中提出的更精確的激活模型。原始的Relu激活函數(shù)（可參見 Hinton論文：《Rectified Linear Units Improve Restricted Boltzmann Machines》）我們比較熟悉，即 $m a x (0, x)$ ，這個激活函數(shù)把負(fù)激活全部清零（模擬上面提到的稀疏性），這種做法在實(shí)踐中即保留了神經(jīng)網(wǎng)絡(luò)的非線性能力，又加快了訓(xùn)練速度。
但是這個函數(shù)也有缺點(diǎn)：

在原點(diǎn)不可微
反向傳播的梯度計(jì)算中會帶來麻煩，所以Charles Dugas等人又提出Softplus來模擬上述ReLu函數(shù)（可視作其平滑版）：

$f (x) = l o g (1 + e x)$
$f' (x) = 1 1 + e - x (1)$

過稀疏性

　當(dāng)學(xué)習(xí)率設(shè)置不合理時，即使是一個很大的梯度，在經(jīng)過ReLu單元并更新參數(shù)后該神經(jīng)元可能永不被激活。

　　 ----Leaky ReLu----

　　為了解決上述過稀疏性導(dǎo)致的大量神經(jīng)元不被激活的問題，Leaky ReLu被提了出來：

f (x) = {a x (x < 0) x (x >= 0) (2)

　　其中 $α$ 是人工制定的較小值（如：0.1），它一定程度保留了負(fù)激活信息。

　　還有很多其他的對于ReLu函數(shù)的改進(jìn)，如Parametric ReLu，Randomized ReLu等，此處就不再展開講了。

2. Local Response Normalization 局部響應(yīng)均值

　　LRN利用相鄰feature map做特征顯著化，文中實(shí)驗(yàn)表明可以降低錯誤率，公式如下：

b i x, y = a i x , y ( k + α \cdot \sum m i n ( N - 1 , i + n / 2 ) j = m a x ( 0 , i - n / 2 ) ( a i x , y ) 2 ) β

　　公式的直觀解釋如下：

　　由于 $α$ 都是經(jīng)過了RELU的輸出，所以一定是大于0的，函數(shù) $\frac{1}{(k + α \sum x^{2})^{β}}$ ，取文中參數(shù)的圖像如下（橫坐標(biāo)為 $\sum x^{2}$ ）:

當(dāng) $\sum x^{2}$ 值較小時，即當(dāng)前節(jié)點(diǎn)和其鄰居節(jié)點(diǎn)輸出值差距不明顯且大家的輸出值都不太大，可以認(rèn)為此時特征間競爭激烈，該函數(shù)可以使原本差距不大的輸出產(chǎn)生顯著性差異且此時函數(shù)輸出不飽和

當(dāng) $\sum x^{2}$ 值較大時，說明特征本身有顯著性差別但輸出值太大容易過擬合，該函數(shù)可以令最終輸出接近0從而緩解過擬合提高了模型泛化性。

　　從模型集成的角度來看：

Y n = W n X n - 1

X n = F (Y n)

　　有Dropout網(wǎng)絡(luò)：

Y n = W n X n - 1

d n - 1 \sim B e r n o u l l i (p)

X n = d n - 1 ⊙ F (Y n)

　　其中 $p$ 為Dropout的概率（如p=0.5，即讓50%的神經(jīng)元隨機(jī)失活）， $n$ 為所在的層。

　　它是極端情況下的Bagging，由于在每步訓(xùn)練中，神經(jīng)元會以某種概率隨機(jī)被置為無效，相當(dāng)于是參數(shù)共享的新網(wǎng)絡(luò)結(jié)構(gòu)，每個模型為了使損失降低會盡可能學(xué)最“本質(zhì)”的特征，“本質(zhì)”可以理解為由更加獨(dú)立的、和其他神經(jīng)元相關(guān)性弱的、泛化能力強(qiáng)的神經(jīng)元提取出來的特征；而如果采用類似SGD的方式訓(xùn)練，每步迭代都會選取不同的數(shù)據(jù)集，這樣整個網(wǎng)絡(luò)相當(dāng)于是用不同數(shù)據(jù)集學(xué)習(xí)的多個模型的集成組合。

用PaddlePaddle實(shí)現(xiàn)AlexNet

1. 網(wǎng)絡(luò)結(jié)構(gòu)(alexnet.py)

　　這次我寫了兩個alextnet，一個加上了局部均值歸一化LRN，一個沒有加LRN，對比效果如何

 1 #coding:utf-8
 2 '''
 3 Created by huxiaoman 2017.12.5
 4 alexnet.py:alexnet網(wǎng)絡(luò)結(jié)構(gòu)
 5 '''
 6 
 7 import paddle.v2 as paddle
 8 import os
 9 
10 with_gpu = os.getenv('WITH_GPU', '0') != '1'
11 
12 def alexnet_lrn(img):
13     conv1 = paddle.layer.img_conv(
14         input=img,
15         filter_size=11,
16         num_channels=3,
17         num_filters=96,
18         stride=4,
19         padding=1)
20     cmrnorm1 = paddle.layer.img_cmrnorm(
21         input=conv1, size=5, scale=0.0001, power=0.75)
22     pool1 = paddle.layer.img_pool(input=cmrnorm1, pool_size=3, stride=2)
23 
24     conv2 = paddle.layer.img_conv(
25         input=pool1,
26         filter_size=5,
27         num_filters=256,
28         stride=1,
29         padding=2,
30         groups=1)
31     cmrnorm2 = paddle.layer.img_cmrnorm(
32         input=conv2, size=5, scale=0.0001, power=0.75)
33     pool2 = paddle.layer.img_pool(input=cmrnorm2, pool_size=3, stride=2)
34 
35     pool3 = paddle.networks.img_conv_group(
36         input=pool2,
37         pool_size=3,
38         pool_stride=2,
39         conv_num_filter=[384, 384, 256],
40         conv_filter_size=3,
41         pool_type=paddle.pooling.Max())
42 
43     fc1 = paddle.layer.fc(
44         input=pool3,
45         size=4096,
46         act=paddle.activation.Relu(),
47         layer_attr=paddle.attr.Extra(drop_rate=0.5))
48     fc2 = paddle.layer.fc(
49         input=fc1,
50         size=4096,
51         act=paddle.activation.Relu(),
52         layer_attr=paddle.attr.Extra(drop_rate=0.5))
53     return fc2
54 
55 def alexnet(img):
56     conv1 = paddle.layer.img_conv(
57         input=img,
58         filter_size=11,
59         num_channels=3,
60         num_filters=96,
61         stride=4,
62         padding=1)
63     cmrnorm1 = paddle.layer.img_cmrnorm(
64         input=conv1, size=5, scale=0.0001, power=0.75)
65     pool1 = paddle.layer.img_pool(input=cmrnorm1, pool_size=3, stride=2)
66 
67     conv2 = paddle.layer.img_conv(
68         input=pool1,
69         filter_size=5,
70         num_filters=256,
71         stride=1,
72         padding=2,
73         groups=1)
74     cmrnorm2 = paddle.layer.img_cmrnorm(
75         input=conv2, size=5, scale=0.0001, power=0.75)
76     pool2 = paddle.layer.img_pool(input=cmrnorm2, pool_size=3, stride=2)
77 
78     pool3 = paddle.networks.img_conv_group(
79         input=pool2,
80         pool_size=3,
81         pool_stride=2,
82         conv_num_filter=[384, 384, 256],
83         conv_filter_size=3,
84         pool_type=paddle.pooling.Max())
85 
86     fc1 = paddle.layer.fc(
87         input=pool3,
88         size=4096,
89         act=paddle.activation.Relu(),
90         layer_attr=paddle.attr.Extra(drop_rate=0.5))
91     fc2 = paddle.layer.fc(
92         input=fc1,
93         size=4096,
94         act=paddle.activation.Relu(),
95         layer_attr=paddle.attr.Extra(drop_rate=0.5))
96     return fc3

2.訓(xùn)練代碼（train_alexnet.py）

  1 #coding:utf-8
  2 '''
  3 Created by huxiaoman 2017.12.5
  4 train_alexnet.py:訓(xùn)練alexnet對cifar10數(shù)據(jù)集進(jìn)行分類
  5 '''
  6 
  7 import sys, os
  8 import paddle.v2 as paddle
  9 
 10 #alex模型為不帶LRN的
 11 from alexnet import alexnet
 12 #alexnet_lrn為帶有l(wèi)rn的
 13 #from alextnet import alexnet_lrn
 14 with_gpu = os.getenv('WITH_GPU', '0') != '1'
 15 
 16 
 17 def main():
 18     datadim = 3 * 32 * 32
 19     classdim = 10
 20 
 21     # PaddlePaddle init
 22     paddle.init(use_gpu=with_gpu, trainer_count=7)
 23 
 24     image = paddle.layer.data(
 25         name="image", type=paddle.data_type.dense_vector(datadim))
 26 
 27     # Add neural network config
 28     # option 1. resnet
 29     # net = resnet_cifar10(image, depth=32)
 30     # option 2. vgg
 31     #net = alexnet_lrn(image)
 32     net = alexnet(image)
 33     out = paddle.layer.fc(
 34         input=net, size=classdim, act=paddle.activation.Softmax())
 35 
 36     lbl = paddle.layer.data(
 37         name="label", type=paddle.data_type.integer_value(classdim))
 38     cost = paddle.layer.classification_cost(input=out, label=lbl)
 39 
 40     # Create parameters
 41     parameters = paddle.parameters.create(cost)
 42 
 43     # Create optimizer
 44     momentum_optimizer = paddle.optimizer.Momentum(
 45         momentum=0.9,
 46         regularization=paddle.optimizer.L2Regularization(rate=0.0002 * 128),
 47         learning_rate=0.1 / 128.0,
 48         learning_rate_decay_a=0.1,
 49         learning_rate_decay_b=50000 * 100,
 50         learning_rate_schedule='discexp')
 51 
 52     # End batch and end pass event handler
 53     def event_handler(event):
 54         if isinstance(event, paddle.event.EndIteration):
 55             if event.batch_id % 100 == 0:
 56                 print "\nPass %d, Batch %d, Cost %f, %s" % (
 57                     event.pass_id, event.batch_id, event.cost, event.metrics)
 58             else:
 59                 sys.stdout.write('.')
 60                 sys.stdout.flush()
 61         if isinstance(event, paddle.event.EndPass):
 62             # save parameters
 63             with open('params_pass_%d.tar' % event.pass_id, 'w') as f:
 64                 parameters.to_tar(f)
 65 
 66             result = trainer.test(
 67                 reader=paddle.batch(
 68                     paddle.dataset.cifar.test10(), batch_size=128),
 69                 feeding={'image': 0,
 70                          'label': 1})
 71             print "\nTest with Pass %d, %s" % (event.pass_id, result.metrics)
 72 
 73     # Create trainer
 74     trainer = paddle.trainer.SGD(
 75         cost=cost, parameters=parameters, update_equation=momentum_optimizer)
 76 
 77     # Save the inference topology to protobuf.
 78     inference_topology = paddle.topology.Topology(layers=out)
 79     with open("inference_topology.pkl", 'wb') as f:
 80         inference_topology.serialize_for_inference(f)
 81 
 82     trainer.train(
 83         reader=paddle.batch(
 84             paddle.reader.shuffle(
 85                 paddle.dataset.cifar.train10(), buf_size=50000),
 86             batch_size=128),
 87         num_passes=200,
 88         event_handler=event_handler,
 89         feeding={'image': 0,
 90                  'label': 1})
 91 
 92     # inference
 93     from PIL import Image
 94     import numpy as np
 95     import os
 96 
 97     def load_image(file):
 98         im = Image.open(file)
 99         im = im.resize((32, 32), Image.ANTIALIAS)
100         im = np.array(im).astype(np.float32)
101         im = im.transpose((2, 0, 1))  # CHW
102         im = im[(2, 1, 0), :, :]  # BGR
103         im = im.flatten()
104         im = im / 255.0
105         return im
106 
107     test_data = []
108     cur_dir = os.path.dirname(os.path.realpath(__file__))
109     test_data.append((load_image(cur_dir + '/image/dog.png'), ))
110 
111     probs = paddle.infer(
112         output_layer=out, parameters=parameters, input=test_data)
113     lab = np.argsort(-probs)  # probs and lab are the results of one batch data
114     print "Label of image/dog.png is: %d" % lab[0][0]
115 
116 
117 if __name__ == '__main__':
118     main()

用Tensorflow實(shí)現(xiàn)AlexNet

1. 網(wǎng)絡(luò)結(jié)構(gòu)

  1 def inference(images):
  2   '''
  3   Alexnet模型
  4   輸入：images的tensor
  5   返回：Alexnet的最后一層卷積層
  6   '''
  7   parameters = []
  8   # conv1
  9   with tf.name_scope('conv1') as scope:
 10     kernel = tf.Variable(tf.truncated_normal([11, 11, 3, 64], dtype=tf.float32,
 11                                              stddev=1e-1), name='weights')
 12     conv = tf.nn.conv2d(images, kernel, [1, 4, 4, 1], padding='SAME')
 13     biases = tf.Variable(tf.constant(0.0, shape=[64], dtype=tf.float32),
 14                          trainable=True, name='biases')
 15     bias = tf.nn.bias_add(conv, biases)
 16     conv1 = tf.nn.relu(bias, name=scope)
 17     print_activations(conv1)
 18     parameters += [kernel, biases]
 19 
 20   # lrn1
 21   with tf.name_scope('lrn1') as scope:
 22     lrn1 = tf.nn.local_response_normalization(conv1,
 23                                               alpha=1e-4,
 24                                               beta=0.75,
 25                                               depth_radius=2,
 26                                               bias=2.0)
 27 
 28   # pool1
 29   pool1 = tf.nn.max_pool(lrn1,
 30                          ksize=[1, 3, 3, 1],
 31                          strides=[1, 2, 2, 1],
 32                          padding='VALID',
 33                          name='pool1')
 34   print_activations(pool1)
 35 
 36   # conv2
 37   with tf.name_scope('conv2') as scope:
 38     kernel = tf.Variable(tf.truncated_normal([5, 5, 64, 192], dtype=tf.float32,
 39                                              stddev=1e-1), name='weights')
 40     conv = tf.nn.conv2d(pool1, kernel, [1, 1, 1, 1], padding='SAME')
 41     biases = tf.Variable(tf.constant(0.0, shape=[192], dtype=tf.float32),
 42                          trainable=True, name='biases')
 43     bias = tf.nn.bias_add(conv, biases)
 44     conv2 = tf.nn.relu(bias, name=scope)
 45     parameters += [kernel, biases]
 46   print_activations(conv2)
 47 
 48   # lrn2
 49   with tf.name_scope('lrn2') as scope:
 50     lrn2 = tf.nn.local_response_normalization(conv2,
 51                                               alpha=1e-4,
 52                                               beta=0.75,
 53                                               depth_radius=2,
 54                                               bias=2.0)
 55 
 56   # pool2
 57   pool2 = tf.nn.max_pool(lrn2,
 58                          ksize=[1, 3, 3, 1],
 59                          strides=[1, 2, 2, 1],
 60                          padding='VALID',
 61                          name='pool2')
 62   print_activations(pool2)
 63 
 64   # conv3
 65   with tf.name_scope('conv3') as scope:
 66     kernel = tf.Variable(tf.truncated_normal([3, 3, 192, 384],
 67                                              dtype=tf.float32,
 68                                              stddev=1e-1), name='weights')
 69     conv = tf.nn.conv2d(pool2, kernel, [1, 1, 1, 1], padding='SAME')
 70     biases = tf.Variable(tf.constant(0.0, shape=[384], dtype=tf.float32),
 71                          trainable=True, name='biases')
 72     bias = tf.nn.bias_add(conv, biases)
 73     conv3 = tf.nn.relu(bias, name=scope)
 74     parameters += [kernel, biases]
 75     print_activations(conv3)
 76 
 77   # conv4
 78   with tf.name_scope('conv4') as scope:
 79     kernel = tf.Variable(tf.truncated_normal([3, 3, 384, 256],
 80                                              dtype=tf.float32,
 81                                              stddev=1e-1), name='weights')
 82     conv = tf.nn.conv2d(conv3, kernel, [1, 1, 1, 1], padding='SAME')
 83     biases = tf.Variable(tf.constant(0.0, shape=[256], dtype=tf.float32),
 84                          trainable=True, name='biases')
 85     bias = tf.nn.bias_add(conv, biases)
 86     conv4 = tf.nn.relu(bias, name=scope)
 87     parameters += [kernel, biases]
 88     print_activations(conv4)
 89 
 90   # conv5
 91   with tf.name_scope('conv5') as scope:
 92     kernel = tf.Variable(tf.truncated_normal([3, 3, 256, 256],
 93                                              dtype=tf.float32,
 94                                              stddev=1e-1), name='weights')
 95     conv = tf.nn.conv2d(conv4, kernel, [1, 1, 1, 1], padding='SAME')
 96     biases = tf.Variable(tf.constant(0.0, shape=[256], dtype=tf.float32),
 97                          trainable=True, name='biases')
 98     bias = tf.nn.bias_add(conv, biases)
 99     conv5 = tf.nn.relu(bias, name=scope)
100     parameters += [kernel, biases]
101     print_activations(conv5)
102 
103   # pool5
104   pool5 = tf.nn.max_pool(conv5,
105                          ksize=[1, 3, 3, 1],
106                          strides=[1, 2, 2, 1],
107                          padding='VALID',
108                          name='pool5')
109   print_activations(pool5)
110 
111   return pool5, parameters

　　完整代碼可見：alexnet_tf.py

實(shí)驗(yàn)結(jié)果對比

　　三個代碼跑完后，對比了一下實(shí)驗(yàn)結(jié)果，如圖所示：

　　可以看到，在batch_size，num_epochs，devices和thread數(shù)都相同的條件下，加了LRN的paddlepaddle版的alexnet網(wǎng)絡(luò)結(jié)果效果最好，而時間最短的是不加LRN的alexnet，在時間和精度上都比較平均的是tensorflow版的alexnet，當(dāng)然，tf版的同樣加了LRN，所以LRN對于實(shí)驗(yàn)效果還是有一定提升的。

總結(jié)

　　AlexNet在圖像分類中是一個比較重要的網(wǎng)絡(luò)，在學(xué)習(xí)的過程中不僅要學(xué)會寫網(wǎng)絡(luò)結(jié)構(gòu)，知道每一層的結(jié)構(gòu)，更重要的是得知道為什么要這樣設(shè)計(jì)，這樣設(shè)計(jì)有什么好處，如果對某些參數(shù)進(jìn)行一些調(diào)整結(jié)果會有什么變化？為什么會產(chǎn)生這樣的變化。在實(shí)際應(yīng)用中，如果需要對網(wǎng)絡(luò)結(jié)構(gòu)做一些調(diào)整，應(yīng)該如何調(diào)整使得網(wǎng)絡(luò)更適合我們的實(shí)際數(shù)據(jù)？這些才是我們關(guān)心的。也是面試中常常會考察的點(diǎn)。昨天面試了一位工作五年的算法工程師，問道他在項(xiàng)目中用的模型是alexnet，對于alexnet的網(wǎng)絡(luò)結(jié)構(gòu)并不是非常清楚，如果要改網(wǎng)絡(luò)結(jié)構(gòu)也不知道如何改，這樣其實(shí)不好，僅僅把模型跑通只是第一步，后續(xù)還有很多工作要做，這也是作為算法工程師的價值體現(xiàn)之一。本文對于alexnet的網(wǎng)絡(luò)結(jié)構(gòu)參考我之前的領(lǐng)導(dǎo)寫的文章，如過有什么不懂的可以留言。

ps:為了方便大家及時看到我的更新，我搞了一個公眾號，以后文章會同步發(fā)布與公眾號和博客園，這樣大家就能及時收到通知啦，有不懂的問題也可以在公眾號留言，這樣我能夠及時看到并回復(fù)。（公眾號剛開始做，做的比較粗糙，里面還沒有東西 = =，后期會慢慢完善~~）

可以通過掃下面的二維碼或者直接搜公眾號：CharlotteDataMining 就可以了，謝謝關(guān)注^_^

參考文獻(xiàn)

1.AlexNet: http://www.cs.toronto.edu/~fritz/absps/imagenet.pdf

我的博客即將同步至騰訊云+社區(qū)，邀請大家一同入駐。

責(zé)任編輯：張燕妮來源： www.cnblogs.com

深度學(xué)習(xí)

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營