用自己的數(shù)據(jù)構(gòu)建一個(gè)簡單的卷積神經(jīng)網(wǎng)絡(luò)
在本文中,我們將構(gòu)建一個(gè)卷積神經(jīng)網(wǎng)絡(luò),將對7種類型的數(shù)千個(gè)圖像進(jìn)行訓(xùn)練,即:鮮花,汽車,貓,馬,人,自行車,狗,然后能夠預(yù)測是否給定的圖像是貓,狗或人。
該CNN實(shí)現(xiàn)使用自己的圖像數(shù)據(jù)集涵蓋以下主題
- 加載和預(yù)處理自己的數(shù)據(jù)集
- 在Keras設(shè)計(jì)和訓(xùn)練CNN模型
- 繪制損失和準(zhǔn)確度曲線
- 評估模型和預(yù)測測試圖像的輸出類
- 可視化CNN的中間層輸出
- 繪制結(jié)果的混淆矩陣
加載和預(yù)處理自己的數(shù)據(jù)集:
我們將使用的數(shù)據(jù)集包括從互聯(lián)網(wǎng)收集并標(biāo)記的7個(gè)類。Python代碼如下;
- PATH = os.getcwd()
- #Define data path
- data_path = PATH + '/data'
- data_dir_list = os.listdir(data_path)
- data_dir_list
輸出:
- ['bike', 'cars', 'cats', 'dogs', 'flowers', 'horses', 'human']
可視化一些圖像,我們可以看到圖像是128x128像素,Python代碼如下:
- #Visualize some images
- image = X_train[1441,:].reshape((128,128))
- plt.imshow(image)
- plt.show()
用自己的數(shù)據(jù)構(gòu)建一個(gè)簡單的卷積神經(jīng)網(wǎng)絡(luò)
接下來,我們開始在Keras中設(shè)計(jì)和編譯CNN模型,Python實(shí)現(xiàn)如下:
- #Initializing the input shape
- input_shape = img_data[0].shape
- #Design CNN sequential model
- model = Sequential ([
- Convolution2D(32,3,3, border_mode = 'same', activation = 'relu', input_shape = input_shape),
- Convolution2D(32,3,3, activation = 'relu'),
- MaxPooling2D(pool_size = (2,2)),
- Dropout(0.5),
- Convolution2D(64,3,3, activation = 'relu'),
- MaxPooling2D(pool_size = (2,2)),
- Dropout(0.5),
- Flatten(),
- Dense(64, activation = 'relu'),
- Dropout(0.5),
- Dense(num_classes, activation = 'softmax')
- ])
- #Compiling the model
- model.compile(
- loss = 'categorical_crossentropy',
- optimizer = 'adadelta',
- metrics = ['accuracy'])
在擬合模型之后,我們可以在整個(gè)迭代過程中可視化訓(xùn)練和驗(yàn)證。
- ist = model.fit (X_train, y_train,
- batch_size = 16,
- nb_epoch = num_epoch,
- verbose=1,
- validation_data = (X_test, y_test)
- )
我們現(xiàn)在可以使用我們的模型使用以下代碼預(yù)測新圖像的新類:
- # Predicting the test image
- print((model.predict(test_image)))
- print('Image class:', model.predict_classes(test_image))
正如我們在下面看到的,我們的模型正確地將圖像分類為class [0] - bike。
- [[3.6560327e-01 2.7960737e-06 1.2630007e-03 2.9311934e-01 1.6894026e-02
- 3.0998811e-01 1.3129448e-02]]
- Image class: [0]
這是一個(gè)混淆矩陣,沒有歸一化
我們現(xiàn)在可以保存模型和權(quán)重,以便在實(shí)際應(yīng)用程序中實(shí)現(xiàn)。