5大關鍵步驟！如何構建深度學習模型？

作者：讀芯術 2020-12-20 17:18:00

本文將詳細討論構建深度學習模型的五個基本步驟，以及如何使用這些步驟來處理各種深度學習項目。

本文轉載自公眾號“讀芯術”(ID：AI_Discovery)。

深度學習的關注度正持續(xù)上升，它是機器學習的一個子領域，基于人工神經(jīng)網(wǎng)絡的概念來執(zhí)行特定任務。然而在理論上，人工神經(jīng)網(wǎng)絡與人類大腦的運作方式并不相同，甚至都不相似!

它們之所以被命名為人工神經(jīng)網(wǎng)絡，是因為它們可以完成確切的任務，同時達到理想的精確度，而無需使用任何特定規(guī)則進行明確編程。

幾十年前AI失敗的主要原因是缺乏數(shù)據(jù)和計算能力。經(jīng)過數(shù)年時間，這一情況已顯著改善?；诖笮涂萍季揞^和跨國公司投資AI數(shù)據(jù)，數(shù)據(jù)的豐富程度已大大提高。而鑒于圖形處理單元(GPUs)功能強大，計算能力也不再是挑戰(zhàn)。

本文將詳細討論構建深度學習模型的五個基本步驟，以及如何使用這些步驟來處理各種深度學習項目。

1. 定義架構

深度學習是解決復雜任務的最優(yōu)方法之一，例如圖像分類或分割、人臉識別、目標檢測、聊天機器人等。但是，對于每一個復雜的項目，深度學習模型均需進行五個固定步驟以完成當前任務。

構建深度學習模型的第一步，也是最重要的一步就是成功定義網(wǎng)絡和架構。根據(jù)所執(zhí)行任務的類型，一般傾向于使用特定類型的體系結構。

通常，對于計算機視覺任務，如圖像分割、圖像分類、面部識別和其他類似項目，首選卷積神經(jīng)網(wǎng)絡(CNNs)或ConvNets。而對于自然語言處理和與文本數(shù)據(jù)相關的問題，遞歸神經(jīng)網(wǎng)絡(RNNs)和長短期記憶(LSTMs)更為可取。

在此步驟中，還可以決定整個深度學習架構的模型構建結構類型。執(zhí)行此操作的三個主要步驟是順序模型(Sequential Models)、功能性API或用戶定義的自定義架構。下文將更詳細地討論每種方法。

2. 編譯模型

首選架構構建完成后，將繼續(xù)進行構建模型的第二個步驟——編譯模型。編譯步驟通常是TensorFlow深度學習框架中的一行代碼，可以采用model.compile()函數(shù)進行編譯。

在深度學習中，編譯的要求是配置模型，以便成功完成擬合/訓練過程。正是在編譯中，為評估程序定義了培訓程序的一些關鍵組成部分。

列舉一些必要參數(shù)，下一步需要分配損耗、優(yōu)化器和指標。損耗的種類取決于所遇問題的類型以及亟待解決的問題。優(yōu)化器通常是指用于計算的adam、RMSprop或類似優(yōu)化器;指標是指用于分析的準確性度量或任何其他由用戶定義的衡量標準。