自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

美團云GPU云主機在圖像識別領域的應用實踐

運維 服務器運維

前言

近幾年人工智能迎來發(fā)展高峰,越來越多的人開始意識到,機器可以通過學習擁有智能,進而取代一部分人類工作,這促成了人工智能的技術研究達到***的熱度。深度學習便是目前主流的研究領域,并被認為是***研究前景和發(fā)展?jié)摿Φ姆较颉?/p>

深度學習的研究動機是建立可模仿人腦進行學習的神經網絡,分為有監(jiān)督學習和無監(jiān)督學習兩種,目前主流的深度學習框架包括:TensorFlow、Caffe、Theano、MXNet、Marvin、Torch等等。下面選擇其中4種框架進行對比,分別為TensorFlow、Caffe、Theano和MXNet,并介紹基于深度學習的圖像識別在美團酒旅業(yè)務中的應用實踐以及美團云GPU云主機在其中發(fā)揮的作用。

不同深度學習框架的對比

TensorFlow是谷歌開源的一款深度學習框架,目前應用最為廣泛,支持圖像、文字、語音的識別,自然語言處理等功能,可以說是一種通用型學習框架;Theano支持手寫字識別、圖像分類、自然語言處理等功能,但是比TensorFlow速度要快;Caffe在計算機視覺領域表現突出;MXNet是上述幾種框架中擴展性***的,支持CNN(卷積神經網絡)、RNN(遞歸神經網絡)、LSTM(長短期記憶網絡),并且也能夠支持多種功能,亞馬遜就選擇了MXNet作為其深度學習框架。

下面通過語言、速度、靈活性、適用模型、上手難度等方面對比四種框架。

 

 

(表1)

 

 

(圖1)

從表1中的綜合對比來看,這四種框架各有優(yōu)劣,MXNet綜合能力更全面。從圖1中可以看出單卡GPU處理下,MXNet的loss是這四種框架中***的,所用時間也最短。

TensorFlow在性能上和其他框架相比劣勢比較明顯,但靈活性很高,支持各種復雜的網絡模型,方便配置新的算法和環(huán)境并且支持可視化;

Caffe在圖片處理上的速度很快,用K40 GPU處理圖片可以達到2ms/張的速度,并且在學術及工業(yè)領域有很多可以借鑒的項目;

Theano支持語言較少,其他方面表現都還不錯,是一種適合學術研究的學習框架。

在美團酒旅業(yè)務場景中,美團云提供預裝了TensorFlow框架的GPU云主機來進行圖像識別訓練。

基于深度學習的圖像識別在酒旅業(yè)務中的應用

深度學習需要大規(guī)模數據的運算來訓練模型,其性能主要受GPU浮點運算能力的影響,所以選擇合適的GPU是提升訓練效率的重中之重。

選擇GPU主要考慮三方面因素:浮點運算能力、功耗和成本。一般情況下,GPU的浮點計算能力與其功耗成正比,另外現在GPU的更新換代速度比較快,所以大規(guī)模堆置高性能機器可能會造成一定程度的資源浪費。

美團云提供的GPU云主機搭載了NVIDIA Tesla M60 GPU,預裝了TensorFlow 1.1-GPU框架和Keras 2.0.4框架。M60可提供***4096個并行處理核心,16GB的GDDR5顯存及9.7TFlops 的單精度峰值性能。選擇M60也是綜合考量了性能、功耗以及成本三個方面的結果,美團酒旅圖像識別的算法訓練所選用的就是預裝了TensorFlow 1.1-GPU框架的M60 GPU云主機。

在酒旅的業(yè)務場景中,身份信息驗證、機票驗證、在線值機、驗證碼驗證等都可以利用圖像識別尤其是OCR識別技術來支持系統自動識別用戶信息,簡化用戶操作流程,并提高信息錄入的速度和準確度。

驗證識別中的主要流程包括:去噪點、去色、切片、模板對比、輸出5個環(huán)節(jié),因此在基于深度學習的OCR識別中,美團酒旅團隊選擇了CNN(Convolutional Neural Network)+LSTM(Long Short-Term Memory)+CTC(Connectionist temporal classification)的組合算法方案:

——CNN即卷積神經網絡,包括卷積層和池層,是一種前饋神經網絡,CNN在大規(guī)模圖像處理中表現出色,因此用CNN來進行圖像特征的提取;

——LSTM是遞歸神經網絡(RNN)的一種,即時間遞歸神經網絡,適合處理和預測時間序列中間隔和延遲相對較長的重要事件,因此采用LSTM來提取時序關系最為合適;

——CTC是一種基于神經網絡的時序分類,可以實現一個輸入序列一個輸出序列就可以完成訓練。因為在輸出長度固定的情況下,選擇引入CTC來預測輸出。

 

 

(圖2:算法模型)

基于此混合算法的模型訓練,識別精度目前可以達到單次識別準確率90%以上,5次識別準確率99%以上,對于宋體、楷書等文字識別的準確率可以達到80%以上。隨著模型和算法的優(yōu)化,準確率還將不斷提升。

結語

除了在酒旅業(yè)務場景中應用圖像識別之外,美團點評在自然語言處理、人臉識別等多個領域都有所探索,美團云GPU云主機為上述領域的研究提供了訓練支撐,幫助加速訓練過程,完善算法。

目前,美團云主要提供單機單卡的GPU云主機,未來還將研究單機單卡、單機多卡與多機多卡等方式之間的性能及成本差異,提供更符合用戶需求的GPU計算服務。

 

此外,美團云于近日上線了深度學習平臺,并開放了人臉識別、OCR識別等AI應用,提供一站式AI服務。

責任編輯:Jane 來源: 未知
相關推薦

2022-03-15 10:20:00

云原生系統實踐

2016-12-01 14:23:32

iosandroid

2022-03-25 10:47:59

架構實踐美團

2015-12-03 16:01:18

Google人像識別API

2022-08-09 09:18:47

優(yōu)化實踐

2014-12-08 13:41:39

美團SSD云主機

2014-12-05 15:47:13

美團云

2022-10-20 09:33:35

2017-05-26 16:42:06

2022-03-17 21:42:20

美團插件技術

2017-06-05 13:31:44

互聯網

2017-02-20 19:23:13

2020-03-23 12:58:34

美團公有云互聯網

2013-05-15 09:56:01

云主機云計算

2017-06-01 10:52:35

互聯網

2022-09-09 14:42:17

應用開發(fā)ETS

2024-06-07 11:24:20

2018-07-13 09:53:27

移動應用美團代碼

2024-06-18 08:16:49

2020-08-14 09:58:02

Kubernetes云平臺容器
點贊
收藏

51CTO技術棧公眾號