自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<var id="ysg02"><strong id="ysg02"></strong></var>

<meter id="ysg02"><tt id="ysg02"><small id="ysg02"></small></tt></meter>

<nobr id="ysg02"><code id="ysg02"></code></nobr>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

PyTorch&TensorFlow跑分對決：哪個平臺運行NLP模型推理更快

作者：曉查 2019-10-21 13:40:20

新聞前端機器學習

開源社區(qū)的支持度、上手的難易度都是重要的參考。還有人說：學術界用PyTorch，工業(yè)界用TensorFlow。

關于PyTorch和TensorFlow誰更好的爭論，從來就沒有停止過。

開源社區(qū)的支持度、上手的難易度都是重要的參考。還有人說：學術界用PyTorch，工業(yè)界用TensorFlow。

[[279747]]

然而還有一項不可忽略的因素，就是二者的實際性能。

沒關系，不服跑個分？！

最近，一位來自“Huggingface”的工程師，使用了NLP中的Transformer模型，分別在兩大平臺上測試了一組推理速度。

雖然Huggingface只是一家創(chuàng)業(yè)公司，但是在NLP領域有著不小的聲譽，他們在GitHub上開源的項目，只需一個API就能調(diào)用27個NLP模型廣受好評，已經(jīng)收獲1.5萬星。

PyTorch和TensorFlow究竟哪個更快？下面用詳細評測的數(shù)據(jù)告訴你。

運行環(huán)境

作者在PyTorch 1.3.0、TenserFlow2.0上分別對CPU和GPU的推理性能進行了測試。

兩種不同的環(huán)境中具體硬件配置如下：

CPU推理：使用谷歌云平臺上的n1-standard-32硬件，即32個vCPU、120GB內(nèi)存，CPU型號為2.3GHz的英特爾至強處理器。
GPU推理：使用谷歌云平臺上的定制化硬件，包含12個vCPU、40GB內(nèi)存和單個V100 GPU（16GB顯存）。

[[279748]]

在測試過程中使用本地Python模塊的timeit來測量推理時間。每個實驗重復30次，然后對這30個值取平均值，獲得平均推理時間。

NLP模型的Batch Size設置為分別設置為1、2、4、8，序列長度為8、64,、128、256、512、1024。

測試結果

話不多說，先上跑分結果：

PyTorch&TensorFlowè·‘åˆ†å¯¹å†³ï¼šå“ªä¸ªå¹³å°è¿è¡ŒNLPæ¨¡åž‹æŽ¨ç†æ›´å¿«

在大多數(shù)情況下，這兩個平臺都能獲得相似的結果。與PyTorch相比，TensorFlow在CPU上通常要慢一些，但在GPU上要快一些：

在CPU上，PyTorch的平均推理時間為0.748s，而TensorFlow的平均推理時間為0.823s。

在GPU上，PyTorch的平均推理時間為0.046s，而TensorFlow的平均推理時間為0.043s。

以上的數(shù)據(jù)都是在所有模型總的平均結果。結果顯示，輸入大小（Batch Size×序列長度）越大，對最終結果的影響也越大。

當輸入太大時，PyTorch會出現(xiàn)內(nèi)存不足的情況。作者把這些部分從結果中刪除，因此這會使結果偏向PyTorch。

總的來說，PyTorch模型比TensorFlow模型更容易耗盡內(nèi)存。除了Distilled模型之外，當輸入大小達到8的Batch Size和1024的序列長度時，PyTorch就會耗盡內(nèi)存。

至于更完整詳細的清單，請參閱文末的Google文檔鏈接。

兩大平臺的加速工具

除了初步的測試，作者還用上兩個平臺獨有的加速工具，看看它們對模型推理速度有多大的提升。

PyTorch&TensorFlowè·‘åˆ†å¯¹å†³ï¼šå“ªä¸ªå¹³å°è¿è¡ŒNLPæ¨¡åž‹æŽ¨ç†æ›´å¿«

TorchScript是PyTorch創(chuàng)建可序列化模型的方法，讓模型可以在不同的環(huán)境中運行，而無需Python依賴項，例如C++環(huán)境。

TorchScript似乎非常依賴于模型和輸入大?。?/p>

使用TorchScript可以在XLNet上產(chǎn)生永久的性能提升，而在XLM上使用則會不可靠；

在XLM上，TorchScript可以提高較小輸入時的性能，但會降低較大輸入時的性能。

平均而言，使用TorchScript跟蹤的模型，推理速度要比使用相同PyTorch非跟蹤模型的快20％。

PyTorch&TensorFlowè·‘åˆ†å¯¹å†³ï¼šå“ªä¸ªå¹³å°è¿è¡ŒNLPæ¨¡åž‹æŽ¨ç†æ›´å¿«

XLA是可加速TensorFlow模型的線性代數(shù)編譯器。作者僅在基于TensorFlow的自動聚類功能的GPU上使用它，這項功能可編譯一些模型的子圖。結果顯示：

啟用XLA提高了速度和內(nèi)存使用率，所有模型的性能都有提高。

大多數(shù)基準測試的運行速度提升到原來的1.15倍。在某些極端情況下，推理時間減少了70％，尤其是在輸入較小的情況下。

最后，作者還在Google文檔的列表里還加入了“訓練”選項卡，或許不久后就能看到兩大平臺上的訓練測試對比，唯一擋在這項測試面前的障礙可能就是經(jīng)費了。

傳送門

原文鏈接：

https://medium.com/huggingface/benchmarking-transformers-pytorch-and-tensorflow-e2917fb891c2

完整跑分清單：

https://docs.google.com/spreadsheets/d/1sryqufw2D0XlUH4sq3e9Wnxu5EAQkaohzrJbd5HdQ_w/edit#gid=0

責任編輯：張燕妮來源：量子位

代碼開發(fā)工具

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<em id="0ywoe"><button id="0ywoe"><nobr id="0ywoe"></nobr></button></em>

<thead id="0ywoe"><acronym id="0ywoe"><em id="0ywoe"></em></acronym></thead>

<tt id="0ywoe"><option id="0ywoe"></option></tt>

<bdo id="0ywoe"><source id="0ywoe"><pre id="0ywoe"></pre></source></bdo>