自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Facebook萬字長文:AI模型全部遷移至PyTorch框架

新聞 人工智能
近日,F(xiàn)acebook宣布要將所有的人工智能系統(tǒng)遷移到PyTorch。

  PyTorch自2017年推出以來,就迅速占領(lǐng)GitHub熱度榜榜首,一度有趕超Tensorflow的趨勢。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

這是一個開源的Python機器學習庫,基于Torch,底層由C++實現(xiàn)。

近日,F(xiàn)acebook宣布要將所有的人工智能系統(tǒng)遷移到PyTorch。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

Facebook的AI模型每天為使用自家技術(shù)的數(shù)十億人執(zhí)行數(shù)萬億次推理操作。

為了滿足這種不斷增長的需求,F(xiàn)acebook 需要不斷發(fā)展自身的 AI 框架。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

PyTorch 的誕生

考慮到Python在計算科學領(lǐng)域的領(lǐng)先地位,以及其生態(tài)完整性和接口易用性,幾乎任何框架都不可避免地要提供Python接口。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

因此,在2016年,F(xiàn)acebook 的一組人工智能研究人員開始與人工智能研究團體合作,迎接這些挑戰(zhàn)。

為了更好地理解什么是可用的,什么是需要的,他們試驗了機器學習(ML)框架,如 Theano 和 Torch,以及 Lua Torch、 Chainer 和 HIPS Autograd 的先進概念。

經(jīng)過幾個月的開發(fā),PyTorch 誕生了。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

PyTorch不是簡單地封裝Lua Torch提供Python接口,而是對Tensor之上的所有模塊進行了重構(gòu),并新增了最先進的自動求導(dǎo)系統(tǒng),成為當下最流行的動態(tài)圖框架。

PyTorch 最初版本在開源社區(qū)GitHub中引起了轟動,并且很快成為人工智能研究人員首選的深度學習庫。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

PyTorch 提供了一個無約束的環(huán)境,在這個環(huán)境中,程序員們可以真正地表達自己的想法。

一經(jīng)推出就立刻引起了廣泛關(guān)注,并迅速在研究領(lǐng)域流行起來。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

PyTorch自發(fā)布起關(guān)注度就在不斷上升,截至2017年10月18日,PyTorch的熱度已然超越了其他三個框架(Caffe、MXNet和Theano),并且其熱度還在持續(xù)上升中。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

2018年初,PyTorch 1.0的發(fā)布開啟了將 PyTorch 的研究和生產(chǎn)能力統(tǒng)一到一個框架中工作。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

來自 Facebook 的 PyTorch 支持的技術(shù)

上面提到的眾多好處已經(jīng)在 Facebook 上得到了驗證。從 Instagram的個性化功能到AR和VR的新興應(yīng)用程序,在眾多應(yīng)用中PyTorch都起到了增強技術(shù)和服務(wù)的作用。同時,也精簡了工作流程,減少了改進系統(tǒng)所需的時間。

Instagram個性化技術(shù)

Instagram個性化團隊的任務(wù)是不斷改進和完善推薦引擎。

國外用戶可以通過多渠道接收、發(fā)現(xiàn)Ins消息推送,比如Feeds, Stories, Reels,用戶通過這些渠道找到與自己有關(guān)且感興趣的內(nèi)容,這一功能都要歸功于內(nèi)后的機器學習算法.

Facebook萬字長文:AI模型全部遷移至PyTorch框架

有了 PyTorch,Ins團隊可以更快地讓Instagram成為探索你感興趣的內(nèi)容并與家人和朋友分享的最佳平臺之一。

如今,不斷改進對Instagram用戶的推薦意味著訓(xùn)練模型,最大可達10TB。

在 PyTorch 之前,訓(xùn)練和調(diào)試這些大規(guī)模模型可能需要數(shù)月時間,現(xiàn)在有了PyTorch,只需要幾周,甚至幾天時間。

在 PyTorch中實現(xiàn)新的訓(xùn)練技術(shù),可以讓不同團隊數(shù)百名工程師快速采用和實驗這些技術(shù)。它還簡化了跨團隊標準的創(chuàng)建,使部署和改進這些模型變得更加容易。

該團隊還對其編寫和訓(xùn)練基礎(chǔ)設(shè)施進行了改進,允許模型自動分片(分成更小的塊) ,以便在主機上訓(xùn)練更大的模型。

他們還采用了如流水線和分層培訓(xùn)(將一個學習任務(wù)分解成一系列子問題或任務(wù))等培訓(xùn)范式,允許模型在不降低質(zhì)量的情況下使用更多數(shù)據(jù)。

人物分割模型

AR和VR正逐漸成為Facebook的重要組成部分。

舉例來說,一個內(nèi)容創(chuàng)作者或普通用戶——只是和朋友一起玩短視頻的人,他們拍的視頻用了個性化、計算機生成的圖形和背景。

現(xiàn)在,想象一下他們在自己的移動設(shè)備上完成這些,不需要使用專業(yè)的繪圖軟件或者視頻制作設(shè)備。

這就是AR的應(yīng)用前景,PyTorch 通過顯著加快訓(xùn)練過程并縮小這些模型的規(guī)模,使其成為可能。

例如,研究AR體驗的研究人員創(chuàng)建了人物分割模型,這種模型僅使用手機的攝像頭就可以跟蹤人們在視頻中的動作(包括識別他們的手和頭發(fā))。

當軟件捕獲一個人在物理空間中的位置時,它就會在人物周圍放置增強現(xiàn)實圖形,以及這些圖形應(yīng)該如何與人物交互。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

△ 人物分割可以讓人們直接在移動設(shè)備上為視頻創(chuàng)建AR效果

最初開發(fā)這些模型時,它們的大小和復(fù)雜性意味著為特定效果部署一個模型可能需要長達三天的時間,這還不包括調(diào)試模型修復(fù)任何錯誤的時間。

然后還有跨設(shè)備的功能問題。有時模型在某些設(shè)備或操作系統(tǒng)上運行速度不如其他設(shè)備或操作系統(tǒng)快,導(dǎo)致用戶體驗不一致。

現(xiàn)在,使用 PyTorch 開發(fā)的相同模型,可以在幾分鐘內(nèi)(如果不是幾秒鐘的話)跨多個設(shè)備和操作系統(tǒng)進行部署。

模型使用 Detectron2Go (D2Go)進行訓(xùn)練,這是一個新的、最先進的 PyTorch 擴展。

D2Go是同類工具中的第一個,它允許開發(fā)者將他們的機器學習模型從訓(xùn)練階段一直帶到移動設(shè)備上的部署階段。

自從今年4月完成模型遷移到PyTorch 以來,推斷時間提高了14% ,模型加載速度提高了24% ,這使得團隊可以在延遲相同的情況下,在移動設(shè)備上部署更復(fù)雜、更精確的模型。

PyTorch加入網(wǎng)絡(luò)有害內(nèi)容對抗

Facebook AI的一個核心重點是部署尖端的機器學習技術(shù),保護人們免受仇恨言論和錯誤信息等有害內(nèi)容的傷害。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

我們的目標是為每一種內(nèi)容形式,為世界各地的每一種語言和社區(qū),快速準確地識別這些違反政策的內(nèi)容。

在大規(guī)模對抗不斷規(guī)避我們系統(tǒng)的敵人時,這項任務(wù)難度系數(shù)越來越高。

這些挑戰(zhàn)復(fù)雜、微妙、變化還很快。我們將繼續(xù)探索人工智能如何成為檢測有害內(nèi)容更有效的工具,為了做到這一點,F(xiàn)acebook AI的工程師們正在利用 PyTorch 來幫助他們更快地開發(fā)新的、更強大的模型,并改進當前的模型。

利用PyTorch,F(xiàn)acebook的工程師們開發(fā)了 Facebook AI Multimodal (FAIM) ,這是一個內(nèi)部庫和 SDK,允許開發(fā)者快速創(chuàng)建、優(yōu)化和部署定制的多模式模型,以適應(yīng)特定的有害問題(例如,錯誤信息和仇恨言論) ,這意味著他們可以通過圖像、文本、評論和其他元素全面識別內(nèi)容。

FAIM 模型并不依賴于一系列不同的模型,而是專注于自己的內(nèi)容類型或模式,它能夠分析所有類型的內(nèi)容(圖片、視頻等)。

一個模型是Whole Post Integrity Embeddings(WPIE) ,這是一個經(jīng)過訓(xùn)練可以識別不同形式有害內(nèi)容的服務(wù)。因此,WPIE 對內(nèi)容有了更深入的了解,能夠在各種情況下識別有害內(nèi)容,并隨著有害內(nèi)容的新形式的出現(xiàn)迅速改進。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

這樣做的好處是更快、更有效、更全面地分析內(nèi)容。例如,看起來無傷大雅的句子或圖像,當組合在一起時,可能會呈現(xiàn)出完全不同的上下文。

今天,超過85% 的面向用戶的多模式產(chǎn)品模型使用PyTorch和FAIM. 使用 FAIM 創(chuàng)建的模型,如 WPIE,可以理解視覺和文本概念的深層交互,這意味著它們可以更準確和徹底地檢測有害內(nèi)容。

雖然像FAIM這樣的人工智能工具并不是我們解決有問題內(nèi)容的唯一方法,但它們確實幫助我們更加適應(yīng)如何大規(guī)模應(yīng)對這些挑戰(zhàn)。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

文本到語音

隨著語音助手和類似技術(shù)變得越來越普遍,無論是易用性還是可用性,我們的工程師正在努力使語音互動變得像人類交談一樣自然。

這些系統(tǒng)的行為和聲音越像人類,我們與他們的互動就越無縫。

如今,F(xiàn)acebook 的工程師團隊正在使用 PyTorch 創(chuàng)建一些語音應(yīng)用程序的模型,這些程序包括 Facebook 的「你的名字如何發(fā)音」功能、 Portal 上的語音交互,以及文本到語音(text-to-speech,TTS)功能。

[[404251]]

Facebook 的 TTS 團隊最近構(gòu)建并部署了一個具有最先進音頻質(zhì)量的系統(tǒng),該系統(tǒng)部署在 CPU 服務(wù)器上,沒有任何專門的硬件。

新的 TTS 系統(tǒng)具有很高的靈活性,將在 Facebook 產(chǎn)品中創(chuàng)建新的語音應(yīng)用程序方面發(fā)揮作用,這些語音應(yīng)用程序聽起來更加真實和自然,其中還包括 VR 語音功能和閱讀輔助功能。

PyTorch簡化了 TTS 團隊的整個開發(fā)流水線,使新模型的開發(fā)、試驗和訓(xùn)練變得更容易。

在模型訓(xùn)練端,PyTorch 具有方便、靈活和易于使用的界面、 python 編碼、高度優(yōu)化的操作員內(nèi)核的綜合套件以及高效的multi-GPU原語,使模型既易于調(diào)試又能快速進行大規(guī)模訓(xùn)練。

在模型推理和部署方面,PyTorch 有一個強大的、基于TorchScript的模型優(yōu)化管道,可以將計算圖轉(zhuǎn)換為部署環(huán)境中最有效的形式。

PyTorch 的輕量級和高性能移動運行時(runtime)為團隊提供了低計算和內(nèi)存占用的高性能模型推理服務(wù)。

在未來,部分歸功于PyTorch,語音系統(tǒng)不僅能夠理解越來越多的語言,而且還能夠根據(jù)語境線索做出相應(yīng)的反應(yīng),比如某人聲音的音調(diào)或音量,甚至是背景噪音的大小。

光學字符識別

眾所周知,互聯(lián)網(wǎng)是圖片匯集地。

Facebook萬字長文:AI模型全部遷移至PyTorch框架

△ 圖片交易公司gettyimages官網(wǎng)截圖

理解圖片中出現(xiàn)的文本,無論是個人照片還是商業(yè)照片,包含信息的圖像,如地圖或菜單,甚至只是一個有趣的meme,會變得越來越重要。

照片搜索,視障人士的屏幕閱讀器,以及識別和刪除有害內(nèi)容都依賴于機器學習系統(tǒng),該系統(tǒng)可以從圖像和視頻中分析文本。

其中一個系統(tǒng)是 Facebook AI 開發(fā)的光學字符識別(OCR)系統(tǒng)。

OCR 可以從圖像和視頻中定位和提取多種語言文本,用于從完整性到搜索的各種案例。通過將OCR的框架切換到PyTorch,團隊已經(jīng)能夠使系統(tǒng)更加強健,更容易。

OCR 有兩個主要模型: 一個用于文本檢測,另一個用于文本識別。

文本檢測模型是使用 Detectron 2訓(xùn)練的,這是一個基于PyTorch的目標檢測模型庫。部署和調(diào)試。

考慮到訓(xùn)練這些模型所需的數(shù)據(jù)量和模型本身的大小,延遲通常是開發(fā)人員所關(guān)心的問題。

但是轉(zhuǎn)移到 PyTorch 就會變得更加流暢,這將允許他們在模型的體系結(jié)構(gòu)上進行快速的實驗和迭代,并且更加有效地調(diào)試和部署模型。

該團隊目前正在開發(fā)一個新的端到端模型,它可以在一個統(tǒng)一的設(shè)計中處理文本檢測和文本識別,這個設(shè)計從訓(xùn)練到部署將完全基于 PyTorch.

將AI模型遷移至PyTorch的優(yōu)勢在哪?

PyTorch 遷移的目標是為工程師和開發(fā)人員創(chuàng)建一個更順暢的端到端開發(fā)人員體驗。

平均每天有4000多個模型在 PyTorch 上運行。

Facebook 的開發(fā)人員在他們的模型完全遷移到 PyTorch 之前經(jīng)歷了多個階段,包括關(guān)鍵的離線和在線測試、訓(xùn)練(通常還有再訓(xùn)練)、推斷和發(fā)布。

還進行了多個測試,以檢查 Caffe2和 PyTorch 之間的性能和正確性差異,這可能需要工程師長達數(shù)周的時間才能完成。

有了 PyTorch 作為支持 Facebook 所有人工智能工作負載的底層平臺,工程師可以在幾分鐘內(nèi)而不是幾周內(nèi)部署新的人工智能模型,建立更強大、更高效的系統(tǒng),為新的體驗提供動力等等。

以 PyTorch 作為常用的人工智能框架優(yōu)勢:

1、人工智能模型更容易構(gòu)建、編程、測試和調(diào)試

2、研究和生產(chǎn)環(huán)境變得更加緊密

3、在設(shè)備上部署加快

目前有超過1800個實體為 PyTorch 社區(qū)做出貢獻,包括加州理工學院等機構(gòu)和 OpenAI 等推動人工智能研究的公司。

論壇擁有超過4萬的活躍用戶,在GitHub上有超過7萬的下游項目使用 PyTorch。

在學術(shù)方面,僅從2019年6月到2020年6月,PyTorch 在 ArXiv 上的引用數(shù)量就比去年同期增長了127% .

根據(jù)谷歌學術(shù)搜索,PyTorch 論文的原始版本被引用了4400多次。

[[404254]]

 

 

責任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-05-10 12:59:58

PyTorch人工智能

2022-07-19 16:03:14

KubernetesLinux

2021-10-18 11:58:56

負載均衡虛擬機

2022-09-06 08:02:40

死鎖順序鎖輪詢鎖

2021-01-19 05:49:44

DNS協(xié)議

2022-09-14 09:01:55

shell可視化

2020-07-15 08:57:40

HTTPSTCP協(xié)議

2020-11-16 10:47:14

FreeRTOS應(yīng)用嵌入式

2020-07-09 07:54:35

ThreadPoolE線程池

2022-10-10 08:35:17

kafka工作機制消息發(fā)送

2024-03-07 18:11:39

Golang采集鏈接

2023-11-12 17:17:49

2023-06-12 08:49:12

RocketMQ消費邏輯

2021-08-26 05:02:50

分布式設(shè)計

2024-01-11 09:53:31

面試C++

2022-09-08 10:14:29

人臉識別算法

2022-07-15 16:31:49

Postman測試

2024-01-05 08:30:26

自動駕駛算法

2021-06-04 07:27:24

sourcemap前端技術(shù)

2022-04-25 10:56:33

前端優(yōu)化性能
點贊
收藏

51CTO技術(shù)棧公眾號