PaddlePaddle全景圖首曝光 11項(xiàng)新特性及服務(wù)硬核發(fā)布
深度學(xué)習(xí)正在迎來它的高光時(shí)刻。4月23日,首屆WAVE SUMMIT 2019深度學(xué)習(xí)開發(fā)者峰會(huì)在北京舉辦,過千位“慕名而來”的開發(fā)者與AI專家、學(xué)者一道見證了國內(nèi)真正意義上深度學(xué)習(xí)開發(fā)者盛會(huì)。
會(huì)上,百度高級(jí)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實(shí)驗(yàn)室主任王海峰表示,“深度學(xué)習(xí)推動(dòng)人工智能進(jìn)入工業(yè)大生產(chǎn)階段,而深度學(xué)習(xí)框架是智能時(shí)代的操作系統(tǒng)。”他認(rèn)為,深度學(xué)習(xí)技術(shù)已經(jīng)具備了很強(qiáng)的通用性,正在推動(dòng)人工智能進(jìn)入工業(yè)大生產(chǎn)階段,呈現(xiàn)出標(biāo)準(zhǔn)化、自動(dòng)化和模塊化的特點(diǎn)。深度學(xué)習(xí)框架承上啟下,下接芯片、大型計(jì)算機(jī)系統(tǒng),上承各種業(yè)務(wù)模型、行業(yè)應(yīng)用,是智能時(shí)代的操作系統(tǒng)。
PaddlePaddle全景圖首曝光 11項(xiàng)新特性及服務(wù)重磅發(fā)布
作為最早研究深度學(xué)習(xí)技術(shù)的公司之一,百度早在2013年即設(shè)立全球深度學(xué)習(xí)研究院。經(jīng)過沉淀與積累,2016年百度PaddlePaddle 正式開源,成為中國也是目前國內(nèi)一個(gè)開源開放、功能完備的端到端深度學(xué)習(xí)平臺(tái)。2017年,由國家發(fā)改委批復(fù),百度牽頭籌建了深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實(shí)驗(yàn)室。百度在深度學(xué)習(xí)領(lǐng)域的實(shí)力可見一斑。
核心技術(shù),是國之重器。開源三年的PaddlePaddle在深度學(xué)習(xí)開發(fā)者峰會(huì)上交出斐然的“成績(jī)單”。
百度深度學(xué)習(xí)技術(shù)平臺(tái)部總監(jiān)馬艷軍對(duì)外公布了PaddlePaddle全景圖,集核心框架、工具組件和服務(wù)平臺(tái)為一體的端到端開源深度學(xué)習(xí)平臺(tái),囊括支持面向真實(shí)場(chǎng)景應(yīng)用、達(dá)到工業(yè)級(jí)應(yīng)用效果的模型,針對(duì)大規(guī)模數(shù)據(jù)場(chǎng)景的分布式訓(xùn)練能力、支持多種異構(gòu)硬件的高速推理引擎等。此次,重磅發(fā)布11項(xiàng)新特性及服務(wù),包含PaddleNLP、視頻識(shí)別工具集、Paddle Serving、PaddleSlim、AutoDL Design等多種深度學(xué)習(xí)開發(fā)、訓(xùn)練、預(yù)測(cè)環(huán)節(jié)的“硬通貨”。現(xiàn)場(chǎng)還宣布“1億元”AI Studio算力支持計(jì)劃,公布PaddlePaddle中文名“飛槳”。
馬艷軍表示,“百度為大家提供的不僅是深度學(xué)習(xí)框架,而是提供一整套緊密關(guān)聯(lián)、靈活組合的完整工具組件和服務(wù)平臺(tái),全面覆蓋初學(xué)者、零算法基礎(chǔ)工程師、算法工程師、研究者,平臺(tái)功能覆蓋更加完備,覆蓋的用戶更全面,各部分的打通更加順暢。”
首先,核心框架層開放了從開發(fā)到訓(xùn)練,再到預(yù)測(cè)的一整套完整能力。開發(fā)環(huán)節(jié), PaddlePaddle已開源60多個(gè)經(jīng)過真實(shí)業(yè)務(wù)場(chǎng)景驗(yàn)證的官方模型,涵蓋視覺、NLP、推薦等 AI核心技術(shù)領(lǐng)域,成為官方支持模型最多的深度學(xué)習(xí)平臺(tái)。全新發(fā)布PaddleCV及視頻識(shí)別工具集。面向工業(yè)應(yīng)用的中文 NLP 工具集 PaddleNLP,將自然語言處理領(lǐng)域的多種模型用一套共享骨架代碼實(shí)現(xiàn),可減少開發(fā)者在開發(fā)過程中的重復(fù)工作。擁有當(dāng)前業(yè)內(nèi)中⽂語義表示模型和基于用戶大數(shù)據(jù)訓(xùn)練的應(yīng)用任務(wù)模型,模型源于產(chǎn)業(yè)實(shí)踐,達(dá)到工業(yè)級(jí)的應(yīng)用效果。
重磅發(fā)布的視頻識(shí)別工具集,為開發(fā)者提供解決視頻理解、視頻編輯、視頻生成等一系列任務(wù)。它開放了7個(gè)視頻分類經(jīng)典模型,這些模型共享一套配置文件,并且在數(shù)據(jù)的讀取、評(píng)估等方面共享一套代碼,覆蓋視頻識(shí)別方向的主流領(lǐng)先模型,還可實(shí)現(xiàn)一鍵式的高效配置來做訓(xùn)練和預(yù)測(cè)。
訓(xùn)練環(huán)節(jié),大規(guī)模分布式訓(xùn)練主要從三方面實(shí)現(xiàn)了升級(jí)。首先多機(jī)多卡的全面高效支持,提升了速度;其次是在CPU的應(yīng)用場(chǎng)景方面,針對(duì)大規(guī)模稀疏特征設(shè)計(jì)并開放了大規(guī)模稀疏參數(shù)服務(wù)器,開發(fā)者可輕松下載相關(guān)鏡像使用;大規(guī)模分布式訓(xùn)練支持在各種容器上高速運(yùn)行,同時(shí)支持在K8S生態(tài)下使用PaddlePaddle進(jìn)行訓(xùn)練。
數(shù)據(jù)處理方面,優(yōu)化分布式IO,增加遠(yuǎn)程文件系統(tǒng)流式讀取能力。GPU多機(jī)多卡同步訓(xùn)練通過增加稀疏通信能力提升帶寬不敏感訓(xùn)練能力,在低配網(wǎng)絡(luò)帶寬網(wǎng)絡(luò)環(huán)境下,例如10G網(wǎng)絡(luò)下,同步訓(xùn)練可提速10倍。
開發(fā)和訓(xùn)練后,將模型部署到各種應(yīng)用場(chǎng)景下是非常關(guān)鍵的一個(gè)步驟。部署環(huán)節(jié)需要高速的推理引擎,在此基礎(chǔ)上,為了部署在更多的硬件上往往需要做模型壓縮,在真正使用時(shí),還需要軟硬一體能力的支持?;诖耍琍addlePaddle準(zhǔn)備了完整的端到端的全流程部署方案,并將持續(xù)擴(kuò)展對(duì)各類硬件的支持?;诙嘤布闹С?,PaddlePaddle具備性能不錯(cuò)底層加速庫和推理引擎,全新發(fā)布Paddle Serving支持服務(wù)器端的快速部署。不僅如此,模型體積壓縮庫PaddleSlim也是為開發(fā)者準(zhǔn)備的“重磅驚喜”,針對(duì)體積已經(jīng)很小的MobileNet模型,它仍能在模型效果不損失的前提下實(shí)現(xiàn)70%以上的體積壓縮。
靈活、高效、易用是PaddlePaddle大受歡迎的重要原因。在多項(xiàng)全新發(fā)布及重磅升級(jí)中,工具組件方面顯得尤為突出。此次,PaddlePaddle不僅重磅開源AutoDL Design、升級(jí)PARL,并提出并發(fā)布預(yù)訓(xùn)練一站式管理工具PaddleHub。
傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)是由人根據(jù)經(jīng)驗(yàn)設(shè)計(jì),并不斷的進(jìn)行調(diào)參訓(xùn)練獲得優(yōu)化結(jié)果,這個(gè)過程較為復(fù)雜和費(fèi)時(shí)費(fèi)力。AutoDL Design自動(dòng)化網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)是用深度學(xué)習(xí)設(shè)計(jì)深度學(xué)習(xí),目前已經(jīng)全面超過人類專家設(shè)計(jì)的網(wǎng)絡(luò)效果。升級(jí)后的強(qiáng)化學(xué)習(xí)工具PARL,在算法的覆蓋、高性能通訊以及并行的訓(xùn)練方面做了大量支持和擴(kuò)展。簡(jiǎn)明易用的預(yù)訓(xùn)練模型管理工具PaddleHub,提供包括預(yù)訓(xùn)練模型管理、命令行一鍵式使用和遷移學(xué)習(xí)三大功能,10行代碼即可讓開發(fā)者完成模型遷移。
百度豪擲1億元免費(fèi)算力為開發(fā)者破除算力桎梏
大數(shù)據(jù)、大模型、大算力是深度學(xué)習(xí)發(fā)展的必備因素,算力的重要性不言而喻。百度豪擲1億元免費(fèi)算力,力為普通開發(fā)者破除算力桎梏。馬艷軍宣布,百度一站式開發(fā)平臺(tái)AI Studio重磅推出算力支持計(jì)劃,“我們提供總計(jì)1億元免費(fèi)算力,助力開發(fā)者成功”。據(jù)介紹,免費(fèi)算力主要以兩種模式提供,第一種是一人一卡模式,V100的訓(xùn)練卡包括16G的顯存,最高2T的存儲(chǔ)空間。另外一種是遠(yuǎn)程集群模式,PaddlePaddle提供高性能集群,供開發(fā)者免費(fèi)使用。
深度學(xué)習(xí)的標(biāo)準(zhǔn)化、自動(dòng)化、模塊化推動(dòng)人工智能進(jìn)入工業(yè)大生產(chǎn)階段,也進(jìn)一步為產(chǎn)業(yè)升級(jí)提供了強(qiáng)有力的“助攻”。基于PaddlePaddle,北京林業(yè)大學(xué)研發(fā)的面向信息素誘捕器的智能蟲情監(jiān)測(cè)系統(tǒng),研究對(duì)象是紅脂大小蠹。這套檢測(cè)系統(tǒng)的應(yīng)用大幅降低蟲情監(jiān)測(cè)的人力成本,以往人工檢測(cè)需要一周的工作量,現(xiàn)在用自動(dòng)檢測(cè)一小時(shí)內(nèi)就能處理完。中科院遙感與數(shù)字地球研究所應(yīng)用PaddlePaddle Faster R-CNN模型,結(jié)合特征提取網(wǎng)絡(luò)VGG16及區(qū)域建議網(wǎng)絡(luò)(Region Proposal Network,RPN),以及融合attention機(jī)制的Deeplab v3網(wǎng)絡(luò)對(duì)遙感影像進(jìn)行目標(biāo)檢測(cè)與語義分割,從而實(shí)現(xiàn)對(duì)重大工程目標(biāo)與建設(shè)用地變化圖斑的提取。輔助國家進(jìn)行重大工程用地?cái)U(kuò)張與變化情況的監(jiān)測(cè)工作,并對(duì)土地資源的利用進(jìn)行有效管理與控制。
深度學(xué)習(xí)發(fā)展一方面是技術(shù)的不斷創(chuàng)新突破,另一方面需要建設(shè)完整健康的生態(tài)。高校方面,百度提供深度學(xué)習(xí)師資培訓(xùn),并通過協(xié)同育人專項(xiàng)基金以及AI Studio教育版,培育深度學(xué)習(xí)領(lǐng)域高校人才;在開發(fā)者社區(qū)中,PaddlePaddle提供免費(fèi)在線課程、免費(fèi)算力支持,以及不間斷的賽事互動(dòng),持續(xù)推動(dòng)深度學(xué)習(xí)技術(shù)發(fā)展;企業(yè)方面,不僅舉辦黃埔學(xué)院,還發(fā)布了“AI快車道”計(jì)劃以及AI技術(shù)的生態(tài)扶持計(jì)劃,預(yù)計(jì)深度扶植1000家AI企業(yè)。
此外,本次大會(huì)百度還為開發(fā)者們精心打造了屬于他們的深度學(xué)習(xí)“江湖”,不但有傳授深度學(xué)習(xí)“武功秘籍”的公開課,還有“實(shí)戰(zhàn)過招”的開發(fā)者市集,一次性滿足深度學(xué)習(xí)開發(fā)者從“心法招式”到“當(dāng)面切磋”的需求。
這一場(chǎng)過千位開發(fā)者組成的深度學(xué)習(xí)開發(fā)者峰會(huì),必將掀起國內(nèi)深度學(xué)習(xí)史無前例的浪潮,加速深度學(xué)習(xí)技術(shù)的發(fā)展和產(chǎn)業(yè)應(yīng)用,必將成為歷史上不可磨滅的一筆。