本周六定位上海!解析百度文心(ERNIE)如何助力快速定制企業(yè)級NLP模型
文心(ERNIE)是依托百度深度學習平臺飛槳打造的語義理解技術與平臺,集先進的預訓練模型、全面的NLP算法集、端到端開發(fā)套件和平臺化服務于一體,為企業(yè)和開發(fā)者提供一整套NLP定制與應用能力。在2020世界人工智能大會,百度文心(ERNIE)榮獲最高獎項SAIL獎(Super AI Leader,卓越人工智能引領者)。
ERNIE開創(chuàng)性地將大數(shù)據(jù)預訓練與多源豐富知識相結合,持續(xù)學習海量數(shù)據(jù)中的知識,將機器語義理解水平提升到一個新的高度。以中文模型為例,目前ERNIE已經(jīng)學習了1500萬篇百科語料和詞語、實體知識,700萬個人類對話,3億的文章的因果結構關系,以及10億次的搜索查詢與結果的對應關系,以及2000萬的語言邏輯關系知識。模型還在持續(xù)不斷地建模新的海量數(shù)據(jù)與知識,不斷地提升下游的應用效果。ERNIE在中英文的16個任務上已經(jīng)超越了業(yè)界最好模型,全面適用于各類NLP應用場景。
目前,EasyDL已預置了領先的預訓練模型ERNIE2.0,并配套了多種NLP經(jīng)典算法網(wǎng)絡,支持了文本分類、短文本匹配和序列標注等典型文本處理任務。
近日,文心(ERNIE)重磅發(fā)布三項功能,新增定制多標簽文本分類、情感傾向分析、文本實體抽取模型等功能,同時數(shù)據(jù)管理能力也進一步增強,更好地滿足NLP領域開發(fā)者需求,開發(fā)者可通過百度AI開發(fā)平臺EasyDL進行使用。
EasyDL是百度大腦面向企業(yè)開發(fā)者推出的零門檻AI開發(fā)平臺,基于百度自主研發(fā)的深度學習平臺飛槳,結合業(yè)界先進的工程服務技術打造,覆蓋視覺與自然語言處理兩大技術方向,支持一站式智能標注、模型訓練、服務部署等全流程功能。目前EasyDL已經(jīng)被廣泛應用在零售、互聯(lián)網(wǎng)、安全生產(chǎn)、工業(yè)質(zhì)檢、教育、醫(yī)療、交通等20多個行業(yè),擁有70多萬用戶。
使用EasyDL簡單三步即可完成NLP任務配置與訓練,性能優(yōu)異。
那么,文心這么厲害,有沒有機會和高工面對面,快速掌握技術原理與實際應用?
本周六,百度資深研發(fā)工程師空降上海,一個上午從文心(ERNIE)技術解析到實戰(zhàn)演練為你解析如何定制企業(yè)高精度NLP模型。(文末海報報名哦)
我們先來點技術干貨稍做預習,了解下文心(ERNIE)近期重磅上線的多項實用功能!
新增定制化多標簽文本分類功能
“多標簽文本分類”指對一段文本同時標記多個標簽,如:“未來的學和教正在發(fā)生顛覆,學生將會在家里學習,機器人將走上講臺。”可對應標簽為“教育”、“科技”。該功能應用場景廣泛,如媒體場景中對新聞內(nèi)容進行自動歸類,在內(nèi)容推薦場景中利用內(nèi)容標簽提升召回,通過自動標簽功能對知識文檔進行多層級分類等。
目前,EasyDL平臺經(jīng)典版和專業(yè)版均新增了這項功能,在“專業(yè)版”的任務配置過程中,開發(fā)者還可選擇ERNIE Tiny、ERNIE Large、ERNIE Base三種各有所長的預訓練模型。
新增定制化情感傾向分析功能
“情感傾向分析”指對一段文本進行“積極情感”或“消極情感”的判斷,如“酒店位置很好,服務周到熱情,下次一定會再來”的用戶評價,部署模型后可直接得到“Positive(積極情感)”的標簽和99%的置信度。
該功能最常應用于用戶評論分析和輿情分析,比如商品、店鋪的口碑分析,對事實性的新聞事件或互聯(lián)網(wǎng)話題進行輿情分析等,在汽車、餐飲、酒店等多個垂類上,分析準確率可達到95%以上。
目前,該功能已經(jīng)上線EasyDL經(jīng)典版,后續(xù)平臺將逐步增加基于實體級和句子級的情感分類,力求覆蓋更多的應用需求。
文本數(shù)據(jù)管理和數(shù)據(jù)標注功能全面升級
針對開發(fā)者數(shù)據(jù)管理和數(shù)據(jù)標注過程中的痛點,EasyDL支持了更加靈活的數(shù)據(jù)格式,當前可支持zip、Excel、TXT三種文件格式進行上傳。除了提供在線標注能力外,還提供智能標注功能,大幅降低了開發(fā)者的標注成本,開發(fā)者可直接上傳未標注數(shù)據(jù)體驗該功能。
圖:文本智能標注示意圖
10 月 24 日當天,百度 AI 快車道【飛槳開源框架高階營】線下課程 “閃現(xiàn)” 上海站,邀請 “魔都程序猿” 和 “滬上程序媛” 來到上海市徐匯區(qū)瑞平路 230 號保利時光里 B1-09——LOFAS 集聚空間,與百度資深高工、各位行業(yè)開發(fā)者相聚一堂。上海站內(nèi)容絕對不會令你 “空腦而歸”,開發(fā)全流程、部署工具、高精度目標檢測、模型優(yōu)化方案一一奉上,更有“全能”OCR、金牌推薦算法,一起來場硬核趴體吧!
想了解強大文心(ERNIE)背后的技術原理?
想更進一步快速掌握NLP模型開發(fā)方法與技巧?
想線下和百度資深研發(fā)與各行業(yè)開發(fā)者深度溝通?
本周六上午,就在上海徐匯區(qū)復興路1199號A座5層,百度AI快車道【EasyDL零門檻模型訓練營】,資深研發(fā)工程師詳解NLP技術能力,并帶來現(xiàn)場實操與面對面答疑解惑,助你三小時掌握EasyDL的NLP模型開發(fā)秘籍!
點擊下方鏈接即可體驗!
https://paddle.wjx.cn/m/93404058.aspx?udsid=798299