自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

部署成本降到十萬(wàn)級(jí)，所有企業(yè)都該擁抱大模型嗎？

原創(chuàng)

2024-05-23 14:04:14

在即將于6月21-22日在北京召開的WOT全球技術(shù)創(chuàng)新大會(huì)上，設(shè)置了“大模型部署與應(yīng)用”專題討論，來自百度、網(wǎng)易云音樂、第四范式、潞晨科技的多位實(shí)踐專家，帶來關(guān)于大模型部署與應(yīng)用的現(xiàn)身說法。

出品 | 51CTO技術(shù)棧（微信號(hào)：blog51cto）

隨著大模型的研究和應(yīng)用越來越廣泛，企業(yè)對(duì)于應(yīng)用大模型的需求變得越來越迫切。加之大模型部署成本從千萬(wàn)級(jí)逐漸降低到十萬(wàn)級(jí)，企業(yè)擁抱大模型的門檻逐漸降低。

話雖如此，具體到大模型訓(xùn)練、部署和應(yīng)用，其實(shí)并非想象得那般簡(jiǎn)單，這也是企業(yè)的大模型實(shí)踐并不成熟的原因所在。

在即將于6月21-22日在北京召開的WOT全球技術(shù)創(chuàng)新大會(huì)上，設(shè)置了“大模型部署與應(yīng)用”專題討論，來自百度、網(wǎng)易云音樂、第四范式、潞晨科技的多位實(shí)踐專家，帶來關(guān)于大模型部署與應(yīng)用的現(xiàn)身說法。

圖片

百度內(nèi)容生態(tài)AI大模型工程技術(shù)架構(gòu)新挑戰(zhàn)與探索

隨著生成式AI技術(shù)浪潮的興起，內(nèi)容生態(tài)作為最前沿的創(chuàng)新和業(yè)務(wù)落地場(chǎng)景，對(duì)技術(shù)架構(gòu)不斷提出新挑戰(zhàn)。百度內(nèi)容生態(tài)作為百度核心用戶產(chǎn)品信息流和搜索內(nèi)容總供給，在內(nèi)容理解和內(nèi)容生成方向上不斷進(jìn)行探索和創(chuàng)新。百度視頻創(chuàng)作平臺(tái)建設(shè)過程中面臨AI算力托管、AI模型治理、推理加速等方面的挑戰(zhàn)時(shí)如何應(yīng)對(duì)？解決方案是什么？

百度內(nèi)容生態(tài)大模型架構(gòu)技術(shù)負(fù)責(zé)人張寶玉將帶來《百度內(nèi)容生態(tài)AI大模型工程技術(shù)架構(gòu)新挑戰(zhàn)與探索》的主題分享。

網(wǎng)易云音樂大模型實(shí)踐及創(chuàng)新

在網(wǎng)易云音樂資深算法平臺(tái)工程師劉長(zhǎng)偉《網(wǎng)易云音樂大模型實(shí)踐及創(chuàng)新》的主題分享中，將介紹網(wǎng)易云音樂基于LLMOps理念實(shí)現(xiàn)的大模型微調(diào)、部署、評(píng)測(cè)、標(biāo)注鏈路，分享采用 zero offload技術(shù)來降低微調(diào)需要的資源門檻。此外，還會(huì)介紹基于自研 Modelzoo 實(shí)現(xiàn)大模型分布式管理、推理部署、推理優(yōu)化以及平臺(tái)提供的人工標(biāo)注和機(jī)器標(biāo)注流程。實(shí)踐部分，他將分享在音樂社區(qū)領(lǐng)域，如何基于大模型的閑聊對(duì)話全鏈路解決方案增加用戶主動(dòng)會(huì)話意愿，提升用戶留存率。

使用信創(chuàng)算力與虛擬化技術(shù)提升大模型部署效率

異構(gòu)算力設(shè)備已經(jīng)逐漸成為機(jī)器學(xué)習(xí)產(chǎn)品和服務(wù)中的常態(tài)化需求，近年來國(guó)產(chǎn)異構(gòu)算力發(fā)展迅速，產(chǎn)生了一批相當(dāng)有競(jìng)爭(zhēng)力的產(chǎn)品。但其相對(duì)封閉的生態(tài)與云原生粗粒度的分配方式造成了生產(chǎn)環(huán)境中異構(gòu)算力的使用率往往不盡如人意。

大模型成為趨勢(shì)的當(dāng)下，對(duì)于算力的需求呈現(xiàn)指數(shù)級(jí)別上升，如何能讓大模型可以平穩(wěn)部署在信創(chuàng)設(shè)備上，并提升其利用率已經(jīng)成為了一個(gè)重要的課題。

第四范式高級(jí)研發(fā)工程師李孟軒帶來題為《使用信創(chuàng)算力與虛擬化技術(shù)提升大模型部署效率》的分享，介紹Project-HAMi，一個(gè)基于云原生的開源異構(gòu)算力整合與虛擬化解決方案，以此方式降低國(guó)產(chǎn)異構(gòu)算力的使用門檻，解決資源分配粒度過粗的問題，從而提升集群中異構(gòu)算力設(shè)備利用率。

大模型訓(xùn)練和加速的新技術(shù)與挑戰(zhàn)

AI模型急速增大與硬件算力緩慢增長(zhǎng)的尖銳矛盾，已成為制約AI生產(chǎn)力解放和發(fā)展的主要痛點(diǎn)?；诙嗄暝趯W(xué)術(shù)上的卓越成就和工業(yè)界的深厚積累，潞晨科技尤洋教授團(tuán)隊(duì)攻克多維張量并行、序列并行、異構(gòu)內(nèi)存管理、大規(guī)模優(yōu)化庫(kù)、自適應(yīng)任務(wù)調(diào)度等多項(xiàng)核心關(guān)鍵技術(shù)，開源了面向大模型時(shí)代的通用深度學(xué)習(xí)系統(tǒng)Colossal-AI，可實(shí)現(xiàn)高效快速部署AI大模型訓(xùn)練和推理，降低AI大模型應(yīng)用成本。發(fā)布后僅用時(shí)一年多，已在AI大模型軟件基礎(chǔ)設(shè)施細(xì)分賽道開源指標(biāo)排名世界第一。

潞晨科技技術(shù)總監(jiān)卞正達(dá)將帶來《大模型訓(xùn)練和加速的新技術(shù)與挑戰(zhàn)》的主題分享，介紹潞晨科技全球首個(gè)開源復(fù)現(xiàn)ChatGPT的RLHF訓(xùn)練過程的完整解決方案，全球首個(gè)開源類Sora架構(gòu)視頻生成模型及完整低成本解決方案Open-Sora，目前已更新至v1.1，總訓(xùn)練成本僅1萬(wàn)美元，發(fā)布后一個(gè)月已收獲GitHub Star近兩萬(wàn)顆，在類Sora模型細(xì)分賽道排名世界第一。

如何報(bào)名參會(huì)

時(shí)間：6月21日-6月22日

地點(diǎn)：北京·粵財(cái)JW萬(wàn)豪酒店

早鳥票預(yù)售中，點(diǎn)擊下方二維碼了解大會(huì)詳情，或咨詢：18500515262

圖片

責(zé)任編輯：武曉燕來源： 51CTO技術(shù)棧

企業(yè)大模型 WOT

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

^{<blockquote id="fouxt"></blockquote>}