自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ruby id="hdbse"></ruby>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

“大模型+”應(yīng)用落地時(shí)，大模型微調(diào)如何兼顧效果、成本和可控性？

2023-10-20 17:53:05

企業(yè)應(yīng)該如何匯集底層數(shù)據(jù)資源、選擇符合企業(yè)自身的模型基座，進(jìn)行模型微調(diào)呢？本文將以易點(diǎn)天下企業(yè)內(nèi)部已全面應(yīng)用的“AI客服”為例，看大模型微調(diào)如何兼顧效果、成本和可控性？

10月17日，老牌科技巨頭百度“文心大模型4.0”的發(fā)布，讓原本暗潮洶涌的百模大戰(zhàn)再次白熱化。伴隨著越來(lái)越多基礎(chǔ)大模型迭代速度的日益加快，“大模型+”的應(yīng)用拐點(diǎn)正在到來(lái)?？v觀全球市場(chǎng)，預(yù)計(jì)到2030年，AIGC市場(chǎng)規(guī)模將超過(guò)萬(wàn)億人民幣，巨大的市場(chǎng)潛力，吸引了各領(lǐng)域科技巨頭的紛紛布局。

但對(duì)于絕大多數(shù)企業(yè)來(lái)說(shuō)，真正的機(jī)會(huì)并不是從頭開(kāi)始做ChatGPT這樣的基礎(chǔ)大模型，而是基于通用大語(yǔ)言模型，進(jìn)行針對(duì)性的再訓(xùn)練、微調(diào)、評(píng)估和部署，從而開(kāi)發(fā)出適合自身業(yè)務(wù)場(chǎng)景的應(yīng)用。然而，企業(yè)應(yīng)該如何匯集底層數(shù)據(jù)資源、選擇符合企業(yè)自身的模型基座，進(jìn)行模型微調(diào)呢？

本次，我們將以易點(diǎn)天下企業(yè)內(nèi)部已全面應(yīng)用的“AI客服”為例，看大模型微調(diào)如何兼顧效果、成本和可控性？

眾所周知，伴隨著人工智能技術(shù)的飛速發(fā)展，AIGC對(duì)內(nèi)容領(lǐng)域的滲透首當(dāng)其沖，在開(kāi)辟新的營(yíng)銷場(chǎng)景與營(yíng)銷模式上更是有著極大的想象空間。結(jié)合易點(diǎn)天下最新實(shí)踐發(fā)現(xiàn)，AIGC在營(yíng)銷領(lǐng)域落地的最佳場(chǎng)景在于兩個(gè)核心方面：一是內(nèi)容生產(chǎn)，二是智能問(wèn)答。

在內(nèi)容生產(chǎn)方面，易點(diǎn)天下已于今年7月正式發(fā)布了首個(gè)AIGC數(shù)字營(yíng)銷創(chuàng)作平臺(tái)KreadoAI，為營(yíng)銷領(lǐng)域全鏈路的降本提質(zhì)增效，注入新的活力與動(dòng)能；而在智能問(wèn)答方面，易點(diǎn)天下在實(shí)現(xiàn)“AI客服”內(nèi)部全面應(yīng)用化的同時(shí)，也在大模型微調(diào)方面探索出一條具有參考性的路徑。

易點(diǎn)天下高級(jí)技術(shù)總監(jiān)Infi He介紹到：“作為AI時(shí)代的一項(xiàng)基礎(chǔ)設(shè)施，大模型的誕生，為AI原生應(yīng)用提供了前所未有的機(jī)遇，也為我們的技術(shù)團(tuán)隊(duì)提出了更高要求，用好大模型至關(guān)重要，尤其是在一些特定AI應(yīng)用開(kāi)發(fā)場(chǎng)景下，相較于模型預(yù)訓(xùn)練的高成本和長(zhǎng)周期，大模型微調(diào)可以在成本可控的前提下，快速實(shí)現(xiàn)預(yù)期效果。”

高質(zhì)量數(shù)據(jù)對(duì)大模型微調(diào)的效果至關(guān)重要

大模型微調(diào)，高質(zhì)量的數(shù)據(jù)是重中之重。如果沒(méi)有高質(zhì)量的數(shù)據(jù)，在成本有限的前提下，做大模型的SFT監(jiān)督微調(diào)，尤其是對(duì)話類任務(wù)，并不是一件性價(jià)比很高的事情；即使是目前較為流行的LoRA和P-tuning v2等微調(diào)方法，在數(shù)據(jù)有限的前提下，或多或少都會(huì)破壞基座模型的通用理解能力，造成很明顯的幻覺(jué)、對(duì)話能力損傷和災(zāi)難性遺忘等多個(gè)問(wèn)題。

高質(zhì)量數(shù)據(jù)前提下，基座模型的參數(shù)量越大微調(diào)效果越好

在數(shù)據(jù)質(zhì)量較高的前提下，通過(guò)對(duì)Chatglm2-6B、Baichuan2-7B、Baichuan2-13B、LLama2-7B、Qwen-14B等較為知名開(kāi)源大模型的橫屏測(cè)試發(fā)現(xiàn)，基座模型的參數(shù)量越大微調(diào)效果越好，當(dāng)基座模型足夠強(qiáng)可達(dá)到100B（千億）參數(shù)時(shí)，即使使用1K的高質(zhì)量數(shù)據(jù)也可以獲得較好的微調(diào)效果。

資源有限的前提下，強(qiáng)通用能力/強(qiáng)專業(yè)能力須取舍

在數(shù)據(jù)、GPU、成本等資源有限的前提下，強(qiáng)的通用能力與強(qiáng)的專業(yè)知識(shí)能力不可兼得，需要根據(jù)產(chǎn)品定位做取舍。如果希望模型在某個(gè)專業(yè)領(lǐng)域有較強(qiáng)的專業(yè)能力，則可能需要犧牲掉部分通用能力。以AI客服為例，在企業(yè)內(nèi)部使用場(chǎng)景下，如果希望其可對(duì)營(yíng)銷類問(wèn)題做出快速響應(yīng)，則需要舍棄掉其在生活類問(wèn)題上的反饋準(zhǔn)確率。

目前，依托于基座模型強(qiáng)大微調(diào)效果，易點(diǎn)天下AI客服已覆蓋職能、人力、IT、業(yè)務(wù)等80%日常詢問(wèn)場(chǎng)景，企業(yè)員工無(wú)論何時(shí)遇到任何問(wèn)題，都可以隨時(shí)詢問(wèn)并獲得AI客服7*24h的精準(zhǔn)回答，極大提升了企業(yè)內(nèi)部工作效率。

當(dāng)下，伴隨著AIGC浪潮此起彼伏的持續(xù)發(fā)展，出海營(yíng)銷正在經(jīng)歷新一輪的代際躍遷，從創(chuàng)意內(nèi)容的生產(chǎn)，到投放策略的自動(dòng)化，再到效果數(shù)據(jù)的回收、整體流量的優(yōu)化，伴隨AI技術(shù)的不斷創(chuàng)新，易點(diǎn)天下正以更深入、更廣泛、更快速、更智能的方式重塑著整個(gè)出海營(yíng)銷行業(yè)的創(chuàng)作生態(tài)系統(tǒng)。下期《MarTech Hub》我們將話題方向聚焦“數(shù)據(jù)中臺(tái)”，一起來(lái)看如何將DataOps實(shí)踐擴(kuò)展到業(yè)務(wù)指標(biāo)管理。

責(zé)任編輯：鳶瑋來(lái)源：易點(diǎn)天下

易點(diǎn)天下模型微調(diào)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<samp id="0nd3k"><b id="0nd3k"></b></samp>