自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

“大模型+”應(yīng)用落地時(shí),大模型微調(diào)如何兼顧效果、成本和可控性?

人工智能
企業(yè)應(yīng)該如何匯集底層數(shù)據(jù)資源、選擇符合企業(yè)自身的模型基座,進(jìn)行模型微調(diào)呢?本文將以易點(diǎn)天下企業(yè)內(nèi)部已全面應(yīng)用的“AI客服”為例,看大模型微調(diào)如何兼顧效果、成本和可控性?

10月17日,老牌科技巨頭百度“文心大模型4.0”的發(fā)布,讓原本暗潮洶涌的百模大戰(zhàn)再次白熱化。伴隨著越來(lái)越多基礎(chǔ)大模型迭代速度的日益加快,“大模型+”的應(yīng)用拐點(diǎn)正在到來(lái)??v觀全球市場(chǎng),預(yù)計(jì)到2030年,AIGC市場(chǎng)規(guī)模將超過(guò)萬(wàn)億人民幣,巨大的市場(chǎng)潛力,吸引了各領(lǐng)域科技巨頭的紛紛布局。

但對(duì)于絕大多數(shù)企業(yè)來(lái)說(shuō),真正的機(jī)會(huì)并不是從頭開(kāi)始做ChatGPT這樣的基礎(chǔ)大模型,而是基于通用大語(yǔ)言模型,進(jìn)行針對(duì)性的再訓(xùn)練、微調(diào)、評(píng)估和部署,從而開(kāi)發(fā)出適合自身業(yè)務(wù)場(chǎng)景的應(yīng)用。然而,企業(yè)應(yīng)該如何匯集底層數(shù)據(jù)資源、選擇符合企業(yè)自身的模型基座,進(jìn)行模型微調(diào)呢?

本次,我們將以易點(diǎn)天下企業(yè)內(nèi)部已全面應(yīng)用的“AI客服”為例,看大模型微調(diào)如何兼顧效果、成本和可控性?

眾所周知,伴隨著人工智能技術(shù)的飛速發(fā)展,AIGC對(duì)內(nèi)容領(lǐng)域的滲透首當(dāng)其沖,在開(kāi)辟新的營(yíng)銷場(chǎng)景與營(yíng)銷模式上更是有著極大的想象空間。結(jié)合易點(diǎn)天下最新實(shí)踐發(fā)現(xiàn),AIGC在營(yíng)銷領(lǐng)域落地的最佳場(chǎng)景在于兩個(gè)核心方面:一是內(nèi)容生產(chǎn),二是智能問(wèn)答。

在內(nèi)容生產(chǎn)方面,易點(diǎn)天下已于今年7月正式發(fā)布了首個(gè)AIGC數(shù)字營(yíng)銷創(chuàng)作平臺(tái)KreadoAI,為營(yíng)銷領(lǐng)域全鏈路的降本提質(zhì)增效,注入新的活力與動(dòng)能;而在智能問(wèn)答方面,易點(diǎn)天下在實(shí)現(xiàn)“AI客服”內(nèi)部全面應(yīng)用化的同時(shí),也在大模型微調(diào)方面探索出一條具有參考性的路徑。

易點(diǎn)天下高級(jí)技術(shù)總監(jiān)Infi He介紹到:“作為AI時(shí)代的一項(xiàng)基礎(chǔ)設(shè)施,大模型的誕生,為AI原生應(yīng)用提供了前所未有的機(jī)遇,也為我們的技術(shù)團(tuán)隊(duì)提出了更高要求,用好大模型至關(guān)重要,尤其是在一些特定AI應(yīng)用開(kāi)發(fā)場(chǎng)景下,相較于模型預(yù)訓(xùn)練的高成本和長(zhǎng)周期,大模型微調(diào)可以在成本可控的前提下,快速實(shí)現(xiàn)預(yù)期效果。”

高質(zhì)量數(shù)據(jù)對(duì)大模型微調(diào)的效果至關(guān)重要

大模型微調(diào),高質(zhì)量的數(shù)據(jù)是重中之重。如果沒(méi)有高質(zhì)量的數(shù)據(jù),在成本有限的前提下,做大模型的SFT監(jiān)督微調(diào),尤其是對(duì)話類任務(wù),并不是一件性價(jià)比很高的事情;即使是目前較為流行的LoRA和P-tuning v2等微調(diào)方法,在數(shù)據(jù)有限的前提下,或多或少都會(huì)破壞基座模型的通用理解能力,造成很明顯的幻覺(jué)、對(duì)話能力損傷和災(zāi)難性遺忘等多個(gè)問(wèn)題。

高質(zhì)量數(shù)據(jù)前提下,基座模型的參數(shù)量越大微調(diào)效果越好

在數(shù)據(jù)質(zhì)量較高的前提下,通過(guò)對(duì)Chatglm2-6B、Baichuan2-7B、Baichuan2-13B、LLama2-7B、Qwen-14B等較為知名開(kāi)源大模型的橫屏測(cè)試發(fā)現(xiàn),基座模型的參數(shù)量越大微調(diào)效果越好,當(dāng)基座模型足夠強(qiáng)可達(dá)到100B(千億)參數(shù)時(shí),即使使用1K的高質(zhì)量數(shù)據(jù)也可以獲得較好的微調(diào)效果。

資源有限的前提下,強(qiáng)通用能力/強(qiáng)專業(yè)能力須取舍

在數(shù)據(jù)、GPU、成本等資源有限的前提下,強(qiáng)的通用能力與強(qiáng)的專業(yè)知識(shí)能力不可兼得,需要根據(jù)產(chǎn)品定位做取舍。如果希望模型在某個(gè)專業(yè)領(lǐng)域有較強(qiáng)的專業(yè)能力,則可能需要犧牲掉部分通用能力。以AI客服為例,在企業(yè)內(nèi)部使用場(chǎng)景下,如果希望其可對(duì)營(yíng)銷類問(wèn)題做出快速響應(yīng),則需要舍棄掉其在生活類問(wèn)題上的反饋準(zhǔn)確率。

目前,依托于基座模型強(qiáng)大微調(diào)效果,易點(diǎn)天下AI客服已覆蓋職能、人力、IT、業(yè)務(wù)等80%日常詢問(wèn)場(chǎng)景,企業(yè)員工無(wú)論何時(shí)遇到任何問(wèn)題,都可以隨時(shí)詢問(wèn)并獲得AI客服7*24h的精準(zhǔn)回答,極大提升了企業(yè)內(nèi)部工作效率。

當(dāng)下,伴隨著AIGC浪潮此起彼伏的持續(xù)發(fā)展,出海營(yíng)銷正在經(jīng)歷新一輪的代際躍遷,從創(chuàng)意內(nèi)容的生產(chǎn),到投放策略的自動(dòng)化,再到效果數(shù)據(jù)的回收、整體流量的優(yōu)化,伴隨AI技術(shù)的不斷創(chuàng)新,易點(diǎn)天下正以更深入、更廣泛、更快速、更智能的方式重塑著整個(gè)出海營(yíng)銷行業(yè)的創(chuàng)作生態(tài)系統(tǒng)。下期《MarTech Hub》我們將話題方向聚焦“數(shù)據(jù)中臺(tái)”,一起來(lái)看如何將DataOps實(shí)踐擴(kuò)展到業(yè)務(wù)指標(biāo)管理。

責(zé)任編輯:鳶瑋 來(lái)源: 易點(diǎn)天下
相關(guān)推薦

2023-06-07 08:22:59

LLM微調(diào)技術(shù)

2024-12-30 00:01:00

多模態(tài)大模型Python

2024-09-09 07:46:16

2025-04-10 07:59:51

2024-04-15 12:50:00

大型語(yǔ)言模型ReFT

2025-02-28 10:25:09

2025-03-06 07:28:31

DeepSeek大模型人工智能

2024-04-15 13:51:03

模型LLMLLMs

2024-05-07 08:00:00

自然語(yǔ)言處理機(jī)器學(xué)習(xí)

2024-09-26 10:42:20

2023-11-05 10:04:47

2025-04-07 08:15:00

大模型AI探人工智能

2024-12-02 11:45:48

2023-04-10 09:59:48

昇思

2017-05-04 18:00:43

iOS日歷SKCalendarV

2023-09-28 08:23:18

AI模型

2024-08-20 07:55:03

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)