最近一段時(shí)間關(guān)于大模型技術(shù)的學(xué)習(xí)及應(yīng)用的心得體會(huì) 原創(chuàng)
“ 怎么把大模型的各種技術(shù)與應(yīng)用場(chǎng)景相結(jié)合是一個(gè)值得思考的問(wèn)題”
今天這篇文章應(yīng)該算是對(duì)這幾個(gè)月以來(lái)學(xué)習(xí)和應(yīng)用大模型技術(shù)的總結(jié),也可以說(shuō)是這段時(shí)間的心得體會(huì)。
今天主要從技術(shù)與應(yīng)用兩個(gè)方面來(lái)講,當(dāng)然也會(huì)夾雜著一些自己的理解與想法。
關(guān)于大模型技術(shù)的學(xué)習(xí)與應(yīng)用及心得體會(huì)
對(duì)任何一項(xiàng)技術(shù)來(lái)說(shuō),主要有兩個(gè)方面,其一是技術(shù)面,其二是應(yīng)用面;技術(shù)本質(zhì)只是一個(gè)工具,也就是我們常說(shuō)的,技術(shù)是為業(yè)務(wù)服務(wù)的。
一項(xiàng)新技術(shù)的出現(xiàn),要么在新技術(shù)上構(gòu)建新的應(yīng)用,要么就用新技術(shù)去解決舊問(wèn)題。
而大模型技術(shù)是最近兩年爆火的一項(xiàng)技術(shù),因?yàn)樗沟萌斯ぶ悄芗夹g(shù)得到了巨大的進(jìn)步,使得人工智能不僅僅只是一個(gè)理念,而是真正成為一個(gè)有可能實(shí)現(xiàn)的目標(biāo)。
技術(shù)面
在前面說(shuō)技術(shù)的本質(zhì)是工具,因此從技術(shù)的角度來(lái)說(shuō),技術(shù)的作用就是怎么把這個(gè)工具做得更好。
我們經(jīng)常說(shuō)大模型技術(shù),其實(shí)大模型是人工智能技術(shù)的一個(gè)分支——機(jī)器學(xué)習(xí)技術(shù)深化后產(chǎn)生的深度學(xué)習(xí)技術(shù)所開(kāi)發(fā)的一款產(chǎn)品或者說(shuō)工具。
因此,關(guān)于大模型的“技術(shù)”研究的都是怎么把模型這個(gè)工具做的更好,比如說(shuō)不同架構(gòu)的神經(jīng)網(wǎng)絡(luò),訓(xùn)練方式,微調(diào)方式;再具體的比如,Transformer架構(gòu),前向傳播,反向傳播,損失計(jì)算等等;再有如遷移學(xué)習(xí),強(qiáng)化學(xué)習(xí),對(duì)抗網(wǎng)絡(luò)等無(wú)外如是。
怎么把大模型做得更好,更快,更好用,重不重要?
重要,但受限于大模型的本身的技術(shù)復(fù)雜度和成本問(wèn)題,對(duì)絕大部分人和企業(yè)來(lái)說(shuō),大模型巨大的資金和技術(shù)成本都是不可接受的,也就是說(shuō)大模型這個(gè)技術(shù)不是一般人和一般企業(yè)能夠玩得轉(zhuǎn)的。
從我的個(gè)人的角度來(lái)說(shuō),大模型技術(shù)要不要學(xué)?
要學(xué),因?yàn)樗俏磥?lái)發(fā)展的方向,但學(xué)到什么程度就是一個(gè)值得思考的問(wèn)題了。
如果說(shuō)你就癡迷于技術(shù)無(wú)法自拔,或者說(shuō)你對(duì)技術(shù)有著強(qiáng)烈的好奇心和驅(qū)動(dòng)力,那么你可以選擇深入研究大模型的技術(shù),比如深度學(xué)習(xí)網(wǎng)絡(luò),反向傳播算法等等。
而對(duì)大部分人來(lái)說(shuō),只需要了解大模型的基本原理,以及了解大模型的訓(xùn)練與微調(diào),能夠根據(jù)具體的業(yè)務(wù)場(chǎng)景微調(diào)出一個(gè)能夠解決實(shí)際問(wèn)題的模型就可以了。
工具是一個(gè)不斷發(fā)展和進(jìn)化的過(guò)程,因此必須要有人去研究把一個(gè)大模型做的更好的技術(shù),只有這樣才不會(huì)讓大模型技術(shù)停滯不前。
從這段時(shí)間的學(xué)習(xí)來(lái)看,在之前發(fā)表的文章中基本上已經(jīng)涵蓋了大模型絕大部分技術(shù)理念。
總之一句話(huà),關(guān)于大模型的技術(shù)目的只有一個(gè),那就是把模型做得更好。
應(yīng)用面
從應(yīng)用的層面來(lái)說(shuō),目前大模型的主要應(yīng)用有以下幾個(gè)方向:
- AIGC
- Agent
- 知識(shí)庫(kù)
AIGC可以說(shuō)是大模型技術(shù)的主要應(yīng)用方向之一,也是出現(xiàn)比較早的應(yīng)用場(chǎng)景,因?yàn)楝F(xiàn)在的大模型就叫做生成式人工智能,而AIGC就是內(nèi)容生成的領(lǐng)域。
從技術(shù)的角度來(lái)說(shuō),AIGC就是利用大模型的生成能力,來(lái)生成各種文字,圖片,視頻,音頻,PPT等各種內(nèi)容形式,而技術(shù)需要解決的問(wèn)題就是讓大模型在不同的領(lǐng)域表現(xiàn)更好。
而Agent的應(yīng)用范圍就更加寬泛,比如一些工作流,也包括自動(dòng)駕駛技術(shù),工業(yè)生成等方向。
Agent就是利用各種環(huán)境感知能力,然后利用大模型做出合理和準(zhǔn)確的判斷,然后做出正確的決策并執(zhí)行,執(zhí)行的過(guò)程是通過(guò)調(diào)用外部工具的方式來(lái)實(shí)現(xiàn)。
而Agent的核心技術(shù)就是大模型的推理和規(guī)劃能力,具體來(lái)說(shuō)就是利用提示詞和思維鏈,以及外部工具,讓大模型能夠做到獨(dú)立思考和判斷,學(xué)會(huì)拆解問(wèn)題和目標(biāo),并使用工具解決問(wèn)題的過(guò)程。
而知識(shí)庫(kù)技術(shù)是對(duì)大模型技術(shù)缺陷的補(bǔ)充,有了知識(shí)庫(kù)就可以解決大模型知識(shí)不足的問(wèn)題,并且可以大大降低大模型的缺陷——幻覺(jué)問(wèn)題。
而知識(shí)庫(kù)主要涉及的技術(shù)是知識(shí)庫(kù)的搭建,檢索,存儲(chǔ);也就是讓大模型更好的理解外部知識(shí),主要技術(shù)載體就是RAG——檢索生成增強(qiáng)。
從技術(shù)的角度來(lái)說(shuō),大模型主要涉及的技術(shù)就以上幾個(gè)方面;而從應(yīng)用角度來(lái)說(shuō),大模型的應(yīng)用更多的是靠想象力,而不是技術(shù)。
大模型的技術(shù)就那么多,而怎么利用這些技術(shù)構(gòu)建更加好用與合理化的應(yīng)用是一個(gè)值得思考的問(wèn)題。
本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires
原文鏈接:??https://mp.weixin.qq.com/s/8QyPNaTLWbQ2W8zup4VJ-w??
