從技術(shù)的角度來(lái)看大模型產(chǎn)業(yè)鏈 原創(chuàng)
“ 分工合作才是社會(huì)進(jìn)步的根本,而大模型也是如此,每個(gè)人都應(yīng)該在大模型領(lǐng)域找到自己的位置”
大模型技術(shù)雖然指的是以機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)模型為主的機(jī)器學(xué)習(xí)模型,但大模型并不只是一個(gè)獨(dú)立的技術(shù),由于其復(fù)雜度和對(duì)算力和能源的需求,因此大模型整個(gè)體系由多層功能組成,而這些層就組成了以大模型為中心的產(chǎn)業(yè)鏈集群。
從技術(shù)的角度看大模型產(chǎn)業(yè)鏈的組成
大模型因?yàn)槠鋸?fù)雜度決定了其絕對(duì)不可能是一個(gè)單打獨(dú)斗的產(chǎn)業(yè),因此大模型是由多個(gè)部分組成的一個(gè)產(chǎn)業(yè)集群;而今天我們就來(lái)討論一下大模型在技術(shù)上的組成。
從技術(shù)的角度來(lái)說(shuō),大模型主要由以下幾層功能構(gòu)成,從上游到下游依次為:
- 算力層
- 模型服務(wù)層
- 應(yīng)用層
算力層
算力層包括兩個(gè)方面,一個(gè)是硬件算力,一個(gè)是集群算力;之所以區(qū)分這兩者,原因是其差別還是挺大的。
硬件算力主要包括CPU,GPU和TPU等算力芯片,而從廠家來(lái)說(shuō)主要就是以英偉達(dá)為首的芯片公司;從技術(shù)的角度來(lái)說(shuō),任何與信息產(chǎn)業(yè)相關(guān)的技術(shù)都離不開(kāi)算力芯片的支持,畢竟任何程序都需要芯片去運(yùn)行。
其次就是集群算力,大模型由于其體積龐大,對(duì)算力要求較高,因此單一算力模塊根本無(wú)法完成如此大的計(jì)算需求;雖然超級(jí)計(jì)算機(jī)由于其出色的性能也能完成大模型的運(yùn)算需求;但不論從成本上,還是技術(shù)上都不是一個(gè)好的選擇。因此,以多臺(tái)小型機(jī)組成的算力集群就是一個(gè)比較好的選擇,而這也是云計(jì)算的大行其道的原因之一。
而云計(jì)算經(jīng)過(guò)這十多年的發(fā)展,從一個(gè)概念模型發(fā)展到如今百花齊放的時(shí)代;不論是國(guó)內(nèi)還是國(guó)外,提供云計(jì)算服務(wù)的企業(yè)在信息時(shí)代都占據(jù)著舉足輕重的地位。
模型服務(wù)層
在云計(jì)算和大數(shù)據(jù)剛興起的時(shí)候,有幾個(gè)名詞大家應(yīng)該都能耳熟能詳,IAAS,PAAS和SAAS;簡(jiǎn)單來(lái)說(shuō)就是幾種云服務(wù)模式。
而隨著大模型的興起,MAAS——模型即服務(wù)成為一種當(dāng)前大模型服務(wù)的主流。
這些云服務(wù)的產(chǎn)生,主要?dú)w結(jié)于市場(chǎng)對(duì)算力的需求;在云計(jì)算之前,傳統(tǒng)的算力需求主要由IDC機(jī)房來(lái)完成;簡(jiǎn)單來(lái)說(shuō)就是對(duì)很多中小互聯(lián)網(wǎng)企業(yè)來(lái)說(shuō),花費(fèi)幾千甚至幾萬(wàn)塊錢購(gòu)買服務(wù)器;不但資金壓力大,而且還需要專業(yè)的運(yùn)維人員,所以就有了IDC機(jī)房,專門(mén)提供服務(wù)器的運(yùn)維,對(duì)小企業(yè)來(lái)說(shuō)只需要開(kāi)通一個(gè)IDC賬號(hào)即可使用。
而隨著云計(jì)算的興起,各大云服務(wù)商都組建了自己的數(shù)據(jù)中心,并且提供比IDC機(jī)房更加方便和管理的云服務(wù);這時(shí)IDC機(jī)房變成了云服務(wù)商的一個(gè)底層組件。
而同樣的道理,大模型的設(shè)計(jì),訓(xùn)練和微調(diào)對(duì)大部分中小企業(yè)來(lái)說(shuō)都是一個(gè)難以實(shí)現(xiàn)的難題;即使技術(shù)上能實(shí)現(xiàn),但也無(wú)法承受其巨大的資金成本;因此,各種大模型服務(wù)商就應(yīng)運(yùn)而生。
剛好,這樣正符合專業(yè)的人做專業(yè)的事,大模型的訓(xùn)練和運(yùn)維交給專業(yè)的人員;其它企業(yè)只需要在此基礎(chǔ)之上做好上層應(yīng)用即可。
應(yīng)用層
如果說(shuō)算力層和模型服務(wù)層是一個(gè)大部分人都不需要接觸的東西,那么基于模型服務(wù)構(gòu)建的上層應(yīng)用就是和我們普通用戶相關(guān)的東西了。
應(yīng)用層簡(jiǎn)單來(lái)說(shuō)就是,以大模型的功能為基礎(chǔ),在上層構(gòu)建各種垂直領(lǐng)域的應(yīng)用系統(tǒng);比如說(shuō)以AIGC為主的內(nèi)容生成系統(tǒng),如文字,圖片,視頻,音樂(lè)等;以大數(shù)據(jù)分析為主的推薦系統(tǒng),分發(fā)系統(tǒng)等。
應(yīng)用層是一個(gè)最具創(chuàng)造力,也最具生命力的一個(gè)模塊;開(kāi)發(fā)者可以發(fā)揮自己的想象力,把大模型的能力與特定應(yīng)用場(chǎng)景相結(jié)合,來(lái)實(shí)現(xiàn)各種各樣的奇思妙想的功能。
而我們作為大模型領(lǐng)域的從業(yè)者,每個(gè)人都可以根據(jù)自己的喜好,選擇不同的功能層面,來(lái)為大模型技術(shù)的發(fā)展添磚加瓦。
建議
對(duì)大部分人來(lái)說(shuō),不要想著什么都去做,以大模型為中心,選擇一個(gè)適合自己的小的領(lǐng)域,才是最好的選擇;而且,大模型領(lǐng)域如此多的場(chǎng)景和功能,我相信任何對(duì)大模型感興趣的開(kāi)發(fā)者都可以找到屬于自己的角色。
?
本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires
