拋開技術(shù),從問題來串聯(lián)人工智能,機(jī)器學(xué)習(xí)和大模型技術(shù) 原創(chuàng)
“ 技術(shù)并不是一個一蹴而就的過程,而是一個逐漸發(fā)展的過程”
大模型火了也有兩年時間了,然后很多人也在不斷的學(xué)習(xí)大模型技術(shù),但很多人一直沒學(xué)明白什么是大模型技術(shù);他們所理解的大模型技術(shù)就是官方給出的大模型定義,但根本不知道為什么需要大模型技術(shù),以及大模型為什么會是這個樣子。
今天,我們就拋開技術(shù)來思考一下,什么是大模型?
什么是大模型?
如果你問一個人什么是大模型,如果是一個技術(shù)人員他肯定會告訴你,大模型是一個擁有巨大參數(shù)量,并且需要經(jīng)過大量數(shù)據(jù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型。
而如果是一個非技術(shù)人員,或者不了解大模型技術(shù)的人,他可能會告訴你大模型是一個很火的技術(shù),是一種非常牛逼的人工智能技術(shù)。
OK,拋開專業(yè)的技術(shù)力量,上面的兩種說法都沒有錯;但如果讓你來回答這個問題,什么是大模型?把你自己的理解用語言給描述出來?,F(xiàn)在開始思考一下,什么是大模型,你會怎么回答這個問題。也可以把你的理解打在評論區(qū)。
下面我們從非技術(shù)的角度開始,從問題開始,由淺入深的理解一下什么是大模型。
想理解什么是大模型,首先要理解大模型解決了什么問題;首先,大模型屬于人工智能的一個實(shí)現(xiàn)范疇,所以我們先從人工智能開始說起。
什么是人工智能?
人工智能簡單來說就是由人類制造出來的一個具有智能的機(jī)器或系統(tǒng);也就是說人工智能是由人類制造出來的一個智能體。
為什么要制造這個智能體呢?拋開對技術(shù)的執(zhí)念,單從智能體的作用來思考;有句話叫,技術(shù)發(fā)展的根本原因是因?yàn)槿祟惖亩栊?,人類什么事都不想干,什么事都想讓機(jī)器去干。
但剛開始的機(jī)器只能由人類去操作才能完成一些事情,那么是否可以設(shè)計出一款可以自己思考,不需要人類干涉,然后就能主動去解決各種復(fù)雜問題的機(jī)器;這個機(jī)器就是人工智能。
ok現(xiàn)在目的已經(jīng)很明確了,人類想設(shè)計出一款能夠自己思考,自己干活的機(jī)器,這樣就可以把人類從繁重的工作中解脫出來。
那么,怎么才能做出這樣的一個機(jī)器呢 ?也就是用什么樣的方案,才能達(dá)到這個目的?
科學(xué)家和一些技術(shù)人員經(jīng)過多年的研究發(fā)現(xiàn),想實(shí)現(xiàn)人工智能可能存在多種方式(人工智能有幾個流派,感興趣的可以去搜索一下);但目前最火的,也是最可能實(shí)現(xiàn)的人工智能技術(shù)就是——機(jī)器學(xué)習(xí)。
什么是機(jī)器學(xué)習(xí)?
既然一次性想實(shí)現(xiàn)一個人工智能很復(fù)雜,也很困難,那么是否可以模仿人類的成長過程一樣,通過學(xué)習(xí)的方式,讓機(jī)器慢慢具備智能;也就是讓機(jī)器去學(xué)習(xí)。
經(jīng)過一段時間的研究,科學(xué)家們也提出了一些關(guān)于機(jī)器學(xué)習(xí)的想法,并實(shí)現(xiàn)了一些算法;比如樸素貝葉斯,邏輯回歸,決策樹等。
但科學(xué)家們發(fā)現(xiàn),這些方式只能實(shí)現(xiàn)一些很簡單的“智能”,事實(shí)上根本算不上智能;那有沒有更好的辦法呢?
因此,經(jīng)過仿生學(xué)的研究,科學(xué)家發(fā)現(xiàn)可以把實(shí)現(xiàn)人工智能與人類的腦科學(xué)結(jié)合起來;人類的思想很復(fù)雜,也很深邃,但核心部件就是我們的大腦;那能不能用一種方式去模仿人類的大腦,然后通過這種方式來實(shí)現(xiàn)人工智能呢?
因此,基于機(jī)器學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)就出現(xiàn)了;什么是神經(jīng)網(wǎng)絡(luò)?
所謂的神經(jīng)網(wǎng)絡(luò)就是模仿人類的大腦神經(jīng)元,用一種結(jié)構(gòu)或算法去模仿人類的大腦運(yùn)作方式,來讓機(jī)器具備自主學(xué)習(xí)的能力。
那神經(jīng)網(wǎng)絡(luò)和大模型又有什么關(guān)系呢?
事實(shí)上,大模型是一種基于神經(jīng)網(wǎng)絡(luò)架構(gòu)的機(jī)器學(xué)習(xí)模型;因?yàn)槿四X是一個非常復(fù)雜的系統(tǒng),人腦中有幾百億神經(jīng)元;因此,采用這種模仿人腦的神經(jīng)網(wǎng)絡(luò)模型,就需要大量的參數(shù)來模仿不同的神經(jīng)元;而模仿出大腦神經(jīng)網(wǎng)絡(luò)之后,還要讓這個模型進(jìn)行學(xué)習(xí),因此就需要大量的數(shù)據(jù)讓它去理解,去學(xué)習(xí)。
因此,這種需要大規(guī)模的學(xué)習(xí)數(shù)據(jù),基于神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)的機(jī)器學(xué)習(xí)模型,就叫做大模型。
現(xiàn)在大家應(yīng)該了解了什么是大模型;那這個大模型具體怎么實(shí)現(xiàn)呢?這里可能有人會想,你這說的不是廢話嗎?前面剛說了模仿人類大腦神經(jīng)元,現(xiàn)在又問怎么實(shí)現(xiàn)。
其實(shí)有這種問題也不奇怪,雖然說是模仿大腦神經(jīng)元,那具體怎么模仿?這就類似于讓你模仿鳥類的飛行,來制造一個飛機(jī)出來;而飛機(jī)怎么制造?
制造飛機(jī)設(shè)計到動力系統(tǒng),流體力學(xué),材料學(xué),控制系統(tǒng)等等多種學(xué)科;同樣,大模型也是如此;大模型設(shè)計到計算機(jī)科學(xué),哲學(xué),社會學(xué),數(shù)學(xué),物理學(xué)等等多種學(xué)科。
而且用機(jī)器去模仿人類的大腦,總要有一種結(jié)構(gòu)吧;畢竟人腦也是有結(jié)構(gòu)的;那么,怎么用一種結(jié)構(gòu)或者說數(shù)學(xué)模型來模仿人類的大腦結(jié)構(gòu)呢?
這時,讓chatGPT大放異彩的Transformer模型就出現(xiàn)了;當(dāng)然,大模型并不只有Transformer這一種模型結(jié)構(gòu);還有其它多種模型結(jié)構(gòu),感興趣的也可以自己去搜索一下。
ok現(xiàn)在我們知道什么是大模型了,也知道了大模型的基礎(chǔ)結(jié)構(gòu)之一的Transformer模型;那么,人類可以進(jìn)行讀,寫,繪畫創(chuàng)作和邏輯推理等操作;那么怎么才能讓大模型也具備這種能力呢?
因此,這時就需要把大模型技術(shù)與自然語言處理技術(shù)相結(jié)合,這樣就可以讓大模型具備讀和寫的能力;而再把大模型與計算機(jī)視覺技術(shù)相結(jié)合,這樣大模型就具備了圖像和視頻處理的能力。
而邏輯推理是人類大腦最復(fù)雜也是最強(qiáng)大的一項(xiàng)能力,大模型無法直接實(shí)現(xiàn)類似人類思考推理的過程,但可以通過一種方式,那就是步驟拆解;讓大模型慢慢具備對簡單邏輯進(jìn)行拆解的能力,然后使用這種方式,讓大模型把復(fù)雜的問題簡單化,讓好大模型就可以對簡單的問題進(jìn)行處理;最后組合成一個能解決復(fù)雜問題的系統(tǒng)。
當(dāng)然,大模型的技術(shù)目前還處于初級階段,它還處在一個不斷發(fā)展與完善的過程。但我們需要考慮的是,一是怎么把大模型做的更好,更強(qiáng)大;二是怎么讓大模型解決我們生活和工作中的問題;通過理論研究和實(shí)際應(yīng)用的過程來不斷的提升和發(fā)展大模型的能力。
本文轉(zhuǎn)載自公眾號AI探索時代 作者:DFires
