關(guān)于大模型我又犯了一個(gè)想當(dāng)然的錯(cuò)誤,如霧里看花,終隔一層 原創(chuàng)
“ 做到知行合一,在知中行,在行中知,才不會(huì)霧里看花”
看過(guò)我文章的人應(yīng)該都知道,最近一直在研究大模型的應(yīng)用領(lǐng)域,也就是怎么應(yīng)用大模型的強(qiáng)大功能,而且還開(kāi)發(fā)了一個(gè)簡(jiǎn)單的微信聊天機(jī)器人小程序;但是總有一種霧里看花的感覺(jué),老是想不明白。
這幾天在散步的時(shí)候滿腦子想的都是聊天機(jī)器人,內(nèi)容生成;然后就在想,內(nèi)容生成難道只能用來(lái)聊天嗎?
然后回來(lái)就問(wèn)了大模型,聊天機(jī)器人和內(nèi)容生成的關(guān)系,然后得到了不一樣的結(jié)果,才發(fā)現(xiàn)在之前太想當(dāng)然了,大模型遠(yuǎn)遠(yuǎn)沒(méi)有想的那么簡(jiǎn)單。
微信聊天機(jī)器人小程序:
01、對(duì)大模型的認(rèn)知偏差
首先,思考一個(gè)問(wèn)題聊天機(jī)器人和內(nèi)容生成有什么關(guān)系?它們是一個(gè)東西嗎?有什么區(qū)別?
關(guān)于智能機(jī)器人已經(jīng)不是一個(gè)新的名詞,在智能手機(jī)出現(xiàn)時(shí)就有了智能機(jī)器人,只不過(guò)那時(shí)的機(jī)器人智商還很低,比如蘋(píng)果的siri,小愛(ài)同學(xué),天貓精靈等。
而隨著人工智能技術(shù)的發(fā)展,也就是大模型的出現(xiàn),新的更加智能的機(jī)器人開(kāi)始出現(xiàn)。但從技術(shù)角度來(lái)說(shuō),智能機(jī)器人也有多種不同的情況。
比如,基于生成式大模型的內(nèi)容生成聊天機(jī)器人;而如果使用RAG(檢索增強(qiáng))或其它檢索技術(shù),那就是檢索類(lèi)型的聊天機(jī)器人;其它的還有基于規(guī)則驅(qū)動(dòng)的聊天機(jī)器人。
既然提到內(nèi)容生成,那么什么是內(nèi)容生成?
內(nèi)容生成是指通過(guò)人工智能和自然語(yǔ)言處理技術(shù),自動(dòng)生成文本,圖像,音頻,視頻等多種形式的內(nèi)容。
從字面意思來(lái)理解,生成自然是生成之前沒(méi)有的東西,如果已經(jīng)有了,那就不叫生成了,那叫搜索;從無(wú)到有的過(guò)程,才能叫做生成。
那大模型知識(shí)庫(kù)屬于內(nèi)容生成嗎?
說(shuō)到這個(gè),我們就應(yīng)該先理解是什么大模型知識(shí)庫(kù)。大模型知識(shí)庫(kù)旨在融合大模型技術(shù),對(duì)海量的企業(yè)內(nèi)部數(shù)據(jù),專業(yè)知識(shí)等進(jìn)行高效組織,智能索引和深度學(xué)習(xí),使之成為可以被模型理解和利用的結(jié)構(gòu)化知識(shí)或資源。
大模型知識(shí)庫(kù)不僅能實(shí)現(xiàn)企業(yè)內(nèi)部知識(shí)的快速檢索與匹配,還能利用大模型的語(yǔ)言理解和生成能力。
因此,可以說(shuō)大模型知識(shí)庫(kù)是使用了大模型的內(nèi)容生成能力,但不完全屬于內(nèi)容生成。
再想一個(gè)問(wèn)題,大模型在內(nèi)容生成領(lǐng)域,可以生成文本,圖片,音頻和視頻;那么,圖片摳圖和去除水印屬于圖像生成嗎?音頻降噪,視頻的清晰度優(yōu)化屬于內(nèi)容生成嗎?
那么使用mind journey根據(jù)語(yǔ)言描述生成一個(gè)圖片呢?
因此,從這里可以看出,內(nèi)容生成只是大模型的一個(gè)功能點(diǎn),它還有很多別的功能。
02、自然語(yǔ)言處理三兄弟,NLP,NLG,NLU
在前面說(shuō),內(nèi)容生成是大模型技術(shù)與自然語(yǔ)言處理(NLP)的結(jié)合,那么什么是自然語(yǔ)言處理,它和NLU(自然語(yǔ)言理解),NLG(自然語(yǔ)言生成)又有什么關(guān)系?
自然語(yǔ)言處理應(yīng)該算是一個(gè)通稱,它的目的就是讓機(jī)器用人類(lèi)的語(yǔ)言和人類(lèi)進(jìn)行交流,而不再需要使用編程語(yǔ)言。
因此,要想讓機(jī)器和人類(lèi)使用人類(lèi)的語(yǔ)言交流,那么就需要讓機(jī)器理解人類(lèi)語(yǔ)言,然后它才能用人類(lèi)的語(yǔ)言“說(shuō)出”它想說(shuō)的話。
因此,這就有了自然語(yǔ)言理解——NLU和自然語(yǔ)言生成——NLG的出現(xiàn)。
那NLP是怎么實(shí)現(xiàn)的呢?
數(shù)據(jù)科學(xué)家和大模型專家,通過(guò)把非結(jié)構(gòu)化的自然語(yǔ)言(包括文本,語(yǔ)音和視頻)轉(zhuǎn)化為結(jié)構(gòu)化計(jì)算機(jī)能夠識(shí)別的文本或語(yǔ)言;然后經(jīng)過(guò)大模型的語(yǔ)義分析,生成對(duì)應(yīng)的模型結(jié)構(gòu)表。
之后,大模型再根據(jù)問(wèn)題的語(yǔ)義,從模型表中解析出具有自然語(yǔ)言語(yǔ)義的并且有關(guān)聯(lián)的正確回答。
human: 你吃飯了嗎?
llm: 林黛玉杯酒斬唐僧。
human: 你吃飯了嗎?
llm: 今天下雨了。
human: 你吃飯了嗎?
llm: 吃過(guò)了,吃的餃子。
以上三句人類(lèi)與大模型的對(duì)話中,第一句大模型的回答即答非所問(wèn),而且回答的是錯(cuò)誤的。第二句,大模型回答的雖然是答非所問(wèn),但是它這句話是正確的;第三句,大模型回答的既有關(guān)聯(lián),而且是正確的。
因此,NLP中,大模型首先要理解語(yǔ)義和語(yǔ)境,也就是NLU;然后還能正確地回答問(wèn)題,也就是NLG。
從這里也可以看出,大模型知識(shí)庫(kù)并不是簡(jiǎn)單的檢索知識(shí)庫(kù),還要利用大模型的語(yǔ)義理解和生成能力來(lái)更靈活,且準(zhǔn)確的回答。
總結(jié)
偉大的領(lǐng)袖說(shuō)過(guò),沒(méi)有調(diào)查就沒(méi)有發(fā)言權(quán),要想了解一件事,首先就要去靠近它,理解它,否則只能霧里看花,不知所以。
知行合一,在知中行,在行中知。
本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires
原文鏈接:??https://mp.weixin.qq.com/s/LxhE8yJ1M3cZhI4FzQzOQg??
