你對大模型認知的開始——大模型的能力問題 原創(chuàng)
“ 大模型的能力是對大模型自身最好的詮釋 ”
在此之前,一直不知道該怎么準確表達大模型,雖然一直在學習和使用大模型,但很多時候很難一句話說明白什么是大模型,也很難說明白大模型能干什么。
但在昨天想問題的過程中,腦子里突然冒出一個詞——能力,大模型的能力。
總之一句話,大模型能做什么,不能做什么就是大模型的能力問題。
大模型的能力
在過去的2023年,被稱為千模大戰(zhàn)的時代,無數(shù)大模型如雨后春筍般冒了出來,很多大模型公司也在不斷地強化各自的大模型。因此,我們也經常會聽到某某大模型很強大,某某大模型又打破了什么記錄。
而千模大戰(zhàn),他們打的是什么?
用一句話概括就是,打的是大模型的能力,很多企業(yè)想方設法不斷的提升大模型的能力;你家的大模型能聊天,我們家大模型就能講故事,你們家大模型能生成視頻,我們家大模型就能做邏輯推理。
你知道了什么是大模型的能力,那么你就知道了你在學習和使用過程中在做什么,在學什么。
比如,機器學習,神經網絡,模型訓練等等就屬于實現(xiàn)大模型能力的技術;而你用大模型去做產品,去解決問題,這就屬于大模型的應用技術。
知道了這些,你就知道大模型的發(fā)展也就兩個方向,一個是怎么做一個擁有強大能力的大模型,另一個是怎么用好大模型的強大能力。
這也是前面文章中不斷提到的,技術的本質是工具,一個會制造工具,即怎么把工具做的更好,第二個是學會使用工具,即怎么把工具給用好。
怎么做好工具,就是不斷地提升工具的能力;怎么用好工具,就是不斷地開發(fā)工具的使用場景。
大模型的能力
那大模型有哪些能力?
在之前的文章中,甚至是前一篇文章中也提到過,可以把大模型當做一個人,它能夠寫文章,做圖片,做視頻,甚至是做一些邏輯判斷和規(guī)劃,可以說人能做的事,從理論上來說它都能做。
但,受限于目前的技術能力,大模型的能力還有很多的局限性,比如有時候會一本正經的胡說八道;有時在邏輯判斷中會出現(xiàn)明顯的邏輯錯誤等,而這正是大模型廠商需要解決的問題。
而目前來說,大模型的主要能力表現(xiàn)在生成方面,也就是常見的生成文字,圖片,視頻,但隨著大模型技術的發(fā)展,已經有生成音樂,PPT等內容的模型出現(xiàn)。這也是為什么現(xiàn)在的大模型叫做生成式大模型的原因,顧名思義。
而大模型還一個主要能力就是推理規(guī)劃,在基于思維鏈(COT)研究的過程中,大模型已經有了簡單的推理規(guī)劃能力,并且可以通過API的方式調用一些第三方工具里完成任務。
雖然說大模型的推理規(guī)劃能力還很弱,但隨著技術的發(fā)展,其推理規(guī)劃能力將越來越強;其生成能力也會越來越強。就類似于一個無所不能的人。
雖然現(xiàn)在的大模型能力已經很強大,但事實上它離人類的期望還有很長的路要走,比如說它還不具備自我學習的能力,還必須依靠預訓練的方式才能完成知識的”學習”過程。
并且,一旦完成“學習”——訓練,它的知識也就固定在它學習完成的那一刻,無法再了解最新的知識;如果想讓它知道最新的知識,只有通過重新訓練或通過掛載知識庫的方式來更新它的知識。
而邏輯推理能力更是人類對大模型寄予的厚望,因為這是大模型通向AGI(通用人工智能)的一種方式;人類希望大模型能夠通過自己的邏輯判斷去自主學習和解決現(xiàn)實中的問題,并能不斷強化自身的能力。
技術的發(fā)展是一個量變到質變的過程,openAI發(fā)布chatGPT代表著人工智能技術上了一個全新的臺階;而目前又將進入一個長期的平穩(wěn)發(fā)展階段,可以預見在未來的某一天;人工智能技術又將一鳴驚人。
本文轉載自公眾號AI探索時代 作者:DFires
