五分鐘技術(shù)趣談 | GPT-4——多模態(tài)大模型新特性與優(yōu)勢
Part 01 與GPT-3.5的區(qū)別
1.1 GPT-4文本輸入字?jǐn)?shù)大幅提升,可達(dá)25000字
圖片
通常對語言模型來說,輸入字?jǐn)?shù)的提升有以下幾個好處:
(1)理解和回應(yīng)更長的文本:隨著模型的輸入容量增加,GPT-4將能夠處理更長的文本輸入。這對于處理長篇文章、技術(shù)文檔或復(fù)雜的問題陳述可能會更有優(yōu)勢,可以更全面地理解上下文,并給出更詳細(xì)和準(zhǔn)確的回答。
(2)更好地處理上下文和連貫性:具備更大的輸入容量有助于GPT-4更好地維護(hù)對話的上下文,并生成連貫的回應(yīng)。更長的輸入序列能提供更多關(guān)于對話歷史和語境的信息,使其能夠更好地理解用戶的意圖并生成更一致的回答。
(3)支持更復(fù)雜的任務(wù)和需求:擁有更大的模型輸入容量可以使GPT-4處理更復(fù)雜的任務(wù)和需求。例如,對于涉及大量細(xì)節(jié)或需要考慮多個方面的問題,其可以接收更多相關(guān)信息并提供更全面的解答。
(4)提高對大型文本數(shù)據(jù)的理解能力:對于長篇文本、大規(guī)模數(shù)據(jù)集或大型知識庫,具備更大的輸入容量使GPT-4能夠更全面地理解和處理這些數(shù)據(jù)。這也是GPT-4可以進(jìn)行數(shù)據(jù)分析并通過專業(yè)考試的基礎(chǔ)。
1.2 多模態(tài)輸入→從識圖到“懂梗”
下圖是一個多模態(tài)輸入與搞笑圖片的案例:
圖片
相比以文本為主的GPT-3.5,GPT-4的多模態(tài)的輸入與深度含義理解具有以下意義:
(1)豐富輸入信息:多模態(tài)輸入意味著除了文本之外,還包括其他形式的信息,如圖像、視頻、音頻等,這使大模型能夠從不同的感知角度獲取更全面、多樣化的信息。通過結(jié)合多種模態(tài)的輸入,從而更好地理解和回應(yīng)用戶的需求。
(2)支持更廣泛的應(yīng)用場景:多模態(tài)輸入擴(kuò)展了GPT-4的應(yīng)用領(lǐng)域。除了處理文本交互外,GPT-4還可以參與圖像描述、視覺問答、語音識別和合成等任務(wù),這使得其能夠在更廣泛的領(lǐng)域和應(yīng)用場景中發(fā)揮作用,并提供更全面和多樣化的支持。
(3)促進(jìn)多模態(tài)交互和體驗(yàn):多模態(tài)輸入有助于推動人機(jī)交互的發(fā)展,提供更豐富、自然的交互方式。通過結(jié)合多種感知模態(tài),例如使用語音和圖像進(jìn)行交互,GPT-4可以更好地適應(yīng)用戶的習(xí)慣和偏好,提供更個性化和多樣化的用戶體驗(yàn)。
(4)支持創(chuàng)意和幽默的表達(dá):梗通常是創(chuàng)意和幽默的表達(dá)形式,能夠理解梗使 GPT-4 能夠更好地參與到創(chuàng)意和幽默的對話中。這有助于提供更有趣、有趣和有個性的回答,增加與用戶的互動和吸引力。
1.3 從數(shù)據(jù)分析到通過專業(yè)測試
GPT-4相比GPT-3.5,在處理分析圖表、做題上都不在話下,而且更加聰明的GPT-4還很會考試,高分通過律師資格、SAT以及GRE考試,堪稱完美碾壓成績排倒數(shù)前代GPT-3.5的“做題家”。
圖片
圖片
GPT-4在這些領(lǐng)域上,具有以下意義:
(1)自動化數(shù)據(jù)分析:GPT-4 可以承擔(dān)部分?jǐn)?shù)據(jù)分析的工作,幫助人們更高效地處理大量的數(shù)據(jù)。通過對數(shù)據(jù)進(jìn)行解析、提取關(guān)鍵信息和生成可視化報(bào)告,可以為決策制定和業(yè)務(wù)分析提供有價(jià)值的支持。
(2)減輕人力負(fù)擔(dān):數(shù)據(jù)分析通常需要大量的時(shí)間和資源來進(jìn)行處理和解釋。如果 GPT-4能夠自動執(zhí)行部分?jǐn)?shù)據(jù)分析任務(wù),可以減輕人力負(fù)擔(dān),提高工作效率。人們可以將更多的時(shí)間用于更復(fù)雜的數(shù)據(jù)解釋和策略規(guī)劃,從而提高工作的產(chǎn)出和價(jià)值。
(3)輔助決策制定:通過數(shù)據(jù)分析,GPT-4可以提供有關(guān)業(yè)務(wù)、市場趨勢和用戶行為等方面的見解。這些見解可以幫助決策者做出更明智的決策,優(yōu)化業(yè)務(wù)流程和策略。GPT-4的分析能力可以提供客觀、基于數(shù)據(jù)的決策支持,降低決策風(fēng)險(xiǎn)。
(4)教育和培訓(xùn)應(yīng)用:如果 GPT-4能夠通過考試,它可以在教育和培訓(xùn)領(lǐng)域發(fā)揮作用。它可以為學(xué)生提供個性化的學(xué)習(xí)支持,回答問題并提供解釋和指導(dǎo)。此外,GPT-4還可以提供模擬考試和評估,幫助學(xué)生進(jìn)行自我評估和準(zhǔn)備考試。
Part 02 總結(jié)
GPT-4作為GPT的最新成果,具有很廣闊的技術(shù)前景,是未來發(fā)展的核心能力之一,但也應(yīng)注意,雖然GPT-4已經(jīng)很強(qiáng)大,但仍舊存在局限性,比如錯誤識別方面,仍然可能產(chǎn)生幻覺,編造事實(shí),在智力水平方面,不會從經(jīng)驗(yàn)中學(xué)習(xí),有時(shí)會犯簡單的推理錯誤等,讓我們進(jìn)一步觀察吧。
Part 03 AHP建模步驟舉例
AHP建模步驟(圖1)主要包括:層次結(jié)構(gòu)指標(biāo)模型的搭建、構(gòu)造判斷矩陣、單層次排序及一致性校驗(yàn)、層次總排序及一致性校驗(yàn)等多個實(shí)施步驟。本文我們將以某類智能家居產(chǎn)品體驗(yàn)評分模型為例來進(jìn)行講解和分析。
圖片
3.1 搭建層次結(jié)構(gòu)指標(biāo)模型
在應(yīng)用 AHP 分析決策問題時(shí),首先我們就要把問題進(jìn)行層次化,搭建一個有層次的結(jié)構(gòu)指標(biāo)模型,模型中層次的元素作為準(zhǔn)則對下一層次有關(guān)元素起到支配的作用。例如構(gòu)建某類智能家具產(chǎn)品體驗(yàn)評分模型,我們的一級指標(biāo)定義為功能完備性、硬件可靠性、使用體驗(yàn)、終端性能,每個指標(biāo)下面又細(xì)分為如圖2的二級指標(biāo)。
我們的層次結(jié)構(gòu)指標(biāo)模型中的層次數(shù)主要由問題的復(fù)雜程度以及需要分析的詳盡程度決定。需要注意的是雖然一般層次數(shù)不受限制,但是每一層次中各元素所支配的元素一般盡量不要超過9個,因?yàn)楫?dāng)可支配的元素過多的時(shí)候,此時(shí)會給兩兩比較判斷帶來困難。元素也需要有相對獨(dú)立的特征,如果相關(guān)度較高則會影響結(jié)果的準(zhǔn)確性。
3.2 構(gòu)造判斷矩陣
第一步得到的層次指標(biāo)結(jié)構(gòu)反映了因素之間的關(guān)系,但在不同決策者的心目中元素指標(biāo)所占的比重肯定是不同的,而且當(dāng)影響某因素的因子較多時(shí),如果直接考慮各因子對該因素的影響程度,可能會因?yàn)轭櫞耸П恕⒖紤]不全面得到一些與決策者心中不一致或者前后矛盾的結(jié)果。
為提供較為可信的數(shù)據(jù),假設(shè)現(xiàn)在要比較n個因子對某因素的影響大小,我們采用對因子進(jìn)行兩兩比較,最終建立成判斷矩陣的辦法。每次取兩個因子,采用下表1方式比較,引用數(shù)字1~9及其倒數(shù)作為標(biāo)度,全部比較結(jié)果用矩陣A表示。
這么說還是有些抽象,我們用以上標(biāo)度為規(guī)則,來構(gòu)建判斷矩陣表格如下:
表中描述因子之間的相對重要程度,決定這些數(shù)值大小的可以是決策者的主觀判斷,也可以是基于調(diào)查或文獻(xiàn)來判斷,也可以是由專家討論決定,上表中的值來源主觀判斷。不難理解,判斷矩陣斜對角線對稱元素應(yīng)該是互為倒數(shù)的,同時(shí)判斷矩陣的數(shù)值還應(yīng)該遵守邏輯規(guī)范,否則無法通過后面的一致性校驗(yàn)。例如表2中,耐高溫低溫比防水性重要,防水性比耐摔性重要,如果我們填成耐摔性比耐高溫低溫重要,那肯定是邏輯錯誤。
3.3 單層次排序及一致性檢驗(yàn)
層次單排序即根據(jù)判斷矩陣計(jì)算對于上一層的一個指標(biāo)元素,計(jì)算本層次與之有聯(lián)系的所有因子的重要性次序的權(quán)重值,并根據(jù)權(quán)重對其進(jìn)行重要性排序。權(quán)重值的計(jì)算有求和法、方根法以及特征向量法。我們用表2進(jìn)行求和法舉例,首先先將矩陣的每列進(jìn)行標(biāo)準(zhǔn)化,然后將標(biāo)準(zhǔn)化后的各元素按行求和,最后將求和結(jié)果進(jìn)行標(biāo)準(zhǔn)化從而得到各因子的權(quán)重值,圖3表示了我們的計(jì)算過程。
為了檢驗(yàn)判斷矩陣的數(shù)值是否符合邏輯規(guī)范,我們需要進(jìn)行一致性校驗(yàn)。我們需要求出最大特征根,然后用以下的一致性指標(biāo) CI 來檢驗(yàn)判斷的一致性指標(biāo),n為判斷矩陣階數(shù):
CI=0 表示判斷矩陣完全一致,CI越大,判斷矩陣的不一致性程度越嚴(yán)重。然后我們根據(jù)CI、RI值求解CR值,判斷其一致性是否通過。
RI的值要參考如下平均隨機(jī)一致性指標(biāo)表來確定,其值n即判斷矩陣的階數(shù)。
若 CR < 0.1則認(rèn)為判斷矩陣通過了一致性檢驗(yàn),若不滿足條件則需要檢查判斷矩陣,并對其值進(jìn)行調(diào)整。
我們以表2為例,n值為3,我們計(jì)算最大特征根,公式為:
AW為:判斷矩陣*標(biāo)準(zhǔn)化后的權(quán)重,然后按行的累加值。根據(jù)以上幾個公式計(jì)算可得到CR<0.1,因此通過了一致性檢驗(yàn)。其他幾個判斷矩陣也可以用同樣的方式求解,并進(jìn)行一致性校驗(yàn)。
3.4 層次的總排序及一致性校驗(yàn)
由以上幾步我們得到的是一組元素對其上一層中某元素的權(quán)重向量。我們最終要得到各元素尤其是最低層對于目標(biāo)的排序權(quán)重,總排序權(quán)重要自上而下地將單準(zhǔn)則下的權(quán)重進(jìn)行合成。例如圖1中將第二層“使用體驗(yàn)”的權(quán)重分別和第三層“硬件使用體驗(yàn)”的權(quán)重和“軟件使用體驗(yàn)”的權(quán)重相乘,類似依次得到相對于目標(biāo)的權(quán)重值,最終進(jìn)行權(quán)重的排序。涉及最低層中各方案對層次總排序需作一致性檢驗(yàn),檢驗(yàn)由高層到低層逐層進(jìn)行即可。當(dāng)總排序隨機(jī)一致性比例CR<0.1 時(shí),認(rèn)為層次總排序結(jié)果具有較滿意的一致性并接受該分析結(jié)果。
Part 04 相關(guān)用戶體驗(yàn)設(shè)計(jì)測評的應(yīng)用方向
從以上的分析可以看出,AHP(層次分析法)是一種多準(zhǔn)則決策方法,它可用于幫助評估和比較不同因素的重要性。在用戶體驗(yàn)設(shè)計(jì)測評中,AHP還可以應(yīng)用于以下幾個方面:
1)分配相關(guān)功能需求重要性:AHP可以幫助確定功能需求的相對重要性,確定產(chǎn)品設(shè)計(jì)中的重點(diǎn)關(guān)注地方,為產(chǎn)品或服務(wù)的設(shè)計(jì)提供一定指導(dǎo)。
2)幫助決策產(chǎn)品或設(shè)計(jì)方案:AHP可以幫助比較決策不同的產(chǎn)品或設(shè)計(jì)方案,通過找到影響設(shè)計(jì)或產(chǎn)品方案的準(zhǔn)則,使用AHP來計(jì)算它們之間的相對權(quán)重,最終為決策者找出最優(yōu)的產(chǎn)品或設(shè)計(jì)方案。
3)確定產(chǎn)品優(yōu)先改進(jìn)方向:通過應(yīng)用AHP,可以對用戶體驗(yàn)中的不同方面進(jìn)行評估和排序,以確定最需要改進(jìn)的領(lǐng)域。將用戶體驗(yàn)分解為易用性、效率、滿意度等多個維度,通過對這些維度進(jìn)行比較和權(quán)重計(jì)算,幫助決策者確定在產(chǎn)品開發(fā)過程中優(yōu)先改進(jìn)方向。
4)評估用戶的滿意度:AHP還可以用于用戶滿意度的評估,將滿意度分解為不同的影響因素,進(jìn)行比較和權(quán)重計(jì)算,可以找出對用戶滿意度的影響最大的因素,以及對于提高用戶滿意度還有哪些需要改進(jìn)的方面。
需要指出的是,在使用AHP進(jìn)行用戶體驗(yàn)測評時(shí),在制定比較矩陣時(shí)要盡量客觀、準(zhǔn)確地進(jìn)行比較,避免主觀偏見對結(jié)果的影響,同時(shí)需要慎重選擇評估者和數(shù)據(jù)源??偟膩碚f,AHP為用戶體驗(yàn)設(shè)計(jì)的提升提供了一種系統(tǒng)化和可量化的方法,有助于企業(yè)產(chǎn)品提供更滿意的用戶體驗(yàn)。
? 參考文獻(xiàn)
[1] 葉珍. 基于AHP的模糊綜合評價(jià)方法研究及應(yīng)用[D].
[2] https://blog.csdn.net/weixin_43095238/article/details/108055579.
[3] https://zhuanlan.zhihu.com/p/448412538.