自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

可令 AI 自我判斷輸出內(nèi)容正確性,谷歌公布模型訓(xùn)練框架 ASPIRE

人工智能
谷歌提到,當(dāng)下大語言模型在自然語言理解和生成內(nèi)容方面發(fā)展迅速,已被用于構(gòu)建各種創(chuàng)新應(yīng)用,但要應(yīng)用于高風(fēng)險決策類場合依然不妥。

IT之家 1 月 23 日消息,谷歌日前發(fā)布新聞稿,介紹了一款專為大語言模型設(shè)計的 ASPIRE 訓(xùn)練框架,該框架號稱可以增強 AI 模型的選擇性預(yù)測能力。

谷歌提到,當(dāng)下大語言模型在自然語言理解和生成內(nèi)容方面發(fā)展迅速,已被用于構(gòu)建各種創(chuàng)新應(yīng)用,但要應(yīng)用于高風(fēng)險決策類場合依然不妥。這是由于模型預(yù)測具有不確定性及“幻覺”可能,因此谷歌開發(fā)了一款 ASPIRE 訓(xùn)練框架,為系列模型引入了“可信度”機制,即 —— 模型會輸出一系列答案,每個答案都會具有正確概率評分

▲ 圖源 谷歌新聞稿(下同)

在技術(shù)層面,IT之家注意到該訓(xùn)練框架主要分為三階段,分別為“特定任務(wù)調(diào)整”、“答案采樣”和“自我評估學(xué)習(xí)”。

其中“特定任務(wù)調(diào)整”階段是對已接受過基礎(chǔ)訓(xùn)練的大型語言模型進行深入訓(xùn)練,專注于強化模型的預(yù)測能力。研究人員主要為模型引入一系列可調(diào)參數(shù),在特定任務(wù)的訓(xùn)練數(shù)據(jù)集上微調(diào)預(yù)訓(xùn)練語言模型,從而提升模型預(yù)測性能,讓模型能夠更好地解決特定問題。

第二階段為“答案采樣”,經(jīng)過特定微調(diào)后,模型可以利用先前學(xué)習(xí)到的可調(diào)參數(shù),為每個訓(xùn)練問題生成不同的答案,并創(chuàng)建用于自我評估學(xué)習(xí)的數(shù)據(jù)集,生成一系列可信度較高的答案。研究人員同時使用 “集束搜索(Beam Search)”方法及 Rouge-L 算法來評估答案的質(zhì)量,并將生成的答案及評分重新輸入給模型開啟第三階段

而在第三階段“自我評估學(xué)習(xí)”中,研究人員為模型添加一組可調(diào)參數(shù),專門用于提升模型自我評估能力。該階段的目標(biāo)是讓模型學(xué)會“自己判斷輸出的答案準(zhǔn)確性”,從而讓大語言模型在生成答案時,還會附上答案的正確概率評分。

谷歌研究人員使用 CoQA、TriviaQA 和 SQuAD 三個問答數(shù)據(jù)集來驗證 ASPIRE 訓(xùn)練框架的成果,據(jù)稱“經(jīng)過 ASPIRE 調(diào)整的 OPT-2.7B 小模型,表現(xiàn)遠超更大的 OPT-30B 模型”。而這項實驗結(jié)果也同時表明,只要經(jīng)過適當(dāng)?shù)恼{(diào)整,即使是小語言模型,在部分場景下也可以超越大語言模型。

研究人員總結(jié)稱,ASPIRE 框架訓(xùn)練能夠顯著提升大語言模型輸出準(zhǔn)確率,即使是較小的模型,也可以在經(jīng)過微調(diào)后進行“準(zhǔn)確且有自信”的預(yù)測。

責(zé)任編輯:姜華 來源: IT之家
相關(guān)推薦

2023-12-17 19:38:37

谷歌AI 模型人工智能

2024-01-15 14:44:19

語言模型PaLMAI

2023-10-25 16:27:05

2015-07-06 14:54:19

Spark計算正確性Hadoop

2011-04-19 09:41:22

數(shù)據(jù)庫

2010-02-25 16:22:18

Linux gcc編譯

2024-06-13 17:34:52

2023-09-06 13:17:00

AI數(shù)據(jù)

2020-03-12 12:31:01

開源谷歌量子AI

2017-06-05 16:17:50

深度學(xué)習(xí)算法神經(jīng)網(wǎng)絡(luò)

2025-02-24 10:03:21

2024-10-28 14:05:00

2025-03-10 10:24:04

2019-06-13 14:52:59

谷歌Android開發(fā)者

2020-01-14 11:46:14

谷歌iOS 12.4漏洞

2023-07-09 15:18:27

谷歌AI隱私

2023-06-27 12:56:23

微軟AI

2023-11-21 14:48:11

2024-01-06 08:10:08

ChatGPT-4人工智能知識圖譜

2025-02-24 09:12:00

點贊
收藏

51CTO技術(shù)棧公眾號