自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

谷歌推出 DataGemma:基于可信數(shù)據(jù)源提高 AI 準(zhǔn)確度,減少幻覺

人工智能
谷歌公司基于谷歌數(shù)據(jù)共享(Data Commons)中的真實世界統(tǒng)計數(shù)據(jù),推出了開放權(quán)重 Gemma 模型的新版本 DataGemma。

9 月 13 日消息,科技媒體 maginative 昨日(9 月 12 日)發(fā)布博文,報道谷歌公司基于谷歌數(shù)據(jù)共享(Data Commons)中的真實世界統(tǒng)計數(shù)據(jù),推出了開放權(quán)重 Gemma 模型的新版本  DataGemma。

語言模型當(dāng)前面臨的一大難題就是幻覺(Hallucinations),尤其是大語言模型(LLMs)在處理數(shù)值或統(tǒng)計數(shù)據(jù)時,這一問題變得尤為棘手,因此精確性至關(guān)重要。

谷歌的 Data Commons 是一個存儲庫,匯集了來自聯(lián)合國和疾病控制與預(yù)防中心等可信組織收集的超過 2400 億個數(shù)據(jù)點(diǎn)。

通過利用這一龐大的統(tǒng)計數(shù)據(jù)集,基于 Gemini 的 DataGemma 能夠顯著提升模型準(zhǔn)確性,確保其輸出基于真實可信的現(xiàn)實世界信息。

DataGemma 方法的核心在于兩種關(guān)鍵技術(shù):檢索交錯生成(RIG)和檢索增強(qiáng)生成(RAG)。這兩種方法通過在生成過程中將模型基于現(xiàn)實世界數(shù)據(jù),從而減少幻覺現(xiàn)象。

IT之家簡要介紹兩項技術(shù)如下:

RIG:

通過主動查詢可信來源,再生成回答的方式運(yùn)作。在接收到提示詞之后,DataGemma 會識別查詢中的統(tǒng)計數(shù)據(jù)點(diǎn),并從數(shù)據(jù)共享平臺獲取準(zhǔn)確信息。

例如,若被問及“全球可再生能源的使用量是否有所增加?”,該模型會在回答中穿插實時統(tǒng)計數(shù)據(jù),確保事實準(zhǔn)確性。

RAG:

在生成回答之前,會從數(shù)據(jù)共享平臺檢索相關(guān)信息,進(jìn)一步提升了回答的質(zhì)量。借助其長上下文窗口(由 Gemini 1.5 Pro 實現(xiàn)),DataGemma 確保了回答的全面性,引入了表格和腳注以提供更深層次的上下文,從而減少了虛構(gòu)內(nèi)容的出現(xiàn)。

谷歌對 RIG 和 RAG 的研究尚處于初期階段,但初步成果令人鼓舞。通過將現(xiàn)實世界數(shù)據(jù)嵌入回復(fù)中,DataGemma 模型在處理數(shù)值事實和統(tǒng)計查詢方面展現(xiàn)出顯著提升。研究團(tuán)隊已發(fā)表論文詳述其方法,強(qiáng)調(diào)這些技術(shù)如何幫助 LLMs 判斷何時依賴外部數(shù)據(jù)與內(nèi)部參數(shù)。

責(zé)任編輯:龐桂玉 來源: IT之家
相關(guān)推薦

2024-10-05 16:00:00

谷歌開源模型

2022-01-24 15:07:59

量子

2025-03-31 10:00:00

AI模型預(yù)測

2020-06-10 11:39:52

阿里云計費(fèi)平臺

2020-12-23 16:14:04

AI 數(shù)據(jù)人工智能

2024-08-05 09:14:14

2024-12-05 15:19:59

2024-01-09 14:05:15

大型語言模型RAG向量數(shù)據(jù)庫

2018-07-01 15:30:16

2023-12-19 13:28:06

2023-05-26 16:30:20

人工智能邊緣計算

2023-06-27 09:48:40

谷歌AML AI 工具

2019-02-14 15:06:50

AI人工智能臨床診斷

2010-12-27 09:59:11

ODBC數(shù)據(jù)源

2009-06-15 13:24:46

JBoss數(shù)據(jù)源

2022-01-11 10:30:22

惡意軟件樹莓派檢測系統(tǒng)

2023-04-20 09:54:36

數(shù)據(jù)管理大數(shù)據(jù)

2017-11-10 12:34:38

大數(shù)據(jù)數(shù)據(jù)源免費(fèi)數(shù)據(jù)

2024-09-06 13:18:58

2023-02-07 10:15:29

ChatGPTAI模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號