自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI知識庫的真相,你知道嗎?

人工智能
在RAG架構中,大模型主要負責歸納總結,答復質量在很大程度上取決于文本塊的檢索精度。事實上,RAG系統(tǒng)普遍存在切片粗暴、檢索不精準、缺乏整體視角等典型問題。

很多人對AI知識庫的想象是這樣的,他們以為只需將所有資料一股腦地拖進AI客戶端,比如 Cherry Studio 內。

圖片圖片

圖片

這樣,AI就會認真閱讀所有內容,并自動生成完美結論。

然而,實際體驗后,許多人發(fā)現(xiàn)AI知識庫的效果遠沒有想象中理想,經(jīng)常遇到各種奇怪的問題。

本文將從知識庫的原理出發(fā),探討AI知識庫的技術局限。同時,我會介紹一些進階方案,例如引入重排序模型、數(shù)據(jù)庫(mcp server),以及使用超大上下文模型等方法。

目前,大模型知識庫最常見的技術是RAG(檢索增強生成)。

當用戶將資料加入知識庫時,程序會先將其拆分為多個文本塊。

圖片圖片

隨后,使用嵌入模型將這些文本塊向量化。

向量化指將拆分后的文本轉化為一組超長的數(shù)字序列。

圖片圖片

以我自己的知識庫為例,這里用到的嵌入模型輸出的是1024維:

圖片圖片

也就是說,每個文本塊都被轉換成一個由1024個數(shù)值組成的向量:

圖片圖片

之后,程序會將向量及其對應文本存儲到向量數(shù)據(jù)庫中。

圖片圖片

接下來,當用戶發(fā)起提問時,問題本身也會被向量化,轉化為一個1024維向量。

圖片圖片

然后,系統(tǒng)會將用戶問題的向量與數(shù)據(jù)庫中的所有向量進行相似度計算,這一過程完全基于向量的數(shù)學運算。

圖片圖片

最終,知識庫會選出與問題最相似的幾個原文片段,將它們與用戶的問題一同發(fā)送給大模型,由大模型進行歸納總結。

圖片圖片

從這個流程可以看到,在RAG架構中,大模型主要負責歸納總結,答復質量在很大程度上取決于文本塊的檢索精度。事實上,RAG系統(tǒng)普遍存在切片粗暴、檢索不精準、缺乏整體視角等典型問題。

責任編輯:武曉燕 來源: 程序員NEO
相關推薦

2021-02-02 08:21:28

網(wǎng)絡面試通信

2024-06-27 10:51:28

生成式AI領域

2024-04-15 00:04:00

APP開發(fā)

2024-02-26 08:19:00

WebSpring容器

2024-06-07 08:26:10

2024-08-06 11:27:23

LLM鏈系統(tǒng)AI

2023-12-12 08:41:01

2017-01-18 18:28:54

大數(shù)據(jù)數(shù)據(jù)庫技術

2021-03-19 18:13:21

手機內存軟件

2021-09-13 19:28:42

JavaNetty開發(fā)

2024-03-26 00:10:08

預測AI泛化

2021-10-14 06:52:47

算法校驗碼結構

2024-09-18 07:00:00

消息隊列中間件消息隊列

2022-09-29 15:32:58

云計算計算模式

2022-03-10 08:25:27

JavaScrip變量作用域

2019-12-12 09:23:29

Hello World操作系統(tǒng)函數(shù)庫

2024-05-28 09:12:10

2024-04-07 00:00:00

ESlint命令變量

2023-12-20 08:23:53

NIO組件非阻塞

2024-04-30 09:02:48

點贊
收藏

51CTO技術棧公眾號