DeepSeek搭建個人知識庫教程,你學(xué)會了嗎?
各位朋友,是不是經(jīng)常被 AI 氣得火冒三丈,恨不得把鍵盤給砸了?你讓它查公司去年的財務(wù)數(shù)據(jù),它卻開始背誦經(jīng)濟學(xué)原理;你讓它分析競品的策略,它卻大談特談馬斯洛需求理論。我太能理解這種感受了,這就好比你花錢雇了個助理,結(jié)果這助理啥都不會,只會照搬百度百科的內(nèi)容!
不過,今天我要給大家分享一個超實用的技巧:利用 DeepSeek 創(chuàng)建專屬的 AI 知識庫!我自己已經(jīng)開始使用這個方法了,效果簡直出乎意料地好。它不僅讓 AI 變得超可靠,還從根本上消除了商業(yè)機密泄露的風(fēng)險。
其實,在 AI 出現(xiàn)之前,私有知識庫就已經(jīng)在很多場景中發(fā)揮了巨大作用,比如企業(yè)內(nèi)部知識管理、個人知識儲備等。而當(dāng)它與出色的 DeepSeek 相結(jié)合后,知識檢索和歸納的效率簡直提升到了一個新的高度。
小白快速搭建個人 AI 知識庫
個人 AI 知識庫的方案多種多樣,今天我來介紹一種既簡單又高效的方法,特別適合新手。這種方法結(jié)合了 AnythingLLM 和 DeepSeek R1,不僅操作簡單,而且知識檢索效果出色。
工具簡介
- AnythingLLM:這是一個知識庫管理的前端工具,提供從上傳知識、向量化數(shù)據(jù)到檢索增強生成(RAG)的全流程服務(wù)。它完全開源且免費,非常適合個人用戶。
- DeepSeek R1:這是幻方量化推出的大模型,性能與 Claude 3.5 相當(dāng),但 Token 成本極低。在本次方案中,我們將使用 DeepSeek R1 作為推理模型。
注意事項
- 模型選擇:雖然我們推薦使用 DeepSeek R1,但 AnythingLLM 也支持其他推理模型,如 GPT、Claude,或者通過 Ollama 運行本地開源模型等。你可以根據(jù)自己的需求選擇合適的模型。
通過這種組合,你可以輕松搭建一個高效、低成本的個人 AI 知識庫,無論是學(xué)習(xí)、工作還是研究,都能大大提高你的效率。希望這個方案對你有所幫助!
安裝 AnythingLLM
下載 AnythingLLM
地址:https://anythingllm.com/
AnythingLLM 是一個開源且免費的工具,采用 MIT 許可證,支持文本和多模態(tài)大語言模型(LLM)在同一界面中使用。它能夠輕松處理圖像和音頻。
該工具也適合用作強大的 API,便于任何自定義開發(fā)或現(xiàn)有產(chǎn)品的功能擴展。AnythingLLM 擁有不斷增長的插件和集成生態(tài)系統(tǒng),可以增強其在應(yīng)用和組織中的功能。
設(shè)計上,AnythingLLM 默認是私密的,所有數(shù)據(jù)都存儲并在運行該工具的本地機器上處理。用戶可以輕松下載并運行 LLM,無需額外的設(shè)置或程序。
AnythingLLM Desktop 并不是 SaaS 服務(wù),用戶無需注冊即可在本地使用完整的工具套件。
此外,AnythingLLM 可以根據(jù)公司的品牌進行白標定制,并支持多個用戶在同一服務(wù)器上使用,確保用戶之間的完全隔離。管理員可以細致控制用戶的權(quán)限和可見內(nèi)容。
支持系統(tǒng):Windows、Mac、Linux
圖片
圖片
圖片
配置 AI 大腦(如何使用 DeepSeekAPI 或者本地搭建 DeepSeek)
設(shè)置你的 AI 助手:DeepSeek
打開軟件后,首先需要配置 LLM(大型語言模型)。這里推薦選擇 DeepSeek 作為你的模型,具體選擇“chat”選項,這是目前最新的模型版本。為了使用 DeepSeek 的服務(wù),你需要一個 API Key。你可以通過訪問 DeepSeek 的官網(wǎng)
https://platform.deepseek.com
注冊賬號并獲取 API Key。注冊過程簡單,充值少量費用(幾塊錢)即可開始使用,非常經(jīng)濟實惠。
圖片
您可能會遇到這樣的提示:“目前我們正在進行網(wǎng)站的維護與升級工作,網(wǎng)站暫時無法正常使用。我們正在全力推進相關(guān)工作,爭取盡快恢復(fù)服務(wù)。感謝您在此期間的理解與耐心等待?!?/span>
如果官網(wǎng)的 API 暫時無法使用,您可以考慮使用本地部署版本的 DeepSeek。關(guān)于如何進行本地部署,可以參考文檔,
本地部署 DeepSeek:打造你的專屬 AI 推理環(huán)境,簡單明了適合新手
進入工作區(qū)
可以在左下角設(shè)置按鈕中進行基礎(chǔ)配置,如:LLM、嵌入模型、向量數(shù)據(jù)庫選擇等,新手可以先保持默認設(shè)置。
(這里單獨提下 Embedding 模型,Embedding 是將高緯度數(shù)據(jù)嵌入低緯度空間方便存儲,模型性能影響對后續(xù)知識
檢索有挺大影響,建議可以換成 bge-m3,這個模型對多語言和長文本都支持的不錯,需要本地運行 0llama 加載這
個模,由于需要安裝 0llama,新手可以跳過這一步)
圖片
上傳文檔
- 點擊工作空間的上傳按鈕,
圖片
- 支持上傳 PDF、CSV、音頻或者抓取網(wǎng)頁內(nèi)容等等。上傳后右鍵加入工作空間就 ok 了。
圖片
一定要點擊 save 按鈕,不然不會生效。
圖片
- 可以在 Data Connnector 中獲取 youtube(需要有 cc 字幕)視頻、confluence 文檔庫等內(nèi)容平臺的數(shù)據(jù)。
圖片
知識檢索問答
- 工作區(qū)點擊 new thread 可以開啟新的對話,然后提問就 ok 了
圖片
- 如果想判斷 LLM 回答的知識范圍,可以在回答的底部點開:Show Citations 就能看到引用了哪些知識
AnythingLLM 是一個很強大的知識庫管理工具,新版本還提供了 Agent 模式,可以接入谷歌、bing 等搜索引擎,實現(xiàn)實時搜索增加檢索的時效性。