自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="h6nan"></sub>

<cite id="h6nan"><track id="h6nan"></track></cite>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

用開源框架Chipper解鎖本地AI：無需云或API密鑰即可構(gòu)建RAG應(yīng)用原創(chuàng)

51CTO內(nèi)容精選

發(fā)布于 2025-3-5 08:54

瀏覽

0收藏

檢索增強(qiáng)生成（RAG）將檢索技術(shù)與生成模型相結(jié)合，徹底顛覆了我們與AI模型的交互方式。但從具體實(shí)現(xiàn)來看，我們該如何在本地構(gòu)建RAG應(yīng)用，同時(shí)擺脫對API密鑰或者云設(shè)施的依賴？

這里要請出今天的主角：開源框架Chipper。無需單獨(dú)處理文檔分塊、向量數(shù)據(jù)庫、大模型集成和UI設(shè)置，Chipper將幫助用戶在幾分鐘內(nèi)在本地機(jī)器上建立起獨(dú)立的RAG系統(tǒng)。

下面我們將具體介紹：

RAG架構(gòu)的工作原理
如何使用Chipper構(gòu)建本地RAG應(yīng)用程序
對Chipper進(jìn)行自定義/優(yōu)化以獲取更佳性能
真實(shí)用例：建立法律文檔分析器

通過Chipper理解RAG

讓我們首先對檢索增強(qiáng)生成（RAG）管道進(jìn)行分析，再探討Chipper如何簡化這一切：

文檔提取與分塊

Chipper會自動將文檔拆分成有意義的塊（以句子或段落為單位），以便更好進(jìn)行檢索；
用戶可針對不同用例對塊大小進(jìn)行定制。

嵌入與向量化

使用預(yù)先訓(xùn)練的模型將各文檔塊轉(zhuǎn)換為向量嵌入；
Chipper使用Facebook AI相似性搜索（FAISS）有效存儲并索引這些嵌入。

檢索機(jī)制

當(dāng)用戶查詢時(shí)，Chipper會在FAISS中搜索類似的文檔塊；
將相關(guān)度最高的部分發(fā)送至大模型以生成響應(yīng)。

大模型集成與查詢處理

Chipper充當(dāng)Ollama代理，將檢索到的文檔內(nèi)容作為上下文發(fā)送至大模型。

步驟一：安裝并配置Ollama（大模型運(yùn)行時(shí)）

由于Chipper需要配合本地大模型才能運(yùn)行，因此這里使用輕量級大模型運(yùn)行時(shí)Ollama。

1. 安裝Ollama

macOS平臺(通過Homebrew)

brew install ollama

Linux平臺

curl -fsSL https://ollama.ai/install.sh | sh

Windows平臺

從Ollama官方網(wǎng)站處??下載?并安裝。

2. 檢查Ollama是否正確安裝

檢查Ollama是否正確安裝：

ollama --version

若Ollama未運(yùn)行，請手動啟動：

ollama serve

用開源框架Chipper解鎖本地AI：無需云或API密鑰即可構(gòu)建RAG應(yīng)用-AI.x社區(qū)

3. 下載Phi-4模型（或其他模型）

Chipper可通過Ollama使用本地大模型。若未找到模型，它會自動下載Phi-4。

要手動拉取 Phi-4, 運(yùn)行以下命令：

ollama pull phi4

用開源框架Chipper解鎖本地AI：無需云或API密鑰即可構(gòu)建RAG應(yīng)用-AI.x社區(qū)

或者，你也可使用Mistral 7B（更強(qiáng)大的模型）：

ollama pull mistral

用開源框架Chipper解鎖本地AI：無需云或API密鑰即可構(gòu)建RAG應(yīng)用-AI.x社區(qū)

4. 配置Ollama以使用特定模型

若你希望手動設(shè)置Chipper要使用的模型，請編輯：

nano services/api/.env

找到此行并將其修改為你要使用的模型：

OLLAMA_MODEL=phi4

保存并退出（Ctrl+X、Y、回車）。

步驟二：安裝Chipper

1. 克隆Chipper repo

git clone git@github.com:TilmanGriesel/chipper.git
cd chipper

2. 使用Docker啟動Chipper

Docker容器中打包有Chipper，從而大大簡化設(shè)置過程。

運(yùn)行以下命令即可啟動Chipper：

./run.sh up

用開源框架Chipper解鎖本地AI：無需云或API密鑰即可構(gòu)建RAG應(yīng)用-AI.x社區(qū)

此命令將：

下載并構(gòu)建所有必需服務(wù)；
啟動Chipper的處理服務(wù)；
連接至本地大模型（通過Ollama）。

要停止Chipper：

./run.sh down

注意：此步驟可能需要一些時(shí)間，Docker會下載所有必需依賴項(xiàng)。

步驟三：文檔索引與查詢

1. 在Chipper中加載文檔

Chipper允許用戶添加文檔以供檢索。

mkdir my_docs
mv research_paper.pdf my_docs/

現(xiàn)在進(jìn)行索引：

chipper ingest my_docs/

此命令將：

對文檔分塊；
生成向量嵌入；
將其存儲在FAISS或CHromaDB中。

2. 運(yùn)行查詢

索引完成之后，你可以查詢文檔：

./run.sh cli
Shell
YOU: "What are the key takeaways from the research paper?"

Chipper會檢索相關(guān)度最高的文檔塊，并將其發(fā)送至本地大模型（通過Ollama）以生成響應(yīng)。

步驟四：將Chipper作為本地AI助手運(yùn)行

1. 在網(wǎng)絡(luò)瀏覽器中啟動Chipper

在Chipper開始運(yùn)行后，你可以通過網(wǎng)絡(luò)瀏覽器與之交互。請按以下步驟操作：

（1）打開終端以確保Chipper正在運(yùn)行：

./run.sh up

若Chipper已經(jīng)在運(yùn)行，你應(yīng)該看到相應(yīng)的活動狀態(tài)日志。

（2）打開瀏覽器并導(dǎo)航至：

???http://localhost:21200???

這將啟動Chipper UI，你可在其中與RAG應(yīng)用程序進(jìn)行交互。

用開源框架Chipper解鎖本地AI：無需云或API密鑰即可構(gòu)建RAG應(yīng)用-AI.x社區(qū)

（3）在此Web UI中，輸入提示詞并開始查詢索引文檔，或者測試其他AI功能。

用開源框架Chipper解鎖本地AI：無需云或API密鑰即可構(gòu)建RAG應(yīng)用-AI.x社區(qū)

2. 在命令行中運(yùn)行Chipper

要在終端中啟動交互式聊天會話，使用以下命令：

./run.sh cli

示例：

用開源框架Chipper解鎖本地AI：無需云或API密鑰即可構(gòu)建RAG應(yīng)用-AI.x社區(qū)

總結(jié)

到這里，我們已經(jīng)設(shè)置了Chipper與Ollama，構(gòu)建了一個(gè)由RAG驅(qū)動的本地AI助手，并嘗試通過命令行和瀏覽器與之交互。而且整個(gè)過程完全在私有機(jī)器上運(yùn)行，不依賴云端設(shè)施。這將有效保障隱私、速度、成本效益，讓你對AI工作流程擁有全面控制。

無需API密鑰，完全離線運(yùn)行。
支持模型自定義，可使用Phi-4、Mistral或Llama 3。
支持網(wǎng)頁抓取與音頻轉(zhuǎn)錄。
針對研究、法律及企業(yè)用例中的RAG應(yīng)用程序進(jìn)行了優(yōu)化。

其他用途

以此為基礎(chǔ)，大家還可以探索更多其他用途：

嘗試調(diào)整文檔分塊與向量數(shù)據(jù)庫配置。
建立本地自定義AI助手！
嘗試不同模型（ollama pull mistral 或 ollama pull llama3）并觀察響應(yīng)結(jié)果有何變化。
嘗試索引更復(fù)雜的文檔集，并微調(diào)檢索過程。
深入了解Chipper的API集成，并探索如何將其嵌入現(xiàn)有應(yīng)用程序。
閱讀??官方指南??以了解更多信息。

原文標(biāo)題：??Unlocking Local AI: Build RAG Apps Without Cloud or API Keys??，作者：Santhosh Vijayabaskar

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

檢索增強(qiáng)生成

贊

收藏

回復(fù)

舉報(bào)

社區(qū)頭條

回復(fù)

相關(guān)推薦

融匯11款AI工具構(gòu)建完美應(yīng)用

51CTO內(nèi)容精選 ? 2569瀏覽 ? 0回復(fù)
融匯14個(gè)AI工具構(gòu)建完美應(yīng)用

51CTO內(nèi)容精選 ? 3327瀏覽 ? 0回復(fù)
低成本LLM應(yīng)用開發(fā)利器——開源FrugalGPT框架

51CTO內(nèi)容精選 ? 3058瀏覽 ? 0回復(fù)
使用本地部署的Hermes 2 Pro 構(gòu)建開放的LLM應(yīng)用程序

51CTO內(nèi)容精選 ? 2260瀏覽 ? 0回復(fù)
企業(yè)或個(gè)人構(gòu)建人工智能上層應(yīng)用的幾種方式，以及每種方式的優(yōu)劣

AI探索時(shí)代 ? 2176瀏覽 ? 0回復(fù)
基于開源AI數(shù)據(jù)框架LlamaIndex構(gòu)建上下文增強(qiáng)型LLA應(yīng)用

51CTO內(nèi)容精選 ? 3371瀏覽 ? 0回復(fù)
怎么在大模型之上構(gòu)建應(yīng)用？構(gòu)建人工智能上層應(yīng)用的框架——langchain

AI探索時(shí)代 ? 2631瀏覽 ? 0回復(fù)
AgentRE：用智能體框架提升知識圖譜構(gòu)建效果，重點(diǎn)是開源！

大語言模型論文跟蹤 ? 4064瀏覽 ? 0回復(fù)
RAG 或 Fine Tume - 為您的用例選擇正確方法的權(quán)威指南

sulu637 ? 1849瀏覽 ? 0回復(fù)
一個(gè)開源、清晰的本地 Graph RAG UI，支持Graph RAG 和 Hybrid RAG（支持Ollama）

AI博物院 ? 5170瀏覽 ? 0回復(fù)
用有限的預(yù)算構(gòu)建AI應(yīng)用程序

51CTO內(nèi)容精選 ? 1753瀏覽 ? 0回復(fù)
本地構(gòu)建Llama 3.2-Vision多模態(tài)LLM聊天應(yīng)用實(shí)戰(zhàn)

51CTO內(nèi)容精選 ? 2156瀏覽 ? 0回復(fù)
解鎖AI潛力：AI在銷售領(lǐng)域的應(yīng)用案例(非Chatbot)

Baihai_IDP ? 2393瀏覽 ? 0回復(fù)
RAG 或 Fine Tume - 為您的用例選擇正確方法的權(quán)威指南

sulu637 ? 1864瀏覽 ? 0回復(fù)
構(gòu)建一個(gè)完全本地的語音激活的實(shí)用RAG系統(tǒng)

51CTO內(nèi)容精選 ? 1444瀏覽 ? 0回復(fù)
DeepSeek 協(xié)程異步API 調(diào)用與llamafactory本地vllm部署推理

AI悠閑區(qū) ? 1028瀏覽 ? 0回復(fù)
構(gòu)建大模型 Agent 應(yīng)用六個(gè)框架對比剖析

玄姐聊AGI ? 1505瀏覽 ? 0回復(fù)
用Agentic RAG構(gòu)建智能AI代理，效率與隱私雙提升！

Halo咯咯 ? 1112瀏覽 ? 0回復(fù)
用本地文件調(diào)教 DeepSeek

機(jī)器學(xué)習(xí)與數(shù)學(xué) ? 826瀏覽 ? 0回復(fù)

51CTO內(nèi)容精選

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

OpenUI：從構(gòu)思到UI僅需數(shù)秒 16h前發(fā)布
MCP安全噩夢終結(jié)者：Agent框架如何重構(gòu)AI防護(hù)新范式？? 1天前發(fā)布

熱門推薦

模型上下文協(xié)議（MCP）開發(fā)實(shí)戰(zhàn)——構(gòu)建LangChain代理客戶端 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：如何使用模型上下文協(xié)議構(gòu)建自定義工具

下一篇：基于BLIP-2和Gemini開發(fā)多模態(tài)搜索引擎代理

社區(qū)精華內(nèi)容

目錄

<style id="3cq1g"></style><blockquote id="3cq1g"><i id="3cq1g"></i></blockquote>