自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

使用 DeepSeek R1 和 Ollama 開發(fā) RAG 系統(tǒng)（包含完整代碼）

作者：dev 2025-02-03 00:00:55

DeepSeek R1 只是一個開始。憑借即將推出的自我驗證和多跳推理等功能，未來的 RAG 系統(tǒng)可以自主辯論和完善其邏輯。

是否想過直接向PDF文檔或技術手冊提問？本文將演示如何通過開源推理工具DeepSeek R1與本地AI模型框架Ollama搭建檢索增強生成（RAG）系統(tǒng)。

高效工具推薦：用Apidog簡化API測試流程

圖片

Apidog作為一體化API解決方案，可實現(xiàn)：

零腳本自動化核心流程
無縫對接CI/CD管道
精準定位性能瓶頸
可視化接口管理

https://apidog.com

DeepSeek R1核心優(yōu)勢

相比OpenAI o1模型成本降低95%，具備：

精準檢索：每次僅調用3個文檔片段
嚴謹輸出：未知問題主動返回"暫不了解"
本地運行：徹底消除云端API延遲

環(huán)境準備

1. Ollama本地部署

# 安裝基礎框架
ollama run deepseek-r1  # 默認使用7B模型

Ollama官網(wǎng)下載：https://ollama.ai

圖片

2. 模型選擇策略

# 輕量級場景推薦1.5B版本
ollama run deepseek-r1:1.5b

硬件建議：70B大模型需32GB內存支持

RAG系統(tǒng)構建全流程

Step 1: 導入依賴庫

用于文檔處理和檢索的 LangChain。
流利使用用戶友好的Web界面。

import streamlit as st  
from langchain_community.document_loaders import PDFPlumberLoader  
from langchain_experimental.text_splitter import SemanticChunker  
from langchain_community.embeddings import HuggingFaceEmbeddings  
from langchain_community.vectorstores import FAISS  
from langchain_community.llms import Ollama

圖片

Step 2: PDF文件上傳與解析

利用 Streamlit 的文件上傳器選擇本地 PDF。使用 PDFPlumberLoader 高效提取文本，無需手動解析。

# 創(chuàng)建Streamlit文件上傳組件
uploaded_file = st.file_uploader("上傳PDF文件", type="pdf")

if uploaded_file:
    # 臨時存儲PDF文件
    with open("temp.pdf", "wb") as f:
        f.write(uploaded_file.getvalue())
    
    # 加載PDF內容
    loader = PDFPlumberLoader("temp.pdf")
    docs = loader.load()

Step 3: 文檔語義分塊

利用 Streamlit 的文件上傳器選擇本地 PDF。使用 PDFPlumberLoader 高效提取文本，無需手動解析。

# 初始化語義分塊器
text_splitter = SemanticChunker(
    HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")
)

# 執(zhí)行分塊操作
documents = text_splitter.split_documents(docs)

圖片

Step 4: 構建向量數(shù)據(jù)庫

# 生成文本嵌入
embeddings = HuggingFaceEmbeddings()
vector_store = FAISS.from_documents(documents, embeddings)

# 配置檢索器
retriever = vector_store.as_retriever(search_kwargs={"k": 3})

Step 5: 配置DeepSeek R1模型

# 初始化本地模型
llm = Ollama(model="deepseek-r1:1.5b")

# 定義提示模板
prompt_template = """
根據(jù)以下上下文：
{context}

問題：{question}

回答要求：
1. 僅使用給定上下文
2. 不確定時回答"暫不了解"
3. 答案控制在四句話內

最終答案：
"""
QA_PROMPT = PromptTemplate.from_template(prompt_template)

Step 6: 組裝RAG處理鏈

# 創(chuàng)建LLM處理鏈
llm_chain = LLMChain(llm=llm, prompt=QA_PROMPT)

# 配置文檔組合模板
document_prompt = PromptTemplate(
    template="上下文內容:\n{page_content}\n來源:{source}",
    input_variables=["page_content", "source"]
)

# 構建完整RAG管道
qa = RetrievalQA(
    combine_documents_chain=StuffDocumentsChain(
        llm_chain=llm_chain,
        document_prompt=document_prompt
    ),
    retriever=retriever
)

Step 7: 啟動交互界面

# 創(chuàng)建問題輸入框
user_question = st.text_input("輸入您的問題：")

if user_question:
    with st.spinner("正在生成答案..."):
        # 執(zhí)行查詢并顯示結果
        response = qa(user_question)["result"]
        st.success(response)

完整的代碼：https://gist.github.com/lisakim0/0204d7504d17cefceaf2d37261c1b7d5.js

技術實現(xiàn)要點

語義分塊優(yōu)化：采用SemanticChunker替代傳統(tǒng)滑動窗口，提升上下文連貫性

# 示例：調整分塊策略
text_splitter = SemanticChunker(
    embeddings, 
    breakpoint_threshold=0.85  # 調整語義分割閾值
)

檢索優(yōu)化配置：動態(tài)調整檢索數(shù)量

# 根據(jù)問題復雜度動態(tài)調整k值
def dynamic_retriever(question):
    complexity = len(question.split())
    return vector_store.as_retriever(search_kwargs={"k": min(complexity, 5)})

混合檢索策略：結合關鍵詞與向量搜索

from langchain.retrievers import BM25Retriever, EnsembleRetriever

bm25_retriever = BM25Retriever.from_documents(documents)
ensemble_retriever = EnsembleRetriever(
    retrievers=[bm25_retriever, vector_retriever],
    weights=[0.4, 0.6]
)

最后

DeepSeek R1 只是一個開始。憑借即將推出的自我驗證和多跳推理等功能，未來的 RAG 系統(tǒng)可以自主辯論和完善其邏輯。

責任編輯：武曉燕來源：大遷世界

DeepSeek RAG 系統(tǒng)

相似話題

自然語言處理

同話題下的熱門內容

DeepSeek R2提前泄露？周二或周三發(fā)布？海外謠言一夜刷屏，HggingFace CEO一帖子引瘋狂猜想，DS又被消費了深夜突襲，阿里Qwen3登頂全球開源王座！暴擊DeepSeek-R1，2小時狂攬17k星 MCP 服務器很危險！這里有安全使用指南！剛剛，Qwen3強勢登頂，成開源新王！國內首個混合推理模型，235B擊敗R1、o1!源神火力全開：全系列8個模型一口氣開源！Kimi-Audio開源橫掃全場景，1300萬+小時數(shù)據(jù)煉成語音世界“大一統(tǒng)”看不懂GitHub代碼？剛剛這個AI工具讓全球每個GitHub項目開口說話一文詳解深度學習中的標量、向量、矩陣、張量 7B超越GPT！1/20數(shù)據(jù)，無需知識蒸餾，馬里蘭等推出全新視覺推理方法

相關專題更多

解讀惠普Z系列工作站ZBook Ultra G1a高性能移動

HPE ProLiant DL145 Gen11 服務器解讀

2025-04-21 09:59:50

開發(fā)者成長學院 | 成長有徑 · 代碼有方

2025-04-23 08:49:09

我收藏的內容

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

^{<sub id="kaiwi"></sub>}

<legend id="kaiwi"><track id="kaiwi"><dfn id="kaiwi"></dfn></track></legend>