自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

基于MiniO存儲的RAGFlow+Dify圖片處理方案

人工智能
鑒于 RAGFlow 的 Docker 部署本就包含了一個 MinIO 實(shí)例,原本主要用于存儲知識庫的原始文件、塊數(shù)據(jù)等,利用這個現(xiàn)有的 MinIO 服務(wù)來存儲提取的圖片和映射關(guān)系是一個很好的本地化部署方案,也可以在上一版方案基礎(chǔ)上,移除對外部云服務(wù)(阿里云 OSS)和獨(dú)立圖片服務(wù)器的依賴。

上篇文章中介紹了如何基于 RAGFlow 知識庫,通過 Dify 的 HTTP 請求獲取映射 + Code 節(jié)點(diǎn)替換,將占位符解析為最終的 <img> 標(biāo)簽,來穩(wěn)定的實(shí)現(xiàn)問答中圖片正常顯示問題。

圖片

Dify+RAGFLow:基于占位符的圖片問答升級方案(最佳實(shí)踐)

其中的"占位符"和"實(shí)際圖片訪問 URL"映射關(guān)系的存儲使用了阿里云的 OSS 存儲服務(wù)。初期選擇阿里云 OSS 作為存儲,主要是方便大家快速驗(yàn)證和迭代 RAG 應(yīng)用的核心邏輯,避免過早陷入基礎(chǔ)設(shè)施的維護(hù)細(xì)節(jié)。

有知識星球的星友提出希望能提供本地部署的存儲方案,市面上有挺多優(yōu)秀的開源對象存儲框架可供選擇,Ceph、OpenStack Swift 功能全面但架構(gòu)復(fù)雜高,出于規(guī)??煽睾瓦\(yùn)維簡單的考慮,MinIO 和 SeaweedFS 都是不錯的選擇。

鑒于 RAGFlow 的 Docker 部署本就包含了一個 MinIO 實(shí)例,原本主要用于存儲知識庫的原始文件、塊數(shù)據(jù)等,利用這個現(xiàn)有的 MinIO 服務(wù)來存儲提取的圖片和映射關(guān)系是一個很好的本地化部署方案,也可以在上一版方案基礎(chǔ)上,移除對外部云服務(wù)(阿里云 OSS)和獨(dú)立圖片服務(wù)器的依賴。

圖片

以下,enjoy:

1、“語義幻覺” vs “格式遵循”

在正式進(jìn)入 MinIO 的存儲方案調(diào)整前,我們再來回顧下,在富文本中直接嵌入完整 URL 可能導(dǎo)致 LLM“幻覺”并修改圖片鏈接的考量所在。

1.1直接嵌入 URL

當(dāng) LLM 在其上下文中看到一個完整的、看似有意義的 URL 時,例如<img src="..."> 或 http://.../filename.png,特別是像<img>標(biāo)簽這樣結(jié)構(gòu)化的 HTML,它有一定概率(不同 LLM 實(shí)測篡改 URL 的概率不太一致)會嘗試去“理解”這個 URL 指向的內(nèi)容,并結(jié)合周圍的文本進(jìn)行推理。

例如如果文本描述了“燃油噴射器泄漏”,而 URL 的文件名是 page1_img1_uuid.png,LLM 可能會認(rèn)為存在不匹配,并“好心”地嘗試生成一個它認(rèn)為更符合語義的 URL,例如 .../fuel_injector_leak.png。這樣導(dǎo)致了很多盆友說為什么知識庫中能渲染圖片,但是回答中卻無法顯示的問題。

其實(shí)這也很好理解,本質(zhì)上這是源于 LLM 被訓(xùn)練來生成連貫、相關(guān)的文本,有時會過度泛化到它不應(yīng)修改的結(jié)構(gòu)化數(shù)據(jù)上。

1.2占位符方案的意義

[IMG::page1_img1_uuid.png]這種格式對 LLM 來說,更像是一個需要特殊處理的“元數(shù)據(jù)標(biāo)記”或“代碼片段”,而不是一段可供自由發(fā)揮的自然語言或標(biāo)準(zhǔn) HTML。通過 Prompt 工程明確指示 LLM 將這些標(biāo)記視為特殊占位符,并在需要引用時原樣復(fù)制,實(shí)測確實(shí)可以大大降低它進(jìn)行“創(chuàng)造性修改”的動機(jī)。LLM 更傾向于遵循這種明確的格式指令,而不是去猜測 page1_img1_uuid.png 的語義含義并嘗試“改進(jìn)”它。

總結(jié)來說,使用占位符的方案,是把潛在的圖片鏈接錯誤問題,從一個不可控的 LLM“語義理解導(dǎo)致的幻覺修改”問題,轉(zhuǎn)變?yōu)橐粋€相對更容易通過 Prompt 工程來約束的“格式遵循”問題。要求 LLM 精確復(fù)制一個特殊格式的字符串,通常比要求它不對一個看起來像自然語言一部分的 URL 進(jìn)行語義修改要更容易實(shí)現(xiàn)和控制。

2、RAGFlow 的 MinIO 訪問結(jié)構(gòu)

2.1內(nèi)部訪問

RAGFlow 的其他服務(wù)(如 API 服務(wù)、Worker)在 Docker 網(wǎng)絡(luò)內(nèi)部通常通過服務(wù)名(例如 minio)和默認(rèn)端口(9000 for API, 9001 for Console)訪問 MinIO。

2.2外部訪問

首先需要明確的是,RAGFlow的MinIO 服務(wù)是否映射到了宿主機(jī)。在 docker-compose.yml 的開頭第一行可以看到 include: - ./docker-compose-base.yml 這行,它表示 docker-compose.yaml 文件本身并不包含所有服務(wù)的完整定義,而是包含了同目錄下另一個名為 docker-compose-base.yml 文件的內(nèi)容。

圖片

像 MinIO、MySQL 這些基礎(chǔ)服務(wù)的具體配置實(shí)際是定義在 docker-compose-base.yml 文件中。

圖片

我們打開 docker-compose.yaml 同級文件夾下的 docker-compose-base.yml,來看下 minio 服務(wù)的具體定義內(nèi)容。

為了方便大家看的更直觀些,我在關(guān)鍵的位置添加了注釋如下:

minio:
    image: quay.io/minio/minio:RELEASE.2023-12-20T01-00-02Z
    container_name: ragflow-minio
    command: server --console-address ":9001" /data
    ports:                             # <--- 關(guān)鍵部分在這里
      - ${MINIO_PORT}:9000           # <--- API 端口映射
      - ${MINIO_CONSOLE_PORT}:9001    # <--- Console 端口映射
    env_file: .env                     # <--- 環(huán)境變量從 .env 文件加載
    environment:
      - MINIO_ROOT_USER=${MINIO_USER}  # <--- MinIO 用戶名 (來自 .env)
      - MINIO_ROOT_PASSWORD=${MINIO_PASSWORD} # <--- MinIO 密碼 (來自 .env)
      - TZ=${TIMEZONE}
    volumes:
      - minio_data:/data
    networks:
      - ragflow
    restart: on-failure

1、端口已映射: minio 服務(wù)明確定義了 ports: 部分,將容器內(nèi)部的 API 端口 9000 和 Console 端口 9001 映射到了宿主機(jī)。 

2、端口號是變量: 映射到宿主機(jī)的具體端口號不是固定的 9000 和 9001,而是由環(huán)境變量 ${MINIO_PORT} 和 ${MINIO_CONSOLE_PORT} 決定的。 

3、環(huán)境變量來源: 這些環(huán)境變量(MINIO_PORT, MINIO_CONSOLE_PORT, 以及 MINIO_USER, MINIO_PASSWORD)的值是從項(xiàng)目根目錄下的 .env 文件中讀取的 (env_file: .env)。

2.3訪問憑證獲取

我們需要找到 env 中的 minio 訪問憑證,以便接下里修改 process_pdf.py 腳本能夠連接和上傳文件。打開與 docker-compose.yaml 和 docker-compose-base.yml 文件位于同一目錄下的 .env 文件后可以發(fā)現(xiàn),MinIO 配置信息如下: 

圖片

MinIO API 宿主機(jī)端口: 9000 

MinIO Console 宿主機(jī)端口: 9001 

MinIO 用戶名 (Access Key ID): rag_flow 

MinIO 密碼 (Secret Access Key): infini_rag_flow

2.4訪問測試

通過瀏覽器訪問 http://<你的宿主機(jī) IP>:9001 來打開 MinIO 的 Web 管理界面 (Console)。注意需要把<你的宿主機(jī) IP>替換為你運(yùn)行 Docker 的那臺機(jī)器的實(shí)際 IP 地址。如果不清楚如何查看宿主機(jī)的 IP 地址,參考下方圖示進(jìn)行操作:

圖片

3、MinIO Bucket 配置

3.1Bucket 創(chuàng)建

登錄 MinIO Console 后(使用 .env 文件中的用戶名/密碼)創(chuàng)建 Bucket。點(diǎn)擊左側(cè) "Buckets" 、 "Create Bucket",建議使用一個明確的名稱,例如 ragflow-public-assets ,取消勾選 "Versioning" (版本控制),否則會占用更多空間。

圖片

圖片

3.2設(shè)置公共讀策略

創(chuàng)建 Bucket 后,點(diǎn)擊該 Bucket 名稱進(jìn)入詳情。選擇 "Access Policy" 將 Bucket 的訪問策略設(shè)置為 "public"。這一步很重要,確保 Dify 和最終用戶能通過 URL 讀取圖片和映射文件。

圖片

4、相關(guān)腳本優(yōu)化

修改后的源碼和Dify YAML文件在知識星球No.33期

圖片

4.1修改 process_pdf.py

主要改動包括:

替換 oss2 導(dǎo)入為 minio 導(dǎo)入,移除與 oss2 相關(guān)的初始化和配置代碼。

移除 --oss_map_prefix, --image_dir, --mount_dir 命令行參數(shù)及其相關(guān)邏輯(包括本地圖片復(fù)制)。

修改 extract_images_from_pdf 的調(diào)用簽名,傳入 MinIO 相關(guān)參數(shù)。

添加將 placeholder_map 上傳到 MinIO 的邏輯,并打印 MinIO 公開 URL。

更新腳本末尾的說明,移除關(guān)于 image-server 的指令,改為提示用戶在 Dify HTTP 節(jié)點(diǎn)中使用 MinIO 映射文件的 URL。

移除錯誤處理和最終清理中與 ./images 相關(guān)的部分。

圖片

4.2修改 PyMuPDF_test.py

修改函數(shù)簽名:

接收minio_client, bucket_name, image_prefix, minio_endpoint_for_url,移除 image_server_dir, image_server_url。 

移除本地臨時目錄:

刪除 temp_dir 和 os.makedirs(temp_dir, ...). 

圖片處理循環(huán):

獲取 png_bytes 后,不再保存到本地 temp_path。 

生成 MinIO 的 image_object_name(使用 image_prefix)。 

直接使用 minio_client.put_object 上傳 png_bytes (包裹在 io.BytesIO 中),設(shè)置 content_type='image/png'。 

構(gòu)建 MinIO 的公開 image_url(使用傳入的 minio_endpoint_for_url)。 

圖片

占位符 placeholder 使用 os.path.basename(image_object_name)。 

img_info 中記錄 object_name 和 MinIO URL,移除 temp_path。 更新錯誤處理。 

移除本地保存

刪除 with open(temp_path, "wb") 代碼塊。 

圖片

4.3修改 Dify 工作流

HTTP Request 節(jié)點(diǎn):

將其中的 URL 字段修改為指向 MinIO 上傳的 *map.json 文件的公開訪問 URL(即 process_pdf.py 腳本最后打印出的那個 URL,例如 http://<你的宿主機(jī) IP>:9000/ragflow-public-assets/mappings/your_document_map.json)。

圖片

確保請求方法是 GET。

圖片

其他如 Header、Body 等通常不需要設(shè)置。

Code 節(jié)點(diǎn):

輸入應(yīng)該連接到上述 HTTP Request 節(jié)點(diǎn)的 body 輸出。

代碼邏輯保持不變:解析傳入的 JSON 字符串(映射關(guān)系),然后在 LLM 返回的文本中查找 [IMG::...] 占位符,并使用映射中的 MinIO URL 將其替換為 <img src="..."> HTML 標(biāo)簽。

5、寫在最后

完成以上所有修改后,處理流程將完全依賴于 RAGFlow 自帶的 MinIO 實(shí)例,不再需要獨(dú)立的圖片服務(wù)器和外部 OSS 服務(wù),同時保留了占位符方案帶來的 LLM 輸出穩(wěn)定性優(yōu)勢。這種方法簡化了部署架構(gòu),實(shí)現(xiàn)了完全本地化,是更優(yōu)的方案,尤其是在項(xiàng)目成熟后。

仍需說明的是,當(dāng)前工作流設(shè)計(jì)有個無法流式輸出影響體驗(yàn)的問題,主要因?yàn)?Code 節(jié)點(diǎn)是一個批處理節(jié)點(diǎn),需要等待 LLM 的完整輸出才能進(jìn)行處理,下期展示下如何進(jìn)一步通過 Tampermonkey 用戶腳本為本地 Dify 添加前端圖片占位符替換功能。

責(zé)任編輯:龐桂玉 來源: 韋東東
相關(guān)推薦

2025-04-17 01:00:00

DifyRAGFLow

2025-04-11 09:02:47

2025-04-07 07:00:00

2018-04-23 15:14:02

混合云云存儲公有云

2018-07-13 08:45:57

Ceph對象存儲混合云

2024-10-16 09:49:18

2021-09-29 08:08:13

前端技術(shù)編程

2022-11-09 07:40:18

2010-01-05 16:58:43

圖片處理

2013-12-30 16:00:37

華為OceanStor虛擬化容災(zāi)

2012-01-11 10:55:02

ASP.NET MVC

2009-06-30 09:16:45

數(shù)據(jù)庫存儲JSP文件

2015-04-21 16:42:39

騰訊云圖片服務(wù)

2023-08-29 07:34:43

Mimir微服務(wù)

2020-10-11 21:00:31

開發(fā)存儲服務(wù)技術(shù)

2025-02-07 11:32:20

2018-03-20 10:37:33

存儲大數(shù)據(jù)管理

2025-03-11 10:51:35

DifyDeepSeek大模型

2023-08-22 08:01:42

SpringBatch事務(wù)管理

2014-08-25 15:02:18

中科院海洋所浪潮
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號