自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

RAG常見13種分塊策略大總結（一覽表）原創(chuàng)

大模型自然語言處理

發(fā)布于 2025-3-11 10:15

瀏覽

0收藏

分塊策略在RAG中至關重要，目的是提高效率、相關性和上下文保持。分塊能減少計算開銷，增加檢索相關信息的可能性，同時保持信息完整性。但也存在風險，如上下文丟失、冗余和不一致性。選擇策略需考慮文檔類型（結構化 vs 非結構化）、查詢復雜性、資源可用性和期望結果（速度 vs 準確性 vs 上下文）。

以下是13種獨特分塊策略的詳細描述，按策略名稱、描述、優(yōu)點、缺點和實施建議。僅供參考。

RAG常見13種分塊策略大總結（一覽表）-AI.x社區(qū)

策略名稱	描述	優(yōu)點	缺點	實施建議
固定長度分塊	將文本按預定義長度（如基于令牌或字符）分割，適合簡單文檔或快速處理。	簡單性、統(tǒng)一性、效率	上下文丟失、相關性問題、潛在信息丟失	選擇合適大小，考慮使用重疊窗口以保持上下文
基于句子的分塊	按句子邊界分割，確保每個塊是完整的思想，適合短響應如客戶查詢。	保持上下文、易于實現(xiàn)、更好的可讀性	塊大小不一致、不適合長句、控制力弱	使用NLP庫檢測句子，必要時合并短句
段落分塊	將文檔按段落分割，每個段落通常包含完整想法或主題，適合結構化文檔。	更豐富的上下文、邏輯分割	大小不一致、可能超出行牌限制	監(jiān)控塊大小，必要時分割大段落以保持上下文
文檔分塊	將整個文檔視為一個塊或最小分割，保持完整結構和上下文，適合法律或醫(yī)學文檔。	保持完整上下文、適合結構化文本、簡單	可擴展性問題、效率低、缺乏細節(jié)提取	適用于不希望分割影響流程的場景
滑動窗口分塊	通過滑動窗口創(chuàng)建重疊塊，確保相鄰塊共享內容，適合需保持跨部分上下文的文檔。	上下文連續(xù)性、提高檢索效果	冗余、計算成本高	優(yōu)化窗口大小和重疊，使用去重技術處理冗余
語義分塊	使用嵌入或機器學習模型按語義意義分割，確保每個塊主題連貫。	上下文相關性、靈活性、提高檢索準確性	復雜性、處理時間長、計算成本高、閾值調整	利用預訓練模型，平衡成本和粒度
遞歸分塊	使用層次分隔符或多個分隔符逐步分割為小塊，適合大型結構化文檔。	層次上下文、可擴展性、意義塊、細粒度控制	實現(xiàn)復雜、可能丟失上下文、復雜性高、計算開銷大	使用文檔結構標識層次，存儲塊位置元數據
上下文增強分塊	為每個塊添加周圍塊的摘要或元數據，保持序列間的上下文，適合長文檔。	增強上下文、提高連貫性	復雜性、存儲開銷大	生成簡潔摘要，考慮用關鍵術語或概念作為元數據
模式特定分塊	按內容類型（如文本、表格、圖像）分別處理，每個類型按其性質分塊。	定制方法、提高準確性	實現(xiàn)復雜、集成困難	使用OCR處理圖像，將表格轉為結構化數據，保持索引一致
代理分塊	使用AI（如大型語言模型）按內容結構和語義建議塊邊界，或按代理角色任務組織。	任務導向效率、聚焦相關數據、靈活性、智能分割	復雜設置、計算密集、成本高、可能過分專業(yè)化、丟失全局上下文	選擇性使用，優(yōu)化LLM提示，明確代理角色和任務規(guī)則
子文檔分塊	總結整個文檔或大節(jié)并將摘要作為元數據附加到單個塊，適合大型文檔集。	層次檢索、上下文深度	額外處理、元數據管理復雜	自動化摘要生成，高效存儲摘要
混合分塊	結合多種分塊策略，動態(tài)適應不同查詢類型或文檔結構，適合多用途系統(tǒng)。	靈活性、優(yōu)化性能	邏輯復雜、維護難度大	制定選擇策略的標準，廣泛測試以確?？煽啃?/p>
基于令牌的分塊	按預定義令牌數（如單詞或子詞）分割，確保塊在模型令牌限制內。	優(yōu)化語言模型、精確控制塊大小、一致性	上下文碎片化、忽略語義結構、靈活性有限	確保塊在模型令牌限制內

選擇策略時需考慮以下因素：

文檔類型：結構化（如報告）適合段落分塊，非結構化（如聊天記錄）適合語義分塊。
查詢復雜性：復雜查詢需語義或代理分塊，簡單查詢可用固定長度分塊。
資源可用性：計算資源有限時，優(yōu)先固定長度或基于句子的分塊。
期望結果：速度優(yōu)先選固定長度，準確性優(yōu)先選語義分塊，上下文優(yōu)先選滑動窗口。

公眾號大模型自然語言處理作者：余俊暉

原文鏈接：??https://mp.weixin.qq.com/s/QXI9Ppd0rBVAL86khPDq1w??

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

已于2025-3-11 10:15:50修改

贊

收藏

回復

舉報

回復

相關推薦

萬文長文搞定檢索增強生成(RAG)技術——13篇熱門RAG文章解讀

angel ? 1.1w瀏覽 ? 0回復
RAG技術性能提升之文檔分塊策略方案

AIGC觀察者 ? 4757瀏覽 ? 0回復
Unstructured專家分享RAG應用中文檔分塊（Chunking）的最佳實踐

Syrupup ? 4246瀏覽 ? 0回復
一種支持4種多模態(tài)RAG技術的引擎：VARAG

PaperAgent ? 3113瀏覽 ? 0回復
對連續(xù)概率分布的一個常見誤解

魚蟲子 ? 1890瀏覽 ? 0回復
從RAG到TAG：探索表增強生成（TAG）的力量

Halo咯咯 ? 3120瀏覽 ? 0回復
一文了解11種最常見的機器學習算法應用場景

石映飛云 ? 4703瀏覽 ? 0回復
RAG 應用效果不太理想？試試以下RAG優(yōu)化策略大幅提升問答效果

AI博物院 ? 7286瀏覽 ? 0回復
提升RAG性能的全攻略：優(yōu)化檢索增強生成系統(tǒng)的策略大揭秘

Halo咯咯 ? 5201瀏覽 ? 0回復
再談大模型長文本分塊，以及分塊在RAG中的作用？

AI探索時代 ? 2595瀏覽 ? 0回復
如何優(yōu)化大型語言模型（LLM）的分塊策略

51CTO內容精選 ? 2286瀏覽 ? 0回復
RAG范式演進及Agentic-RAG總結綜述

大模型自然語言處理 ? 2815瀏覽 ? 0回復
一文讀懂AI智能體的原理類型、功能優(yōu)勢和最常見使用場景

數字化助推器 ? 4523瀏覽 ? 0回復
別慌一文讀懂AI智能體常見的九種設計模式

數字化助推器 ? 2143瀏覽 ? 0回復
圖RAG統(tǒng)一框架來了，12種RAG方法一網打盡！

NLP前沿1 ? 1757瀏覽 ? 0回復
RAG分塊優(yōu)化之語義分塊方法CrossFormer模型技術思路

大模型自然語言處理 ? 964瀏覽 ? 0回復
RAG進階技術！這十種方法你一定要知道

Halo咯咯 ? 1197瀏覽 ? 0回復
12張圖清晰總結 MCP、RAG、Agent 架構設計間的關系

玄姐聊AGI ? 1535瀏覽 ? 0回復
基于文本結構分塊 - 文本分塊（Text Splitting），RAG不可缺失的重要環(huán)節(jié)

AI取經路 ? 598瀏覽 ? 0回復

大模型自然語言處理

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

Kimi-VL開源多模態(tài)大模型結構、訓練方法、訓練數據淺析 2025-04-16 07:08:19發(fā)布
十大PDF解析工具在不同文檔類別中的比較研究 2025-04-07 06:31:37發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇： Phi-4-multimodal：圖、文、音頻統(tǒng)一的多模態(tài)大模型架構、訓練方法、數據細節(jié)

下一篇： PathRAG：通過圖剪枝的方法優(yōu)化Graph-based RAG的性能方法淺析

社區(qū)精華內容

目錄

<p id="b0bhb"><li id="b0bhb"><pre id="b0bhb"></pre></li></p>

<sub id="b0bhb"><p id="b0bhb"></p></sub>