自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

深度學(xué)習(xí)！構(gòu)建基于LangGraph的RAG多智能體研究工具原創(chuàng)

發(fā)布于 2025-4-28 09:18

瀏覽

0收藏

在當(dāng)今信息爆炸的時代，快速準(zhǔn)確地獲取知識變得尤為重要。傳統(tǒng)的問答系統(tǒng)雖然能夠處理一些簡單問題，但在面對復(fù)雜問題時往往顯得力不從心。為了解決這一痛點，我們開發(fā)了一款基于 LangGraph 的 RAG 多智能體工具，它能夠高效地處理復(fù)雜問題，整合多源信息，并通過迭代步驟得出精準(zhǔn)答案。今天，就讓我們深入了解一下這個強大的工具。

一、引言：從簡單的 RAG 到智能的多智能體 RAG

在項目開發(fā)初期，我們發(fā)現(xiàn)傳統(tǒng)的“簡單 RAG”方法存在諸多不足。簡單 RAG 無法拆解復(fù)雜問題，只能在單一層面處理查詢，無法深入分析每個步驟并得出統(tǒng)一結(jié)論；它缺乏對幻覺（即模型生成錯誤信息）或錯誤處理的能力，無法通過驗證步驟糾正錯誤；此外，簡單 RAG 系統(tǒng)也無法根據(jù)工作流條件動態(tài)使用工具、調(diào)用外部 API 或與數(shù)據(jù)庫交互。

為了解決這些問題，我們引入了多智能體 RAG 研究系統(tǒng)?；谥悄荏w的框架能夠?qū)崿F(xiàn)以下功能：

路由和工具使用：路由智能體可以對用戶的查詢進(jìn)行分類，并將流程引導(dǎo)到合適的節(jié)點或工具。例如，它可以判斷文檔是否需要完整總結(jié)、是否需要更詳細(xì)的信息，或者問題是否超出范圍。
規(guī)劃子步驟：復(fù)雜查詢通常需要被拆解成更小、更易管理的步驟。從一個查詢出發(fā)，系統(tǒng)可以生成一系列執(zhí)行步驟，以探索查詢的不同方面并得出結(jié)論。比如，如果查詢需要比較文檔的兩個不同部分，基于智能體的方法可以識別這種比較需求，分別檢索兩個來源，并在最終回應(yīng)中將它們合并為比較分析。
反思和錯誤糾正：除了簡單的回應(yīng)生成，智能體方法還可以增加一個驗證步驟，以應(yīng)對潛在的幻覺、錯誤或未能準(zhǔn)確回答用戶查詢的回應(yīng)。此外，它還能夠整合人工參與的自我糾正機(jī)制，將人類輸入融入自動化流程。這種功能使基于智能體的 RAG 系統(tǒng)成為企業(yè)應(yīng)用中更穩(wěn)健、更可靠的解決方案，因為在企業(yè)場景中，可靠性至關(guān)重要。
共享全局狀態(tài)：智能體工作流共享一個全局狀態(tài)，簡化了跨多步驟的狀態(tài)管理。這個共享狀態(tài)對于維持多智能體過程不同階段的一致性至關(guān)重要。

二、項目概覽：構(gòu)建智能問答的“大腦”

（一）系統(tǒng)架構(gòu)圖

我們的系統(tǒng)包含兩個核心部分：研究者子圖和主圖。研究者子圖負(fù)責(zé)生成用于檢索和重排向量數(shù)據(jù)庫中 top-k 文檔的不同查詢；主圖則包含主要工作流程，例如分析用戶查詢、生成完成任務(wù)所需的步驟、生成回應(yīng)，并通過人工參與機(jī)制檢查幻覺。

深度學(xué)習(xí)！構(gòu)建基于LangGraph的RAG多智能體研究工具-AI.x社區(qū)

（二）文檔處理與向量數(shù)據(jù)庫構(gòu)建

1. 文檔解析

對于結(jié)構(gòu)復(fù)雜的 PDF 文檔，尤其是包含復(fù)雜布局的表格，選擇合適的解析工具至關(guān)重要。許多庫在處理復(fù)雜頁面布局或表格結(jié)構(gòu)的 PDF 時精度不足。為此，我們采用了 Docling 這一開源庫，它能夠高效地解析文檔，并將內(nèi)容導(dǎo)出為所需格式。Docling 支持從 PDF、DOCX、PPTX、XLSX、圖片、HTML、AsciiDoc 和 Markdown 等多種常用文檔格式讀取和導(dǎo)出 Markdown 和 JSON 格式。它對 PDF 文檔有全面的理解，包括表格結(jié)構(gòu)、閱讀順序和頁面布局，還支持對掃描 PDF 的 OCR 功能。

深度學(xué)習(xí)！構(gòu)建基于LangGraph的RAG多智能體研究工具-AI.x社區(qū)

以下是使用 Docling 將 PDF 轉(zhuǎn)換為 Markdown 格式的代碼示例：

from docling.document_converter import DocumentConverter

logger.info("Starting document processing.")
converter = DocumentConverter()
markdown_document = converter.convert(source).document.export_to_markdown()

深度學(xué)習(xí)！構(gòu)建基于LangGraph的RAG多智能體研究工具-AI.x社區(qū)

2. 向量數(shù)據(jù)庫構(gòu)建

我們使用 Chroma 構(gòu)建向量數(shù)據(jù)庫，將句子存儲為向量嵌入，并在數(shù)據(jù)庫中進(jìn)行搜索。我們將持久化數(shù)據(jù)庫存儲在本地目錄 “db_vector” 中。通過 OpenAI 的嵌入模型，我們將文檔列表轉(zhuǎn)換為向量，并存儲在 Chroma 中。

以下是構(gòu)建向量數(shù)據(jù)庫的代碼：

from langchain_community.vectorstores import Chroma
from langchain_openai import OpenAIEmbeddings

embd = OpenAIEmbeddings()

vectorstore_from_documents = Chroma.from_documents(
    documents=docs_list,
    collection_name="rag-chroma-google-v1",
    embedding=embd,
    persist_directory='db_vector'
)

（三）主圖構(gòu)建與狀態(tài)管理

LangGraph 的核心概念之一是狀態(tài)。每個圖執(zhí)行都會創(chuàng)建一個狀態(tài)，該狀態(tài)在圖的節(jié)點執(zhí)行時傳遞，并在每個節(jié)點執(zhí)行后更新內(nèi)部狀態(tài)。

深度學(xué)習(xí)！構(gòu)建基于LangGraph的RAG多智能體研究工具-AI.x社區(qū)

我們定義了兩個類：Router 和 GradeHallucinations，分別用于存儲用戶查詢的分類結(jié)果和回應(yīng)中幻覺的存在與否?；谶@些狀態(tài)，我們構(gòu)建了輸入狀態(tài)（InputState）和智能體狀態(tài)（AgentState），其中 AgentState 包含用戶查詢的分類、研究計劃的步驟列表、智能體可以引用的檢索文檔列表，以及幻覺的二進(jìn)制評分。

以下是狀態(tài)類的定義代碼：

from pydantic import BaseModel, Field
from typing import Literal, TypedDict

class Router(TypedDict):
    """Classify user query."""
    logic: str
    type: Literal["more-info", "environmental", "general"]

class GradeHallucinations(BaseModel):
    """Binary score for hallucination present in generation answer."""
    binary_score: str = Field(descriptinotallow="Answer is grounded in the facts, '1' or '0'")

（四）工作流程詳解

1. 第一步：分析和路由查詢

這一步會更新智能體狀態(tài)中的 Router 對象，其類型變量包含 “more-info”、“environmental” 或 “general” 中的一個值。根據(jù)這個信息，工作流將被路由到合適的節(jié)點，例如 “create_research_plan”、“ask_for_more_info” 或 “respond_to_general_query”。

以下是實現(xiàn)代碼：

async def analyze_and_route_query(
    state: AgentState, *, config: RunnableConfig
) -> dict[str, Router]:
    """Analyze the user's query and determine the appropriate routing."""
    model = ChatOpenAI(model=GPT_4o, temperature=TEMPERATURE, streaming=True)
    messages = [
        {"role": "system", "content": ROUTER_SYSTEM_PROMPT}
    ] + state.messages
    logging.info("---ANALYZE AND ROUTE QUERY---")
    response = cast(
        Router, await model.with_structured_output(Router).ainvoke(messages)
    )
    return {"router": response}

2. 第二步：創(chuàng)建研究計劃

如果查詢分類返回 “environmental”，用戶的請求與文檔相關(guān)，工作流將到達(dá) “create_research_plan” 節(jié)點，該節(jié)點的功能是為回答與環(huán)境相關(guān)的查詢創(chuàng)建逐步研究計劃。

以下是實現(xiàn)代碼：

async def create_research_plan(
    state: AgentState, *, config: RunnableConfig
) -> dict[str, list[str] | str]:
    """Create a step-by-step research plan for answering an environmental-related query."""
    class Plan(TypedDict):
        """Generate research plan."""
        steps: list[str]

    model = ChatOpenAI(model=GPT_4o_MINI, temperature=TEMPERATURE, streaming=True)
    messages = [
        {"role": "system", "content": RESEARCH_PLAN_SYSTEM_PROMPT}
    ] + state.messages
    logging.info("---PLAN GENERATION---")
    response = cast(Plan, await model.with_structured_output(Plan).ainvoke(messages))
    return {"steps": response["steps"], "documents": "delete"}

3. 第三步：開展研究

這一步會從研究計劃中取出第一個步驟，并調(diào)用研究者子圖來執(zhí)行研究。研究者子圖會返回一系列文檔片段，我們將在后續(xù)步驟中進(jìn)一步處理。

以下是實現(xiàn)代碼：

async def conduct_research(state: AgentState) -> dict[str, Any]:
    """Execute the first step of the research plan."""
    result = await researcher_graph.ainvoke({"question": state.steps[0]})  # graph call directly
    docs = result["documents"]
    step = state.steps[0]
    logging.info(f"\n{len(docs)} documents retrieved in total for the step: {step}.")
    return {"documents": result["documents"], "steps": state.steps[1:]}

4. 第四步：研究者子圖構(gòu)建

深度學(xué)習(xí)！構(gòu)建基于LangGraph的RAG多智能體研究工具-AI.x社區(qū)

研究者子圖包含查詢生成和文檔檢索兩個關(guān)鍵步驟。查詢生成步驟會根據(jù)研究計劃中的問題生成多個搜索查詢，以幫助回答問題。文檔檢索步驟則使用混合搜索和 Cohere 重排技術(shù)，從向量數(shù)據(jù)庫中檢索相關(guān)文檔。

以下是查詢生成的代碼：

async def generate_queries(
    state: ResearcherState, *, config: RunnableConfig
) -> dict[str, list[str]]:
    """Generate search queries based on the question."""
    class Response(TypedDict):
        queries: list[str]

    logger.info("---GENERATE QUERIES---")
    model = ChatOpenAI(model="gpt-4o-mini-2024-07-18", temperature=0)
    messages = [
        {"role": "system", "content": GENERATE_QUERIES_SYSTEM_PROMPT},
        {"role": "human", "content": state.question},
    ]
    response = cast(Response, await model.with_structured_output(Response).ainvoke(messages))
    queries = response["queries"]
    queries.append(state.question)
    logger.info(f"Queries: {queries}")
    return {"queries": response["queries"]}

以下是文檔檢索和重排的代碼：

def _setup_vectorstore() -> Chroma:
    """Set up and return the Chroma vector store instance."""
    embeddings = OpenAIEmbeddings()
    return Chroma(
        collection_name=VECTORSTORE_COLLECTION,
        embedding_functinotallow=embeddings,
        persist_directory=VECTORSTORE_DIRECTORY
    )

# Create base retrievers
retriever_bm25 = BM25Retriever.from_documents(documents, search_kwargs={"k": TOP_K})
retriever_vanilla = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": TOP_K})
retriever_mmr = vectorstore.as_retriever(search_type="mmr", search_kwargs={"k": TOP_K})

ensemble_retriever = EnsembleRetriever(
    retrievers=[retriever_vanilla, retriever_mmr, retriever_bm25],
    weights=ENSEMBLE_WEIGHTS,
)

# Set up Cohere re-ranking
compressor = CohereRerank(top_n=2, model="rerank-english-v3.0")
compression_retriever = ContextualCompressionRetriever(
    base_compressor=compressor,
    base_retriever=ensemble_retriever,
)

5. 第五步：檢查是否完成

這一步通過檢查研究計劃中是否還有剩余步驟來確定研究過程是否完成。如果還有步驟，工作流將返回 “conduct_research” 節(jié)點繼續(xù)執(zhí)行；如果沒有剩余步驟，則進(jìn)入 “respond” 節(jié)點生成最終回應(yīng)。

以下是實現(xiàn)代碼：

def check_finished(state: AgentState) -> Literal["respond", "conduct_research"]:
    """Determine if the research process is complete."""
    if len(state.steps or []) > 0:
        return "conduct_research"
    else:
        return "respond"

6. 第六步：生成回應(yīng)

這一步根據(jù)研究過程中檢索到的文檔和對話歷史，生成對用戶查詢的最終回應(yīng)。它利用語言模型將所有相關(guān)信息整合成一個全面的答案。

以下是實現(xiàn)代碼：

async def respond(
    state: AgentState, *, config: RunnableConfig
) -> dict[str, list[BaseMessage]]:
    """Generate the final response to the user's query."""
    model = ChatOpenAI(model="gpt-4o-2024-08-06", temperature=0)
    context = format_docs(state.documents)
    prompt = RESPONSE_SYSTEM_PROMPT.format(cnotallow=context)
    messages = [{"role": "system", "content": prompt}] + state.messages
    response = await model.ainvoke(messages)
    return {"messages": [response]}

7. 第七步：檢查幻覺

這一步會分析語言模型生成的回應(yīng)，判斷其是否得到了檢索到的文檔事實的支持，并給出一個二進(jìn)制評分結(jié)果。如果評分表明回應(yīng)可能包含幻覺，工作流將被中斷，并提示用戶決定是否重新生成回應(yīng)或結(jié)束流程。

以下是實現(xiàn)代碼：

async def check_hallucinations(
    state: AgentState, *, config: RunnableConfig
) -> dict[str, Any]:
    """Analyze the response for hallucinations."""
    model = ChatOpenAI(model=GPT_4o_MINI, temperature=TEMPERATURE, streaming=True)
    system_prompt = CHECK_HALLUCINATIONS.format(
        documents=state.documents,
        generatinotallow=state.messages[-1]
    )
    messages = [
        {"role": "system", "content": system_prompt}
    ] + state.messages
    logging.info("---CHECK HALLUCINATIONS---")
    response = cast(GradeHallucinations, await model.with_structured_output(GradeHallucinations).ainvoke(messages))
    return {"hallucination": response}

8. 第八步：人工審批（人工參與）

如果語言模型的回應(yīng)未得到事實支持，可能包含幻覺，此時工作流將暫停，并將控制權(quán)交給用戶。用戶可以選擇僅重新執(zhí)行最后的生成步驟，而無需重新啟動整個工作流，或者選擇結(jié)束流程。這種人工參與機(jī)制確保了用戶對整個過程的控制，避免了不必要的循環(huán)或不期望的操作。

以下是實現(xiàn)代碼：

def human_approval(state: AgentState):
    _binary_score = state.hallucination.binary_score
    if _binary_score == "1":
        return"END"
    else:
        retry_generation = interrupt(
            {
                "question": "Is this correct?",
                "llm_output": state.messages[-1]
            }
        )
        if retry_generation == "y":
            print("Continue with retry...")
            return"respond"
        else:
            return"END"

三、實戰(zhàn)測試：多智能體 RAG 的強大能力

深度學(xué)習(xí)！構(gòu)建基于LangGraph的RAG多智能體研究工具-AI.x社區(qū)

為了驗證系統(tǒng)的性能，我們使用了一份關(guān)于谷歌環(huán)境可持續(xù)性戰(zhàn)略的年度報告進(jìn)行了測試。這份報告包含了豐富的數(shù)據(jù)和復(fù)雜的表格結(jié)構(gòu)，非常適合用來測試系統(tǒng)的多步驟處理能力和文檔解析功能。

（一）復(fù)雜問題測試

我們提出了一個復(fù)雜的問題：“檢索新加坡第二個數(shù)據(jù)中心 2019 年和 2022 年的 PUE 效率值，以及 2023 年亞太地區(qū)的區(qū)域平均 CFE 值?！?/p>

深度學(xué)習(xí)！構(gòu)建基于LangGraph的RAG多智能體研究工具-AI.x社區(qū)

系統(tǒng)成功地將這個問題拆解為多個步驟，并生成了相應(yīng)的查詢：

“查找新加坡第二個數(shù)據(jù)中心 2019 年和 2022 年的 PUE 效率值?！?/li>
“查找 2023 年亞太地區(qū)的區(qū)域平均 CFE 值。”

通過檢索和重排文檔，系統(tǒng)最終給出了準(zhǔn)確的答案：

新加坡第二個數(shù)據(jù)中心 2019 年的 PUE 效率值未提供，但 2022 年的 PUE 為 1.21。
2023 年亞太地區(qū)的區(qū)域平均 CFE 為 12%。

（二）與 ChatGPT 的對比測試

為了進(jìn)一步驗證系統(tǒng)的可靠性，我們將同樣的問題提交給了 ChatGPT。結(jié)果發(fā)現(xiàn)，ChatGPT 返回的值是錯誤的，明顯出現(xiàn)了幻覺現(xiàn)象。這表明，在處理復(fù)雜問題時，簡單的語言模型可能會生成不準(zhǔn)確的信息，而我們的多智能體 RAG 系統(tǒng)通過幻覺檢查步驟能夠有效避免這種情況。

四、技術(shù)挑戰(zhàn)與展望：多智能體 RAG 的未來之路

盡管多智能體 RAG 在性能上有顯著提升，但在實際應(yīng)用中仍面臨一些挑戰(zhàn)：

延遲問題：由于智能體交互的復(fù)雜性增加，響應(yīng)時間可能會變長。如何在速度和準(zhǔn)確性之間取得平衡是一個關(guān)鍵挑戰(zhàn)。
評估與可觀測性：隨著多智能體 RAG 系統(tǒng)變得越來越復(fù)雜，持續(xù)的評估和可觀測性變得必不可少。

總的來說，多智能體 RAG 是人工智能領(lǐng)域的一項重大突破。它將大型語言模型的能力與自主推理和信息檢索相結(jié)合，引入了一種新的智能和靈活性標(biāo)準(zhǔn)。隨著人工智能的不斷發(fā)展，多智能體 RAG 將在各個行業(yè)中發(fā)揮基礎(chǔ)性作用，徹底改變我們使用技術(shù)的方式。

本文轉(zhuǎn)載自公眾號Halo咯咯作者：基咯咯

原文鏈接：??https://mp.weixin.qq.com/s/nBj5FzBNm8Mg5YoMoQJNrg??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

深度學(xué)習(xí)

已于2025-4-28 09:18:13修改

贊

收藏

回復(fù)

舉報

社區(qū)頭條

回復(fù)

相關(guān)推薦

擁擠場景中基于深度學(xué)習(xí)的目標(biāo)檢測

mb61e52f0ac174a ? 2620瀏覽 ? 0回復(fù)
探索LangGraph：構(gòu)建多專家協(xié)作模型

ermulong ? 3250瀏覽 ? 0回復(fù)
基于LangGraph多智能體技術(shù)，搭建AI寫作自動化系統(tǒng)

小虎哦哦 ? 3804瀏覽 ? 0回復(fù)
從目標(biāo)分配到路徑規(guī)劃，哈工大團(tuán)隊提出智能倉庫的多智能體深度學(xué)習(xí)解決方案

xuxiangda ? 3726瀏覽 ? 0回復(fù)
微軟研究院發(fā)布無代碼開發(fā)工具 AUTOGEN STUDIO，簡化多智能體系統(tǒng)的構(gòu)建與調(diào)試

xuxiangda ? 4705瀏覽 ? 0回復(fù)
基于關(guān)系型深度學(xué)習(xí)的自助機(jī)器學(xué)習(xí)

51CTO內(nèi)容精選 ? 1837瀏覽 ? 0回復(fù)
只需8步，手把手教你用LangGraph創(chuàng)建AI智能體

小虎哦哦 ? 4813瀏覽 ? 0回復(fù)
入口控制：多智能體強化學(xué)習(xí)在自動駕駛中的應(yīng)用研究

xuxiangda ? 3147瀏覽 ? 0回復(fù)
基于多模態(tài)深度強化學(xué)習(xí)的投資組合優(yōu)化

靈度智能 ? 2482瀏覽 ? 0回復(fù)
基于深度強化學(xué)習(xí)的投資組合配置動態(tài)優(yōu)化

靈度智能 ? 2833瀏覽 ? 0回復(fù)
基于Gemini 2.0和LangGraph實現(xiàn)自主多工具AI代理

51CTO內(nèi)容精選 ? 2156瀏覽 ? 0回復(fù)
2025 年：如何構(gòu)建有效的智能體

zhishan15 ? 7469瀏覽 ? 0回復(fù)
多智能體強化學(xué)習(xí)如何讓AI回答更精準(zhǔn)？MMOA-RAG的突破性進(jìn)展

Halo咯咯 ? 2700瀏覽 ? 0回復(fù)
基于LangGraph的智能文章生成Agent架構(gòu)設(shè)計思路

九歌AI大模型 ? 1618瀏覽 ? 0回復(fù)
MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā)

玄姐聊AGI ? 7083瀏覽 ? 0回復(fù)
RAG 準(zhǔn)確率告急？金融大佬 Mike Conover 親授：構(gòu)建高保真知識智能體的實戰(zhàn)秘笈

凝固的雨_1 ? 1894瀏覽 ? 0回復(fù)
LangChain與CrewAI構(gòu)建基于RAG的智能查詢解答系統(tǒng)

Halo咯咯 ? 1017瀏覽 ? 0回復(fù)
Agno框架介紹：用于構(gòu)建多模態(tài)智能體的輕量庫

51CTO內(nèi)容精選 ? 658瀏覽 ? 0回復(fù)
深度解析智能體框架，構(gòu)建真正可靠的 AI 應(yīng)用

ermulong ? 88瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

數(shù)學(xué)推理的 AI 新突破：NVIDIA 的 OpenMath-Nemotron 系列震撼登場！ 3h前發(fā)布
從簡單計數(shù)到多模態(tài)：嵌入技術(shù)的演變與應(yīng)用 3h前發(fā)布

熱門推薦

2025年最值得關(guān)注的十大多模態(tài)大語言模型！ 0回復(fù)

清華發(fā)布GLM 4！32B參數(shù)模型硬剛GPT-4o，性能驚艷 0回復(fù)

GPT-4.1系列深度解析：從代碼到動畫，從理論到實戰(zhàn)，AI的多面手來了！ 0回復(fù)

Google介紹了Agent2Agent（A2A）：一種新的開放協(xié)議，允許AI代理在生態(tài)系統(tǒng)中安全地合作 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

上一篇： NVIDIA發(fā)布DAM-3B：讓圖像和視頻的局部描述“有模有樣”！

下一篇： NVIDIA發(fā)布Eagle 2.5：長文本理解的“新星”，如何打破視覺-語言模型的局限？

社區(qū)精華內(nèi)容

目錄