自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<pre id="wi5nb"></pre>

<cite id="wi5nb"><track id="wi5nb"></track></cite>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

大模型應(yīng)用與LUI（自然語言交互）落地的關(guān)鍵模塊——語義路由實(shí)現(xiàn)總結(jié)

發(fā)布于 2024-5-20 14:40

瀏覽

0收藏

在傳統(tǒng)搜索應(yīng)用中，有一個(gè)核心的模塊叫意圖識別，即識別用戶搜索請求時(shí)的意圖，基于意圖不同生成不同的Query或執(zhí)行不同的邏輯。在RAG應(yīng)用中，仍然存在著類似的路由模塊完成請求分發(fā)。這樣的路由分發(fā)需求無處不在，特別是在自然語言交互的應(yīng)用中，并且會隨著系統(tǒng)支持的場景和功能增多而變得越來越重要。所謂路由就是一個(gè)能夠根據(jù)一段自然語言輸入進(jìn)行意圖判斷形成離散輸出的模塊。

典型的場景比如智能客服中的指令任務(wù)分發(fā)，硬盤搜索助手根據(jù)用戶需求搜索圖片還是搜索文件。下面是一些常見的情景的總結(jié)。

1）基于問題不同生成不同Prompt的情況，這和意圖識別生成不同Query一樣。

2）根據(jù)數(shù)據(jù)存儲的多樣性分發(fā)到不同數(shù)據(jù)存儲和服務(wù)中，比如數(shù)據(jù)庫、API等

3）即使存儲介質(zhì)相同，也可能存在多個(gè)需要分發(fā)的情況。

4）根據(jù)問題的類型分發(fā)到不同的組件。比如，根據(jù)問題的性質(zhì)將查詢分發(fā)給向量數(shù)據(jù)庫、Agent或服務(wù)等。

對于路由的實(shí)現(xiàn)大致分為兩類，邏輯路由（Logical Routers）和自然語言路由。相較于自然語言路由，邏輯路由不依賴于對路由輸入的語義理解，而自然語言路由是需要關(guān)注語義的。

大模型應(yīng)用與LUI（自然語言交互）落地的關(guān)鍵模塊——語義路由實(shí)現(xiàn)總結(jié)-AI.x社區(qū)

以下是這些路由的介紹：

1.LLM 路由

利用 LLM 的決策(decision making )能力根據(jù)用戶的查詢分發(fā)。

a.LLM生成路由

這類路由利用 LLM Completion接口實(shí)現(xiàn)，要求 LLM 從提示的單詞選項(xiàng)列表中返回最能描述查詢的單個(gè)單詞。然后，該詞可以作為 If/Else 條件的一部分來控制應(yīng)用程序流程。

在llamaindex及LangChain都有這種思路的實(shí)現(xiàn)。下面是 LangChain 的一個(gè)使用例子。

from langchain_anthropic import ChatAnthropic
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import PromptTemplate


# Set up the LLM Chain to return a single word based on the query,
# and based on a list of words we provide to it in the prompt template
llm_completion_select_route_chain = (
        PromptTemplate.from_template("""
Given the user question below, classify it as either
being about `LangChain`, `Anthropic`, or `Other`.


Do not respond with more than one word.


<question>
{question}
</question>


Classification:"""
                                     )
        | ChatAnthropic(model_name="claude-3-haiku")
        | StrOutputParser()
)




# We setup an IF/Else condition to route the query to the correct chain 
# based on the LLM completion call above
def route_to_chain(route_name):
    if "anthropic" == route_name.lower():
        return anthropic_chain
    elif "langchain" == route_name.lower():
        return langchain_chain
    else:
        return general_chain


...


# Later on in the application, we can use the response from the LLM
# completion chain to control (i.e route) the flow of the application 
# to the correct chain via the route_to_chain method we created
route_name = llm_completion_select_route_chain.invoke(user_query)
chain = route_to_chain(route_name)
chain.invoke(user_query)

b.LLM 函數(shù)調(diào)用路由器

利用了 LLM 的function call能力來選擇要執(zhí)行的分支函數(shù)。

LlamaIndex中的Pydantic路由就是這個(gè)原理。大多數(shù)Agent選擇要使用的正確工具也是采用這樣的方式。它們利用 LLM 的函數(shù)調(diào)用能力，根據(jù)用戶的查詢選擇適合的工具。下面是Pydantic路由的使用例子：

from llama_index.core.query_engine import RouterQueryEngine
from llama_index.core.selectors import PydanticSingleSelector
from llama_index.core.selectors.pydantic_selectors import Pydantic
from llama_index.core.tools import QueryEngineTool
from llama_index.core import VectorStoreIndex, SummaryIndex


# define query engines
...


# initialize tools
list_tool = QueryEngineTool.from_defaults(
    query_engine=list_query_engine,
    descriptinotallow="Useful for summarization questions related to the data source",
)
vector_tool = QueryEngineTool.from_defaults(
    query_engine=vector_query_engine,
    descriptinotallow="Useful for retrieving specific context related to the data source",
)


# initialize router query engine (single selection, pydantic)
query_engine = RouterQueryEngine(
    selector=PydanticSingleSelector.from_defaults(),
    query_engine_tools=[
        list_tool,
        vector_tool,
    ],
)
query_engine.query("<query>")

2.語義路由

利用語義相關(guān)性檢索來選擇最佳的分支。

每個(gè)路由都有一組與之關(guān)聯(lián)的示例查詢，這些查詢會被embedding并存儲為向量。傳入的查詢也會被embedding，并針對路由器中的其他示例查詢進(jìn)行相似性搜索。匹配度最高的查詢的路由將被選中。

以semantic-router（https://github.com/aurelio-labs/semantic-router）這個(gè)項(xiàng)目為例了解其具體細(xì)節(jié)。例如，設(shè)置兩個(gè)路由，一個(gè)用于政治問題的問答，另一個(gè)用于一般閑聊類型的問答。對于每個(gè)路由都會分配一個(gè)通?？赡鼙挥脕碛|發(fā)該路由分支的問題列表。這些示例查詢（utterances）將被embedding，以便可以將它們用于針對用戶查詢的相似性搜索。

from semantic_router import Route


# we could use this as a guide for our chatbot to avoid political
# conversations
politics = Route(
    name="politics",
    utterances=[
        "isn't politics the best thing ever",
        "why don't you tell me about your political opinions",
        "don't you just love the president",
        "they're going to destroy this country!",
        "they will save the country!",
    ],
)


# this could be used as an indicator to our chatbot to switch to a more
# conversational prompt
chitchat = Route(
    name="chitchat",
    utterances=[
        "how's the weather today?",
        "how are things going?",
        "lovely weather today",
        "the weather is horrendous",
        "let's go to the chippy",
    ],
)


# we place both of our decisions together into single list
routes = [politics, chitchat]


#創(chuàng)建路由層


encoder = OpenAIEncoder()


from semantic_router.layer import RouteLayer


route_layer = RouteLayer(encoder=encoder, routes=routes)

使用時(shí)，輸入問題，便能獲得路由決策。

route_layer("don't you love politics?").name
# -> 'politics'

由于這種路由本質(zhì)上是向量檢索，無需調(diào)用LLM，因而比其他基于 LLM 的路由器更快。

3.零樣本文本分類路由

零樣本文本分類（Zero-shot text classification）是NLP中的一項(xiàng)任務(wù)，其中模型在一個(gè)標(biāo)記樣本集上進(jìn)行訓(xùn)練，進(jìn)而獲得能夠?qū)碜韵惹拔匆娺^的樣本進(jìn)行分類，比如基于bert的分類器。

而這類路由便是利用零樣本分類模型給一段文本打上標(biāo)簽，而這些標(biāo)簽來自于預(yù)定義的標(biāo)簽路由。

比如，Haystack 中的 ZeroShotTextRouter便是這種實(shí)現(xiàn)路徑。具體參考：https://github.com/deepset-ai/haystack/blob/main/haystack/components/routers/zero_shot_text_router.py#L130

4.語言分類路由

這類路由器能夠識別查詢所使用的語言，并根據(jù)該語言路由查詢。如果應(yīng)用程序需要某種多語言解析能力，這將非常有用。

比如，Haystack 中的 TextClassificationRouter，它利用 langdetect 庫來檢測文本的語言，該庫本身使用樸素貝葉斯算法來檢測語言。參考：https://github.com/deepset-ai/haystack/blob/main/haystack/components/routers/text_language_router.py#L90

5.關(guān)鍵字路由

該類路由將嘗試通過匹配查詢和路由列表之間的關(guān)鍵字來選擇分支。

這個(gè)關(guān)鍵字路由器也可以由 LLM 來識別關(guān)鍵字，或者由其他一些關(guān)鍵字匹配庫來實(shí)現(xiàn)。

6.邏輯路由

它們使用邏輯檢查變量，例如字符串長度、文件名和值比較來處理如何路由查詢。它們與編程中使用的典型 If/Else 條件非常相似。它們不是基于必須理解自然語言查詢的意圖，而是可以根據(jù)現(xiàn)有和變量參數(shù)做出選擇。典型實(shí)現(xiàn)如HayStack 中的 ConditionalRouter 和 FileTypeRouter。

小結(jié)

不管是RAG應(yīng)用還是普通的業(yè)務(wù)系統(tǒng)，都存在著大量的分支判斷，這種判斷早期由于自然語言技術(shù)的落后（準(zhǔn)確率和性能）導(dǎo)致大多數(shù)實(shí)現(xiàn)為語法判斷，而隨著LLM技術(shù)的發(fā)展，必然會帶動語義判斷和分發(fā)需求的大發(fā)展，另一方面，隨著自然語言交互（LUI）的不斷普及，路由模塊將成為其中核心實(shí)現(xiàn)受到更大重視。

參考：

??https://towardsdatascience.com/routing-in-rag-driven-applications-a685460a7220??

??https://betterprogramming.pub/unifying-llm-powered-qa-techniques-with-routing-abstractions-438e2499a0d0??

本文轉(zhuǎn)載自?? AI工程化??，作者： ully

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

重編程大語言模型實(shí)現(xiàn)跨模態(tài)交互的時(shí)序預(yù)測 | ICLR 2024

輕薄滴假象 ? 2450瀏覽 ? 0回復(fù)
【深度解析】自然語言生成中的“幻覺”現(xiàn)象

zhcs333 ? 3710瀏覽 ? 0回復(fù)
NATURAL PLAN：LLMs在自然語言規(guī)劃上的基準(zhǔn)

sbf_2000 ? 2632瀏覽 ? 0回復(fù)
大模型應(yīng)用落地：如何選擇合適的 Embedding 模型？

玄姐聊AGI ? 4355瀏覽 ? 0回復(fù)
基于Llama 3和LangChain，使用自然語言進(jìn)行SQL查詢

小虎哦哦 ? 4418瀏覽 ? 0回復(fù)
大語言模型在不同自然語言處理任務(wù)中的提示工程方法綜述

sbf_2000 ? 3038瀏覽 ? 0回復(fù)
加速AI應(yīng)用落地，大模型與智能體何以成為“雙驕”

51CTO技術(shù)棧 ? 2906瀏覽 ? 0回復(fù)
AI應(yīng)用落地關(guān)鍵技術(shù)：AI Agent

玄姐聊AGI ? 2152瀏覽 ? 0回復(fù)
大模型落地應(yīng)用指北—大模型能吃嗎？

zhcs333 ? 2106瀏覽 ? 0回復(fù)
掌握BERT：自然語言處理（NLP）從初級到高級的綜合指南

石映飛云 ? 2232瀏覽 ? 0回復(fù)
推進(jìn)可解釋性自然語言生成（NLG）：技術(shù)、挑戰(zhàn)和應(yīng)用

51CTO內(nèi)容精選 ? 2621瀏覽 ? 0回復(fù)
TAG：定義自然語言查詢的高效解決方案

51CTO內(nèi)容精選 ? 2584瀏覽 ? 0回復(fù)
面向語音控制前端應(yīng)用程序的自然語言處理（NLP）：架構(gòu)、進(jìn)展與未來方向

51CTO內(nèi)容精選 ? 2001瀏覽 ? 0回復(fù)
深入探究編碼器 - 解碼器架構(gòu)：從RNN到Transformer的自然語言處理模型

AI論文解讀 ? 3641瀏覽 ? 0回復(fù)
什么是自然語言處理——NLP，其解決了什么問題？

AI探索時(shí)代 ? 2146瀏覽 ? 0回復(fù)
你知道自然語言處理(NLP)能解決哪些問題嗎？即自然語言處理任務(wù)分類有哪些？

AI探索時(shí)代 ? 1731瀏覽 ? 0回復(fù)
LMEDR對話模型：引入自然語言推理數(shù)據(jù)提升對話模型的連貫性和一致性

arnoldzhw ? 1533瀏覽 ? 0回復(fù)
萬字長文深度剖析基于 MCP 實(shí)現(xiàn) AI 應(yīng)用架構(gòu)設(shè)計(jì)新范式的落地實(shí)踐

玄姐聊AGI ? 2623瀏覽 ? 0回復(fù)
技術(shù)前沿：CHASE-SQL與XiYan-SQL，解鎖自然語言與數(shù)據(jù)庫對話的奧秘！

Halo咯咯 ? 663瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

大模型靠強(qiáng)化學(xué)習(xí)就能無限變強(qiáng)？清華潑了一盆冷水 10h前發(fā)布
METR發(fā)現(xiàn) AI 編碼的“摩爾定律”？指數(shù)級增長或顛覆軟件開發(fā) 10h前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：使用Transformer來進(jìn)行時(shí)序預(yù)測可還行？

下一篇： OpenAI前CTO Ilya推薦的30篇文章，認(rèn)真讀完將理解當(dāng)下90%的AI技術(shù)（1-11）

社區(qū)精華內(nèi)容

目錄