自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="0hvu3"><p id="0hvu3"><li id="0hvu3"></li></p></sub>

<cite id="0hvu3"><li id="0hvu3"></li></cite>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

LangChain應(yīng)用開發(fā)指南-TruLens用量化對抗幻覺精華

發(fā)布于 2024-10-16 15:56

瀏覽

0收藏

LangChain應(yīng)用開發(fā)指南-TruLens用量化對抗幻覺-AI.x社區(qū)

在AI的發(fā)展中，大規(guī)模語言模型已經(jīng)取得了令人矚目的成果，然而，隨之而來的是模型質(zhì)量和不確定性的問題。如何衡量和改進模型的質(zhì)量，一直是我們面臨的一個挑戰(zhàn)。

為了解決這些問題，我們將在這篇文章中，介紹LangChain框架和TruLens工具，它們將幫助我們評估模型的質(zhì)量，提高模型質(zhì)量，并能夠用量化的方法對抗不確定。

什么是TruLens

TruLens是面向神經(jīng)網(wǎng)絡(luò)應(yīng)用的質(zhì)量評估工具，它可以幫助你使用反饋函數(shù)來客觀地評估你的基于LLM（語言模型）的應(yīng)用的質(zhì)量和效果。反饋函數(shù)可以幫助你以編程的方式評估輸入、輸出和中間結(jié)果的質(zhì)量，從而加快和擴大實驗評估的范圍。你可以將它用于各種各樣的用例，包括問答、檢索增強生成和基于代理的應(yīng)用。

TruLens的核心思想是，你可以為你的應(yīng)用定義一些反饋函數(shù)，這些函數(shù)可以根據(jù)你的應(yīng)用的目標(biāo)和期望，對你的應(yīng)用的表現(xiàn)進行打分或分類。例如：

定義一個反饋函數(shù)來評估你的問答應(yīng)用的輸出是否與問題相關(guān)，是否有依據(jù)，是否有用。
定義一個反饋函數(shù)來評估你的檢索增強生成應(yīng)用的輸出是否符合語法規(guī)則，是否有創(chuàng)造性，是否有邏輯性。
定義一個反饋函數(shù)來評估你的基于代理的應(yīng)用的輸出是否符合道德標(biāo)準(zhǔn)，是否有友好性，是否有誠實性。

TruLens可以讓你在開發(fā)和測試你的應(yīng)用的過程中，實時地收集和分析你的應(yīng)用的反饋數(shù)據(jù)，從而幫助你發(fā)現(xiàn)和解決你的應(yīng)用的問題，提高你的應(yīng)用的質(zhì)量和效果。你可以使用TruLens提供的易用的用戶界面，來查看和比較你的應(yīng)用的不同版本的反饋數(shù)據(jù)，從而找出你的應(yīng)用的優(yōu)勢和劣勢，以及改進的方向。

如何在LangChain中使用TruLens來評估模型輸出和檢索質(zhì)量

LangChain應(yīng)用開發(fā)指南-TruLens用量化對抗幻覺-AI.x社區(qū)

LangChain作為一種新的語言模型框架，它提供了一種有效的部署和管理大規(guī)模語言模型的框架。使用LangChain管理模型，不僅可以輕松部署和執(zhí)行模型，還可以方便地觀察模型的內(nèi)部狀態(tài)。再結(jié)合TruLens的評估工具，我們就可以對模型的質(zhì)量進行深入理解和改進。

要在LangChain中使用TruLens來評估你的應(yīng)用，你只需要做兩件事：

在你的LangChain代碼中，導(dǎo)入TruLens，并使用TruChain類來包裝你的LangChain對象。TruChain類是一個裝飾器，它可以讓你的LangChain對象在運行時，自動地調(diào)用TruLens的反饋函數(shù)，并記錄反饋數(shù)據(jù)。
在你的TruLens代碼中，指定你想要使用的反饋函數(shù)，以及你想要給你的應(yīng)用的ID。你可以使用TruLens提供的內(nèi)置的反饋函數(shù)，也可以自定義你自己的反饋函數(shù)。你可以為你的應(yīng)用指定一個唯一的ID，這樣你就可以在TruLens的用戶界面中，根據(jù)ID來查找和比較你的應(yīng)用的反饋數(shù)據(jù)。

下面是一個簡單的示例，展示了如何在LangChain中使用TruLens來評估一個問答應(yīng)用：

pip install trulens_eval

# 導(dǎo)入LangChain和TruLens
from langchain.chains import LLMChain
from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate
from langchain.prompts.chat import ChatPromptTemplate,HumanMessagePromptTemplate
from trulens_eval import TruChain,Feedback, Huggingface, Tru, OpenAI as TruOpenAI
from trulens_eval.feedback.provider.langchain import Langchain

tru = Tru()

# 定義一個問答應(yīng)用的提示模板
full_prompt = HumanMessagePromptTemplate(
    prompt=PromptTemplate(
        template=
        "Provide a helpful response with relevant background information for the following: {prompt}",
        input_variables=["prompt"],
    )
)

chat_prompt_template = ChatPromptTemplate.from_messages([full_prompt])



# 創(chuàng)建一個LLMChain對象，使用llm和chat_prompt_template作為參數(shù)
llm = OpenAI()
chain = LLMChain(llm=llm, prompt=chat_prompt_template, verbose=True)



# Initialize Huggingface-based feedback function collection class:
# Define a language match feedback function using HuggingFace.
hugs = Huggingface()
f_lang_match = Feedback(hugs.language_match).on_input_output()
# Question/answer relevance between overall question and answer.
provider = TruOpenAI()
f_qa_relevance = Feedback(provider.relevance).on_input_output()

# 使用TruChain類來包裝chain對象，指定反饋函數(shù)和應(yīng)用ID
tru_recorder = TruChain(
    chain,
    app_id='Chain1_QAApplication',
    feedbacks=[f_lang_match,f_qa_relevance])


# 使用with語句來運行chain對象，并記錄反饋數(shù)據(jù)
with tru_recorder as recording:
    # 輸入一個問題，得到一個回答
    chain("What is langchain?")
    # 查看反饋數(shù)據(jù)
    tru_record = recording.records[0]
    # 打印反饋數(shù)據(jù)
    print("tru_record:",tru_record)
# 啟動tru展示控制臺
tru.run_dashboard()

以RAG為例看看TruLens的評估結(jié)果

LangChain應(yīng)用開發(fā)指南-TruLens用量化對抗幻覺-AI.x社區(qū)

RAG（Retrieval-Augmented Generation）是一種基于LLM的應(yīng)用，它可以利用檢索系統(tǒng)來增強LLM的生成能力。RAG的工作原理是，當(dāng)給定一個輸入時，它會先從一個大規(guī)模的知識庫中檢索出一些相關(guān)的文檔，然后將這些文檔作為LLM的上下文，再使用LLM來生成一個輸出。RAG可以用于各種生成任務(wù)，例如問答、摘要、對話等。

RAG的優(yōu)點是，它可以利用檢索系統(tǒng)來提供LLM所缺乏的知識和信息，從而提高LLM的生成質(zhì)量和多樣性。RAG的缺點是，它也可能引入一些錯誤和幻覺，例如檢索出不相關(guān)或不準(zhǔn)確的文檔，或者生成與輸入或文檔不一致的輸出。

為了評估RAG的質(zhì)量和效果，我們可以使用TruLens提供的RAG三角形（RAG Triad）的評估方法。RAG三角形是由三個評估指標(biāo)組成的，分別是：

LangChain應(yīng)用開發(fā)指南-TruLens用量化對抗幻覺-AI.x社區(qū)

上下文相關(guān)性（Context Relevance）：評估輸入和檢索出的文檔之間的相關(guān)性，以及文檔之間的一致性。上下文相關(guān)性越高，說明檢索系統(tǒng)越能找到與輸入匹配的知識和信息，從而為LLM提供更好的上下文。
有根據(jù)性（Groundedness）：評估輸出和檢索出的文檔之間的一致性，以及輸出的可信度。有根據(jù)性越高，說明LLM越能利用檢索出的文檔來生成有依據(jù)的輸出，從而避免產(chǎn)生幻覺或錯誤。
答案相關(guān)性（Answer Relevance）：評估輸出和輸入之間的相關(guān)性，以及輸出的有用性。答案相關(guān)性越高，說明LLM越能理解輸入的意圖和需求，從而生成有用的輸出，滿足用戶的目的。

RAG三角形的評估方法可以讓我們從不同的角度來檢驗RAG的質(zhì)量和效果，從而發(fā)現(xiàn)和改進RAG的問題。我們可以使用TruLens來實現(xiàn)RAG三角形的評估方法，具體步驟如下：

在LangChain中，創(chuàng)建一個RAG對象，使用RAGPromptTemplate作為提示模板，指定檢索系統(tǒng)和知識庫的參數(shù)。
在TruLens中，創(chuàng)建一個TruChain對象，包裝RAG對象，指定反饋函數(shù)和應(yīng)用ID。反饋函數(shù)可以使用TruLens提供的f_context_relevance, f_groundness, f_answer_relevance，也可以自定義。
使用with語句來運行RAG對象，并記錄反饋數(shù)據(jù)。輸入一個問題，得到一個回答，以及檢索出的文檔。
查看和分析反饋數(shù)據(jù)，根據(jù)RAG三角形的評估指標(biāo)，評價RAG的表現(xiàn)。

下面是一個簡單的示例，展示了如何在LangChain中使用TruLens來評估一個RAG問答應(yīng)用：

# 導(dǎo)入LangChain和TruLens
from IPython.display import JSON

# Imports main tools:
from trulens_eval import TruChain, Feedback, Huggingface, Tru
from trulens_eval.schema import FeedbackResult
tru = Tru()
tru.reset_database()

# Imports from langchain to build app
import bs4
from langchain import hub
from langchain.chat_models import ChatOpenAI
from langchain.document_loaders import WebBaseLoader
from langchain.embeddings import OpenAIEmbeddings
from langchain.schema import StrOutputParser
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.vectorstores import Chroma
from langchain_core.runnables import RunnablePassthrough
from trulens_eval.feedback.provider import OpenAI
import numpy as np
from trulens_eval.app import App
from trulens_eval.feedback import Groundedness


# 加載文件
loader = WebBaseLoader(
    web_paths=("https://lilianweng.github.io/posts/2023-06-23-agent/",),
    bs_kwargs=dict(
        parse_notallow=bs4.SoupStrainer(
            class_=("post-content", "post-title", "post-header")
        )
    ),
)
docs = loader.load()
# 分詞
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = text_splitter.split_documents(docs)
# 存入到向量數(shù)據(jù)庫
vectorstore = Chroma.from_documents(documents=splits, embedding=OpenAIEmbeddings(
))
# 定義一個RAG Chain

retriever = vectorstore.as_retriever()

prompt = hub.pull("rlm/rag-prompt")
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

rag_chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)
# 使用TruChain類來包裝rag對象，指定反饋函數(shù)和應(yīng)用ID
# Initialize provider class
provider = OpenAI()
# select context to be used in feedback. the location of context is app specific.
context = App.select_context(rag_chain)
grounded = Groundedness(groundedness_provider=provider)
# f_context_relevance, f_groundness, f_answer_relevance 定義反饋函數(shù)
# Define a groundedness feedback function
f_groundedness = (
    Feedback(grounded.groundedness_measure_with_cot_reasons)
    .on(context.collect()) # collect context chunks into a list
    .on_output()
    .aggregate(grounded.grounded_statements_aggregator)
)

# Question/answer relevance between overall question and answer.
f_qa_relevance = Feedback(provider.relevance).on_input_output()
# Question/statement relevance between question and each context chunk.
f_context_relevance = (
    Feedback(provider.qs_relevance)
    .on_input()
    .on(context)
    .aggregate(np.mean)
    )
# 使用with語句來運行rag對象，并記錄反饋數(shù)據(jù)
tru_recorder = TruChain(rag_chain,
    app_id='Chain1_ChatApplication',
    feedbacks=[f_qa_relevance, f_context_relevance, f_groundedness])

with tru_recorder as recording:
    # 輸入一個問題，得到一個回答，以及檢索出的文檔
    llm_response = rag_chain.invoke("What is Task Decomposition?")
    # 查看反饋數(shù)據(jù)
    rec = recording.get() # use .get if only one record
    # 打印反饋數(shù)據(jù)
    print(rec)
# 啟動tru展示控制臺
tru.run_dashboard()

結(jié)論

在本文中，我們介紹了如何在LangChain中使用TruLens來對LLM進行評估和優(yōu)化，以及如何利用TruLens的結(jié)果來量化和對抗模型的不確定性。我們通過一個文本生成的任務(wù)為例，演示了如何使用TruLens來對模型的輸出進行測量和量化，以及對模型的行為進行分析和解釋。我們還分享了一個RAG案例代碼，用實際指標(biāo)說明了TruLens的評估結(jié)果。

我們也期待，未來有更多的工具和方法，可以對LLM進行更有效的評估和優(yōu)化，以及更好地量化和對抗模型的不確定性。我們相信，這將有助于推動LLM的發(fā)展和應(yīng)用，以及提升AI語言的水平和價值。

本文轉(zhuǎn)載自 ??AI小智??，作者： AI小智

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

使用 Gemini Pro 高效開發(fā)應(yīng)用

mb5f8eba9bdb0af ? 3264瀏覽 ? 0回復(fù)
開發(fā)者的LlamaIndex入門指南

51CTO內(nèi)容精選 ? 3859瀏覽 ? 0回復(fù)
基于LangChain自查詢檢索器的RAG系統(tǒng)開發(fā)實戰(zhàn)

51CTO內(nèi)容精選 ? 4427瀏覽 ? 0回復(fù)
LLM原生開發(fā)路線圖指南

51CTO內(nèi)容精選 ? 2475瀏覽 ? 0回復(fù)
【創(chuàng)新一夏學(xué)習(xí)季】熱浪升溫，創(chuàng)新一夏，釋放開發(fā)潛能

AI.x社區(qū)官方賬號 ? 52.8w瀏覽 ? 39回復(fù)
無需代碼，使用LangFlow輕松創(chuàng)建LangChain大模型應(yīng)用

小虎哦哦 ? 5443瀏覽 ? 0回復(fù)
基于AI技術(shù)的區(qū)塊鏈dApps應(yīng)用開發(fā)指南

51CTO內(nèi)容精選 ? 2731瀏覽 ? 0回復(fù)
「模型量化技術(shù)」可視化指南：A Visual Guide to Quantization

Baihai_IDP ? 3114瀏覽 ? 0回復(fù)
基于知識圖譜的LangChain應(yīng)用實戰(zhàn)

ermulong ? 2596瀏覽 ? 0回復(fù)
【智匯金秋創(chuàng)造季】智匯成海，致敬開發(fā)者的“超級碼力”！

AI.x社區(qū)官方賬號 ? 33.0w瀏覽 ? 148回復(fù)
LangChain應(yīng)用開發(fā)指南-不用向量也可以RAG

ermulong ? 2515瀏覽 ? 0回復(fù)
Agent 智能體開發(fā)框架選型指南

Baihai_IDP ? 3983瀏覽 ? 0回復(fù)
對抗生成網(wǎng)絡(luò)GAN

一起AI技術(shù) ? 1936瀏覽 ? 0回復(fù)
AI Agent 智能體開發(fā)工作手冊詳細指南

玄姐聊AGI ? 4551瀏覽 ? 0回復(fù)
極簡LangChain智能體開發(fā)入門指南

九歌AI大模型 ? 2592瀏覽 ? 0回復(fù)
詳解RAG應(yīng)用開發(fā)幻覺檢測利器LettuceDetect?

51CTO內(nèi)容精選 ? 1133瀏覽 ? 0回復(fù)
AI 代理開發(fā)全攻略：從構(gòu)思到落地的實戰(zhàn)指南

Halo咯咯 ? 1262瀏覽 ? 0回復(fù)
AI 大模型應(yīng)用開發(fā)全攻略

玄姐聊AGI ? 1274瀏覽 ? 0回復(fù)
進階指南：如何讓你的AI應(yīng)用更強大、更持久？這17個RAG技巧助你把應(yīng)用做到極致

Halo咯咯 ? 737瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

告別“玩具” Agent！深度解析智能體框架，構(gòu)建真正可靠的 AI 應(yīng)用 15h前發(fā)布
Agent卡成PPT？6 大核彈級提速方案+一線大廠代碼級拆解 9天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： AI自動寫書神器，3個ChatGPT插件讓你輕松賺錢！

下一篇：基于知識圖譜的LangChain應(yīng)用實戰(zhàn)

社區(qū)精華內(nèi)容

目錄

<cite id="utjhw"></cite>

^{<sub id="utjhw"></sub>}

<sub id="utjhw"></sub>