自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="pth4t"><rp id="pth4t"><form id="pth4t"></form></rp></cite>

<style id="pth4t"></style>

<sub id="pth4t"></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

一款好用的開源工具，高效實現(xiàn)Reranker 原創(chuàng)

發(fā)布于 2024-9-14 14:25

瀏覽

0收藏

Reranker 是任何檢索架構(RAG、Agent等)的重要組成部分，但它們通常也比PipeLine中其他部分更模糊。有時，甚至很難知道該使用哪一個。每個問題都是不同的，使用 X 的最佳模型不一定與使用 Y 的模型相同；新的重新排名方法不斷涌現(xiàn)，該如何兼容他們呢？今天介紹一款高效擴展工具rerankers：

設計目標

新的重新排名方法不斷涌現(xiàn)：例如，RankGPT 使用 LLM 對文檔進行重新排序，就在去年出現(xiàn)，取得了非常有希望的零樣本基準測試結果。

所有不同的重新排名方法往往都在自己的庫中完成，具有不同級別的文檔。這導致了更高的進入門檻。新用戶需要在多種不熟悉的輸入/輸出格式之間切換，所有這些格式都有自己的怪癖！

rerankers目標是：

??輕。它僅提供作為依賴項的基本必需品。
?? 易于理解。只需學習少數(shù)幾個calls，然后您可以使用提供的所有重新排名模型。
??易于集成。它應該適合幾乎任何現(xiàn)有的管道，只需幾行代碼！
??易于擴展。只需對代碼庫知之甚少，即可添加任何新的重新排名模型。您所需要的只是一個新類，其中包含一個將（query， [documents]）輸入映射到output.rank()
??易于調試。這是一個測試版，可能會有問題，但代碼庫的構思方式使大多數(shù)問題都應該易于跟蹤并盡快修復。

支持的模型

目前項目庫支持各類rerank模型：

? 任何標準的 SentenceTransformer 或 Transformers 交叉編碼器
? RankGPT （可通過原始 RankGPT 實現(xiàn)和改進的 RankLLM 實現(xiàn)獲得）
? 基于T5 的pointwise排名器（InRanker、MonoT5...）
? 基于LLM 的pointwise排名器（BAAI/bge-reranker-v2.5-gemma2-lightweight 等）
? Cohere、Jina、Voyage 和 MixedBread API 重新排名器
? FlashRank 重新排序器（ONNX 優(yōu)化模型，在 CPU 上非?？欤?/li>
? 基于 ColBERT 的 reranker - 不是最初為重新排序而設計的模型，但在某些情況下確實表現(xiàn)得相當強大。實現(xiàn)是輕量級的，僅基于 transformers。
??? RankLLM/RankZephyr：通過包裝 rank-llm 庫庫來支持！對 RankZephyr/RankVicuna 的支持未經測試，但 RankLLM + GPT 模型完全有效！

工具安裝

工具安裝比較簡單，一行即可：

# All transformers-based approaches (cross-encoders, t5, colbert)
pip install "rerankers[transformers]"


# API-based rerankers (Cohere, Jina, soon MixedBread)
pip install "rerankers[api]"


# FlashRank rerankers (ONNX-optimised, very fast on CPU)
pip install "rerankers[flashrank]"


# All of the above
pip install "rerankers[all]"

工具調用

模型加載

無論架構如何，都可以在一行中加載任何受支持的 reranker：

from rerankers import Reranker


# Cross-encoder default. You can specify a 'lang' parameter to load a multilingual version!
ranker = Reranker('cross-encoder')
# RankLLM with specified GPT models
ranker = Reranker('gpt-4-turbo', model_type="rankllm", api_key = API_KEY)


# ColBERTv2 reranker
ranker = Reranker("colbert")


# ... Or a non-default colbert model:
ranker = Reranker(model_name_or_path, model_type = "colbert")

Rerankers 將始終嘗試根據其名稱推斷您嘗試使用的模型，但如果可以，向其傳遞 ??model_type?? 參數(shù)總是更安全的！?

模型推理

無論加載了哪個 reranker，都使用加載的模型對 documents 的查詢進行排名，也支持異步調用：

results = ranker.rank(query="I love you", docs=["I hate you", "I really like you"], doc_ids=[0,1])
# 異步用法
results = await ranker.rank_async(query="I love you", docs=["I hate you", "I really like you"], doc_ids=[0,1])
results

result：

RankedResults(results=[
  Result(document=Document(text='I really like you', doc_id=1), score=-2.453125, rank=1), 
  Result(document=Document(text='I hate you', doc_id=0), score=-4.14453125, rank=2)], 
  query='I love you', has_scores=True)

所有 reranker 都將返回一個對象，這是一個 pydantic 對象，其中包含對象列表和一些其他有用信息，例如原始查詢。您可以通過運行：??RankedResults????Result????k????top_k()??

results.top_k(1)
# [Result(Document(doc_id=1, text='I really like you', metadata={}), score=0.26170814, rank=1)]

langchain中也能用，只需一行就可轉換：

compressor = ranker.as_langchain_compressor(k=3)

好啦，介紹到這里，更多用法等你去探索吧：

https://github.com/answerdotai/rerankers

本文轉載自公眾號哎呀AIYA

原文鏈接：??https://mp.weixin.qq.com/s/NrbqFRkOtOa8z3rt8c0KKw??

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

贊

收藏

回復

舉報

回復

相關推薦

LangFriend：一款能記住你的日記應用

ermulong ? 3182瀏覽 ? 0回復
推薦 7 款好用的內容管理系統(tǒng)（CMS）

z起點a ? 2413瀏覽 ? 0回復
史上最丑AI生圖一夜爆火！又一款妙鴨級爆品來了？

duhorse ? 3289瀏覽 ? 0回復
神器Pandas AI: 一款智能做數(shù)據分析的工具！

開發(fā)者阿橙 ? 4127瀏覽 ? 0回復
六款超火的AI繪圖軟件推薦！總有一款AI適合你！

行走的小非 ? 6906瀏覽 ? 0回復
做一款AI社交應用，項目牽頭人應該忙什么？

51CTO技術棧 ? 2318瀏覽 ? 0回復
Lumina-T2X: 一款集成圖像、視頻、音頻和3D生成的多模態(tài)擴散模型

sword_hero ? 2617瀏覽 ? 0回復
一款由知識圖譜引擎驅動的創(chuàng)新Agent框架

探索AGI ? 2864瀏覽 ? 0回復
Pandas AI: 一款可以智能做數(shù)據分析的工具！

Halo咯咯 ? 3014瀏覽 ? 0回復
Fooocus：一款開箱即用的圖片生成軟件

sword_hero ? 2936瀏覽 ? 0回復
DeepSeek AI發(fā)布Janus：一款擁有圖像生成能力的1.3B多模態(tài)模型

Halo咯咯 ? 5515瀏覽 ? 0回復
開發(fā)一款大模型需要經過哪些步驟？開發(fā)一款大模型的完整流程

AI探索時代 ? 3493瀏覽 ? 0回復
TextIn：一款優(yōu)秀的文檔解析神器，提升RAG性能必備

恰似驚鴻 ? 3629瀏覽 ? 0回復
如何借助 kimiChat 創(chuàng)造好用的提示詞？一招教會你

wsp_ping ? 2025瀏覽 ? 0回復
2025年企業(yè)必備的25款AI工具

Halo咯咯 ? 4739瀏覽 ? 0回復
如何運用DeepSeek R1構建一款全棧簡歷篩選應用

51CTO內容精選 ? 2453瀏覽 ? 0回復
GPT?4.5發(fā)布：一款迄今為止最大、最貴的模型

Halo咯咯 ? 2181瀏覽 ? 0回復
Cursor 們搞定開發(fā)， 8 款 AI 測試工具助你打造高效研發(fā)閉環(huán)！

凝固的雨_1 ? 1735瀏覽 ? 0回復
有一款神器！深入探索Transformer語言模型的可視化工具BertViz

智駐未來 ? 774瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

LLM-R：基于RAG和層次化Agent落地案例解析 2024-11-15 09:58:18發(fā)布
TextIn：一款優(yōu)秀的文檔解析神器，提升RAG性能必備 2024-11-13 09:10:07發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：支持大模型流式輸出的JSON提取工具

下一篇： RAG高級優(yōu)化：一文看盡Query的轉換之路

社區(qū)精華內容

目錄

<style id="7rk83"><li id="7rk83"></li></style>