自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="tiej0"><track id="tiej0"></track></cite>

<legend id="tiej0"><track id="tiej0"></track></legend>

<sub id="tiej0"></sub>

<sub id="tiej0"></sub>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

OpenAI在RAG技術(shù)上的最佳實(shí)踐與策略原創(chuàng)

發(fā)布于 2024-7-10 07:01

瀏覽

0收藏

隨著人工智能技術(shù)的不斷演進(jìn)，大型語(yǔ)言模型（LLM）的性能優(yōu)化已成為AI領(lǐng)域的熱點(diǎn)問(wèn)題。OpenAI的技術(shù)專家團(tuán)隊(duì)分享了他們?cè)跈z索增強(qiáng)生成（RAG）技術(shù)、提示工程和微調(diào)方面的最佳實(shí)踐，為提升模型性能提供了寶貴的經(jīng)驗(yàn)和策略。

OpenAI在RAG技術(shù)上的最佳實(shí)踐與策略 -AI.x社區(qū)

一、微調(diào)技術(shù)的最新進(jìn)展

John Allard深入介紹了OpenAI在微調(diào)領(lǐng)域的最新進(jìn)展，包括：

函數(shù)調(diào)用數(shù)據(jù)的微調(diào)：通過(guò)特定數(shù)據(jù)集的微調(diào)，優(yōu)化模型對(duì)特定函數(shù)調(diào)用的理解。
持續(xù)微調(diào)：提供了一種機(jī)制，允許模型隨著時(shí)間的推移不斷適應(yīng)新數(shù)據(jù)。
平臺(tái)內(nèi)全UI微調(diào)：通過(guò)用戶界面的直接操作，簡(jiǎn)化了微調(diào)過(guò)程，提高了效率。

二、優(yōu)化LLM性能的挑戰(zhàn)

Colin細(xì)致討論了優(yōu)化大型語(yǔ)言模型的挑戰(zhàn)，包括：

信號(hào)與噪聲的分離：在大量數(shù)據(jù)中識(shí)別有效信號(hào)，濾除干擾噪聲。
性能衡量的復(fù)雜性：確立合理的性能評(píng)估標(biāo)準(zhǔn)，確保模型優(yōu)化方向的正確性。
解決問(wèn)題的策略選擇：面對(duì)多種可能的解決方案，如何做出最合適的選擇。

三、RAG技術(shù)的應(yīng)用與案例分析

RAG技術(shù)通過(guò)結(jié)合Embeddings技術(shù)和向量數(shù)據(jù)庫(kù)，顯著提升了信息檢索的效率和準(zhǔn)確性。案例分析包括：

客戶需求1：

OpenAI在RAG技術(shù)上的最佳實(shí)踐與策略 -AI.x社區(qū)

問(wèn)題描述：基于大量文檔的知識(shí)檢索需求，要求模型僅從這些文檔中檢索信息。
解決方案：

直接將PDF和docx文件嵌入，準(zhǔn)確率是45%。
2. 經(jīng)過(guò)20次調(diào)優(yōu)迭代，解決細(xì)節(jié)小Bug - 準(zhǔn)確率到65%
3. 基于規(guī)則進(jìn)行優(yōu)化，譬如先判斷問(wèn)題屬于什么領(lǐng)域（退一步思考），然后再回答，效果提升到85%
4. 發(fā)現(xiàn)數(shù)據(jù)里有一些是結(jié)構(gòu)化數(shù)據(jù)（如表格），為此定制提取解決，準(zhǔn)確率提升到98%
總結(jié)：通過(guò)直接嵌入文件、迭代調(diào)優(yōu)、規(guī)則優(yōu)化和結(jié)構(gòu)化數(shù)據(jù)的定制提取，逐步提升檢索準(zhǔn)確率。

客戶需求2：

問(wèn)題描述：文本生成SQL的需求，即根據(jù)自然語(yǔ)言問(wèn)題和數(shù)據(jù)庫(kù)模式生成正確的SQL查詢。
解決方案：

首先，我們用最簡(jiǎn)單的方法，比如余弦相似性，尋找類似問(wèn)題的SQL查詢，進(jìn)行問(wèn)題相似性搜索。我們測(cè)試了不同的嵌入和提示工程，但結(jié)果不太好。后來(lái)，我們意識(shí)到不同的數(shù)據(jù)庫(kù)模式對(duì)問(wèn)題的答案可能完全不同。
所以針對(duì)一個(gè)問(wèn)題進(jìn)行相似性搜索意義不大，但用預(yù)設(shè)答案進(jìn)行搜索可能效果更好。我們使用預(yù)設(shè)的文檔嵌入，生成一個(gè)假設(shè)的SQL查詢進(jìn)行相似性搜索，性能大大提升。對(duì)于這個(gè)特定問(wèn)題，我們嘗試了上下文檢索通過(guò)簡(jiǎn)單過(guò)濾將問(wèn)題按難度排名，只帶回同等難度的例子，這帶來(lái)了改進(jìn)。
我們還嘗試了一些先進(jìn)技術(shù)，比如鏈?zhǔn)酵评恚屜到y(tǒng)識(shí)別列、表，最后構(gòu)建查詢。但我們決定采用更簡(jiǎn)單的方法進(jìn)行自我一致性檢查，讓系統(tǒng)構(gòu)建查詢并運(yùn)行，出錯(cuò)時(shí)給出提示，再次嘗試。

OpenAI在RAG技術(shù)上的最佳實(shí)踐與策略 -AI.x社區(qū)

我們從69%開(kāi)始，然后添加了一些示例，得到了幾個(gè)改進(jìn)點(diǎn)，這表明RAG可以進(jìn)一步改進(jìn)。我們嘗試這個(gè)問(wèn)題，看到性能提升了3%，然后使用答案，假設(shè)的文檔嵌入使我們進(jìn)一步提升了5%。
我們決定試試微調(diào)，看能否更進(jìn)一步。先建立了我們的基線，與上圖里的69%基線一樣，使用簡(jiǎn)單的提示工程技術(shù)。然后，用簡(jiǎn)單的提示工程對(duì)GPT-4進(jìn)行微調(diào)，結(jié)果模型準(zhǔn)確率提升到接近82%。
再稍微調(diào)整模型使用um rag技術(shù)，把一些示例動(dòng)態(tài)注入上下文窗口，準(zhǔn)確率達(dá)到83.5%。這些都很簡(jiǎn)單，沒(méi)有復(fù)雜的數(shù)據(jù)預(yù)處理或后處理。結(jié)果顯示簡(jiǎn)單的微調(diào)和提示工程也能接近最先進(jìn)的技術(shù)。

OpenAI在RAG技術(shù)上的最佳實(shí)踐與策略 -AI.x社區(qū)

總結(jié)：采用問(wèn)題相似性搜索、預(yù)設(shè)答案搜索、上下文檢索和鏈?zhǔn)酵评淼确椒ǎ行嵘樵兩傻男阅堋?/p>

四、評(píng)估和優(yōu)化RAG系統(tǒng)的方法

John和Colin評(píng)估和優(yōu)化RAG系統(tǒng)的方法，強(qiáng)調(diào)了數(shù)據(jù)質(zhì)量的重要性，提出了評(píng)估RAG系統(tǒng)的多個(gè)維度：

模型測(cè)試分?jǐn)?shù)：評(píng)估模型在特定任務(wù)上的表現(xiàn)。
檢索相關(guān)性：衡量檢索到的內(nèi)容與問(wèn)題的相關(guān)程度。
生成內(nèi)容的準(zhǔn)確性：評(píng)估生成答案的事實(shí)準(zhǔn)確性。
檢索內(nèi)容的信號(hào)與噪聲比：評(píng)估檢索到的信息的有用性。

OpenAI在RAG技術(shù)上的最佳實(shí)踐與策略 -AI.x社區(qū)

五、實(shí)戰(zhàn)指導(dǎo)參考流程

優(yōu)化LLM性能并不總是線性的，有時(shí)需要結(jié)合使用提示工程、RAG和微調(diào)。當(dāng)你想提高語(yǔ)言模型（LM）的性能時(shí)，可以參考如下順序調(diào)優(yōu)。

提示工程技術(shù)：作為開(kāi)始的好地方，技術(shù)投資小，能夠快速迭代，驗(yàn)證解決問(wèn)題的可行性。
RAG技術(shù)：私有化、數(shù)據(jù)安全考慮時(shí)使用，增加允許模型訪問(wèn)特定領(lǐng)域的內(nèi)容，提升專業(yè)知識(shí)檢索能力。
微調(diào)技術(shù)：還需進(jìn)一步提升系統(tǒng)準(zhǔn)確率，強(qiáng)化模型遵循一致指令的能力，提升特定領(lǐng)域的專業(yè)性使用。
預(yù)訓(xùn)練：成本最高，如果不是特殊要求一般不建議采用?

總結(jié)：

這次的分享不僅展示了提高大型語(yǔ)言模型性能的多種技術(shù)手段，也強(qiáng)調(diào)了在實(shí)際應(yīng)用中根據(jù)業(yè)務(wù)場(chǎng)景靈活選擇和組合技術(shù)的重要性。通過(guò)深入理解和應(yīng)用這些策略，我們可以更有效地優(yōu)化AI模型，推動(dòng)AI技術(shù)的發(fā)展和應(yīng)用。

本文轉(zhuǎn)載自公眾號(hào)頂層架構(gòu)領(lǐng)域

原文鏈接：??https://mp.weixin.qq.com/s/pJk695aJUkR4g-tXwaiJaA??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

【乘風(fēng)進(jìn)階學(xué)習(xí)季】夏日初長(zhǎng)，乘風(fēng)而上，碼出未來(lái)！

AI.x社區(qū)官方賬號(hào) ? 52.9w瀏覽 ? 36回復(fù)
LLM-based Agent在B端商業(yè)化的技術(shù)探索與實(shí)踐

51CTO技術(shù)棧 ? 3099瀏覽 ? 0回復(fù)
RAG技術(shù)性能提升之文檔分塊策略方案

AIGC觀察者 ? 4757瀏覽 ? 0回復(fù)
Unstructured專家分享RAG應(yīng)用中文檔分塊（Chunking）的最佳實(shí)踐

Syrupup ? 4242瀏覽 ? 0回復(fù)
LLM 剪枝+蒸餾：NVIDIA 的最佳實(shí)踐

amei2000go ? 3717瀏覽 ? 0回復(fù)
放棄折騰，AutoRAG一鍵鎖定最佳RAG技術(shù)棧！

PaperAgent ? 2433瀏覽 ? 0回復(fù)
多模態(tài)RAG-VisRAG：基于視覺(jué)的檢索增強(qiáng)生成在多模態(tài)文檔上的應(yīng)用

大模型自然語(yǔ)言處理 ? 2419瀏覽 ? 0回復(fù)
RAG工作流哪種組合效果最佳？深入探究RAG領(lǐng)域最佳實(shí)踐

AI博物院 ? 1888瀏覽 ? 0回復(fù)
RAG工作流哪種組合效果最佳？深入探究RAG領(lǐng)域最佳實(shí)踐

AI博物院 ? 3417瀏覽 ? 0回復(fù)
大語(yǔ)言模型評(píng)測(cè)中的評(píng)價(jià)指標(biāo)：方法、基準(zhǔn)和最佳實(shí)踐

芝士AI吃魚 ? 7816瀏覽 ? 0回復(fù)
商業(yè)化大前端在性能優(yōu)化領(lǐng)域的探索與實(shí)踐

快手技術(shù) ? 1845瀏覽 ? 0回復(fù)
解鎖Agentic RAG，使用LangChain和OpenAI進(jìn)行實(shí)踐

小虎哦哦 ? 2876瀏覽 ? 0回復(fù)
分享3點(diǎn)關(guān)于AI 產(chǎn)品管理的最佳實(shí)踐

zhishan15 ? 1774瀏覽 ? 0回復(fù)
RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略

zhishan15 ? 1863瀏覽 ? 0回復(fù)
大規(guī)模相似性搜索：原理、技術(shù)與 Faiss 實(shí)踐

柏企閱文 ? 2181瀏覽 ? 0回復(fù)
2025年大模型與Transformer架構(gòu)：技術(shù)前沿與未來(lái)趨勢(shì)報(bào)告

歐米伽未來(lái)研究所 ? 6056瀏覽 ? 0回復(fù)
基于代理知識(shí)蒸餾技術(shù)克服文檔提取和RAG策略失敗問(wèn)題?

51CTO內(nèi)容精選 ? 1015瀏覽 ? 0回復(fù)
18種RAG技術(shù)大比拼：誰(shuí)才是檢索增強(qiáng)生成的最佳選擇？

Halo咯咯 ? 1473瀏覽 ? 0回復(fù)
Anthropic開(kāi)源Agentic Coding最佳實(shí)踐！

探索AGI ? 629瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Label Studio 數(shù)據(jù)標(biāo)注工具詳解 2024-08-28 07:25:43發(fā)布
Easy-RAG 一個(gè)適合學(xué)習(xí)、使用、自主擴(kuò)展的檢索增強(qiáng)生成系統(tǒng) 2024-08-21 16:33:57發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開(kāi)發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲(chóng)神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： AI大模型技術(shù)的四大核心架構(gòu)演進(jìn)之路

下一篇：提升RAG系統(tǒng)性能10條策略建議

社區(qū)精華內(nèi)容

目錄