自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="cfqkw"></cite>

<sub id="cfqkw"></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

微軟研究院新突破：如何讓AI在專業(yè)領(lǐng)域更靠譜？原創(chuàng)

發(fā)布于 2024-11-5 13:45

瀏覽

0收藏

01、概述

在人工智能的世界里，大型語言模型（LLMs）就像是瑞士軍刀，多才多藝，幾乎無所不能。但是，當它們遇到需要特定領(lǐng)域知識的任務(wù)時，比如醫(yī)療保健、法律和金融，這些萬能的模型就顯得有些力不從心了。這是為什么呢？因為它們在訓(xùn)練時使用的數(shù)據(jù)集往往缺乏最新的專業(yè)信息，導(dǎo)致它們在回答專業(yè)問題時可能會“幻覺”——也就是說，給出的答案可能不準確，甚至是錯誤的。

問題的根源

LLMs在處理一般知識時表現(xiàn)出色，但當涉及到專業(yè)或時效性查詢時，它們的表現(xiàn)就不盡如人意了。這是因為大多數(shù)模型都是在靜態(tài)數(shù)據(jù)上訓(xùn)練的，它們的知識庫無法隨時更新。想象一下，一個醫(yī)療AI模型如果不能訪問最新的醫(yī)療指南，它又怎么能提供準確的醫(yī)療建議呢？

當前解決方案：微調(diào)和RAG

為了解決這個問題，研究人員嘗試了多種方法，其中之一就是微調(diào)。微調(diào)可以讓模型在特定領(lǐng)域的數(shù)據(jù)上重新訓(xùn)練，使其更好地適應(yīng)特定任務(wù)。但這種方法既耗時又需要大量的訓(xùn)練數(shù)據(jù)，而且可能會導(dǎo)致模型過于專業(yè)化，反而在一般查詢上表現(xiàn)不佳。

另一種方法是檢索增強生成（RAG），它允許模型在生成答案的過程中實時檢索外部數(shù)據(jù)。這種方法更靈活，可以提高模型的準確性和相關(guān)性。但RAG也有它的挑戰(zhàn)，比如如何處理非結(jié)構(gòu)化數(shù)據(jù)，比如文本、圖像和表格等。

02、微軟研究院的新方法

微軟亞洲研究院的研究人員提出了一種新的方法，他們將用戶查詢分為四個不同的級別：明確事實、隱含事實、可解釋理由和隱藏理由。這種分類有助于定制模型檢索和處理數(shù)據(jù)的方法，確保它為特定任務(wù)選擇最相關(guān)的信息。

微軟研究院新突破：如何讓AI在專業(yè)領(lǐng)域更靠譜？-AI.x社區(qū)

四個查詢級別

明確事實：比如“法國的首都是哪里？”這樣的問題，答案可以直接從外部數(shù)據(jù)中檢索得到。
隱含事實：需要更多的推理，比如結(jié)合多條信息來推斷結(jié)論。
可解釋理由：涉及特定領(lǐng)域的指南。
隱藏理由：需要深入推理，通常涉及抽象概念。

方法的優(yōu)勢

這種方法使LLMs能夠區(qū)分這些查詢類型，并應(yīng)用適當級別的推理。例如，在沒有明確答案的隱藏理由查詢中，模型可以推斷模式并使用特定領(lǐng)域的推理方法生成回答。這樣，模型在檢索所需信息和提供準確、基于上下文的回答方面變得更加高效。

微軟研究院新突破：如何讓AI在專業(yè)領(lǐng)域更靠譜？-AI.x社區(qū)

實踐成果

研究還突出了這種方法的顯著成果。在醫(yī)療保健和法律分析等專業(yè)領(lǐng)域，模型的性能顯著提高。例如，在醫(yī)療保健應(yīng)用中，模型將幻覺率降低了高達40%，提供了更加可靠和有根據(jù)的回答。在法律系統(tǒng)中，模型在處理復(fù)雜文檔和提供詳細分析方面的準確性提高了35%。

微軟研究院新突破：如何讓AI在專業(yè)領(lǐng)域更靠譜？-AI.x社區(qū)

微軟研究院新突破：如何讓AI在專業(yè)領(lǐng)域更靠譜？-AI.x社區(qū)

03、結(jié)語

這項研究為在專業(yè)領(lǐng)域部署LLMs的一個基本問題提供了關(guān)鍵的解決方案。通過引入一個基于復(fù)雜性和類型的查詢分類系統(tǒng)，微軟研究院的研究人員開發(fā)了一種方法，提高了LLMs輸出的準確性和可解釋性。這個框架使LLMs能夠檢索最相關(guān)的外部數(shù)據(jù)，并有效地將其應(yīng)用于特定領(lǐng)域的查詢，減少幻覺并提高整體性能。研究表明，使用結(jié)構(gòu)化查詢分類可以提高高達40%的結(jié)果，這是AI驅(qū)動系統(tǒng)向前邁出的重要一步。通過解決數(shù)據(jù)檢索問題和整合外部知識，這項研究為各種行業(yè)的更可靠和強大的LLM應(yīng)用鋪平了道路。

參考：

??https://arxiv.org/abs/2409.14924??

?

本文轉(zhuǎn)載自公眾號Halo咯咯作者：基咯咯

原文鏈接：??https://mp.weixin.qq.com/s/MFoIr9D6laBRwPruC6cFuA???

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責任

標簽

大型語言模型

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

揭秘多模態(tài)：人工智能領(lǐng)域的新突破

sword_hero ? 3000瀏覽 ? 0回復(fù)
斯坦福新研究：RAG能幫助LLM更靠譜嗎？

duhorse ? 2324瀏覽 ? 0回復(fù)
微軟研究院MRP：大模型動態(tài)選擇最佳解題策略的元推理提示，比CoT、ToT更有效

PaperAgent ? 3695瀏覽 ? 0回復(fù)
微軟研究院發(fā)布無代碼開發(fā)工具 AUTOGEN STUDIO，簡化多智能體系統(tǒng)的構(gòu)建與調(diào)試

xuxiangda ? 4702瀏覽 ? 0回復(fù)
Agent的進化：RAISE如何讓AI更聰明？

探索AGI ? 2448瀏覽 ? 0回復(fù)
OpenAI 發(fā)布新模型 o1，能夠推理復(fù)雜任務(wù)，在科學(xué)、編程和數(shù)學(xué)等領(lǐng)域更牛

AI洞察Insight ? 2221瀏覽 ? 0回復(fù)
人工智能的新突破：StructRAG框架如何讓大型語言模型更聰明？

Halo咯咯 ? 2776瀏覽 ? 0回復(fù)
微軟研究院推出的MarS：生成基礎(chǔ)模型時代的統(tǒng)一金融市場模擬引擎

Halo咯咯 ? 3637瀏覽 ? 0回復(fù)
字節(jié)跳動AI研究院發(fā)布FullStack Bench和SandboxFusion：用于評估真實編程場景中LLM的綜合基準測試工具

Halo咯咯 ? 2436瀏覽 ? 0回復(fù)
智源研究院等提出NOVA：邁向統(tǒng)一的多任務(wù)大模型

angel ? 1892瀏覽 ? 0回復(fù)
微軟人工智能研究院推出 OLA-VLM：一種以視覺為中心的優(yōu)化多模態(tài)大型語言模型的方法

Halo咯咯 ? 2324瀏覽 ? 0回復(fù)
微軟亞洲研究院2025六大預(yù)測：AI Agents 將顛覆傳統(tǒng)工作模式

AIGC新知 ? 1874瀏覽 ? 0回復(fù)
阿里巴巴AI研究院發(fā)布CosyVoice 2：改進的流式語音合成模型

Halo咯咯 ? 3429瀏覽 ? 0回復(fù)
大模型生成內(nèi)容靠譜嗎？CRAAP測試告訴你

云原生AI百寶箱 ? 1947瀏覽 ? 0回復(fù)
當 AI 學(xué)會 25 種語言：達摩院 Babel 如何讓全球 90% 人口共享智能紅利？

Halo咯咯 ? 1523瀏覽 ? 0回復(fù)
面向疾病管理的對話式人工智能 - Google研究院&DeepMind

知識圖譜科技 ? 1362瀏覽 ? 0回復(fù)
如何讓AI自己學(xué)會更公平地打分？

石映飛云 ? 1175瀏覽 ? 0回復(fù)
微軟亞洲研究院打造最強視覺元素定位模型

大語言模型論文跟蹤 ? 528瀏覽 ? 0回復(fù)
進階指南：如何讓你的AI應(yīng)用更強大、更持久？這17個RAG技巧助你把應(yīng)用做到極致

Halo咯咯 ? 737瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

數(shù)學(xué)推理的 AI 新突破：NVIDIA 的 OpenMath-Nemotron 系列震撼登場！ 6h前發(fā)布
從簡單計數(shù)到多模態(tài)：嵌入技術(shù)的演變與應(yīng)用 6h前發(fā)布

熱門推薦

2025年最值得關(guān)注的十大多模態(tài)大語言模型！ 0回復(fù)

GPT-4.1系列深度解析：從代碼到動畫，從理論到實戰(zhàn)，AI的多面手來了！ 0回復(fù)

清華發(fā)布GLM 4！32B參數(shù)模型硬剛GPT-4o，性能驚艷 0回復(fù)

Google介紹了Agent2Agent（A2A）：一種新的開放協(xié)議，允許AI代理在生態(tài)系統(tǒng)中安全地合作 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

上一篇：【值得收藏】生成式人工智能在搜索引擎優(yōu)化（SEO）中的應(yīng)用

下一篇：大型語言模型在醫(yī)學(xué)領(lǐng)域的應(yīng)用：探究Med-PaLM

社區(qū)精華內(nèi)容

目錄