自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了

輕薄滴假象

發(fā)布于 2024-6-7 12:50

瀏覽

0收藏

徐俊東，本文第一作者。本科畢業(yè)于倫敦大學學院（UCL），碩士就讀于新加坡國立大學（NUS）計算機系。主要研究方向為大語言模型的推理能力。

個人主頁：https://aiden0526.github.io/JundongXu/

不使用外部工具也能讓大語言模型（LLMs）實現嚴謹可信的推理，新國立提出 SymbCoT 推理框架：結合符號化邏輯（Symbolic Logical）表達式與思維鏈，極大提升推理質量，魯棒性與可信度。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

LLMs 已表現出強大的語義理解能力。但現有的 LLMs 在實行嚴密的邏輯符號推理方面還存在很大的不足，依然需要依賴不同的思維提示方法與外部的符號推理工具進行邏輯推理。如何能讓 LLMs 本身具備強大的符號邏輯推理能力，是目前讓 LLMs 變得更強大的重要研究方向。

最近，新加坡國立大學聯合加州大學圣芭芭拉分校與奧克蘭大學的研究人員共同提出全新的符號邏輯推理框架 SymbCoT（Symbolic Chain-of-Thought），在推理質量，魯棒性與可信度都要超越現有的方法。該工作已被 ACL 2024 錄用。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

論文：Faithful Logical Reasoning via Symbolic Chain-of-Thought
論文地址：https://arxiv.org/pdf/2405.18357.pdf
代碼地址：https://github.com/Aiden0526/SymbCoT

當前有效的邏輯推理方法還存在一些缺陷。比如說 CoT 在嚴密的邏輯推理過程中經常會產生邏輯謬誤。引入外部工具的方法，比如 Logic-LM，使用 LLM 來翻譯前提，然后使用外部推理工具如 Prover9 來進行邏輯推導，但這種方法在翻譯的過程中容易出現信息損失或翻譯錯誤導致外部推理工具無法執(zhí)行。

因此，作者提出 SymbCoT，一個既可以引入嚴密邏輯推理，又能避免翻譯造成的信息損失 / 錯誤導致外部推理工具失效的框架。通過實驗證明，SymbCoT 與直接提示，傳統(tǒng) CoT 和使用外部推理工具相比，SymbCoT 分別在三個復雜邏輯推理數據集上提升 22.08%、9.31% 和 7.88%。并且在復雜場景推理、可信度、魯棒性等方面優(yōu)于現有方法。

推特知名人工智能博主隨后轉發(fā)了這篇論文，認為這種方法有助于改進高級工作流程，構建更可靠和智能的 LLM AI 代理。該推文僅發(fā)布一天，已獲得 6w + 瀏覽量和超過 1200 + 點贊與收藏。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

A.SymbCoT 框架介紹

總體來說，SymbCoT 包含四個部分：

1. 翻譯：將邏輯推理任務中的前提與結論翻譯成對應的符號化表達。

2. 規(guī)劃：根據結合翻譯前后的自然語言與符號化表達，生成符合邏輯推理的計劃。

3. 執(zhí)行：嚴格按照對應的邏輯推理規(guī)則去驗證結論的邏輯正確性。

4. 驗證：驗證翻譯與執(zhí)行是否存在錯誤。通過對比翻譯前后的語義信息，去驗證翻譯過程中存在的錯誤并矯正，同時驗證執(zhí)行過程中是否存在不符合邏輯推理規(guī)則的步驟。

以下結合具體的使用示例進行介紹。

任務定義：

作者提出的 SymbCoT 來解決邏輯推理任務。該任務需要從一系列給定的前提中，判斷給定的聲明是否正確

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

翻譯：

首先，SymbCoT 中的翻譯模塊會將給定的前提 P，聲明 S，翻譯成對應的符號化表達 P' 和 S'

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

規(guī)劃：

結合翻譯前后的自然語言與符號化信息，規(guī)劃模塊會基于相關的邏輯規(guī)則去生成一個可執(zhí)行的邏輯推理計劃

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

執(zhí)行：

根據翻譯前后結合的信息，配合規(guī)劃模塊生成的執(zhí)行計劃，SymbCoT 會嚴密地遵守邏輯推理規(guī)則去執(zhí)行計劃，對聲明的正確性得出一個初步結論

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

驗證：

該模塊主要有兩個功能。第一：通過比對翻譯前后的語義信息，驗證翻譯中是否存在錯誤；第二：檢查執(zhí)行過程中的每一步是否遵守了嚴謹的邏輯規(guī)則。若任何一個步驟中存在錯誤，驗證模塊會更正發(fā)現的錯誤并給出正確的推理步驟與結果

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

B. 實驗結果

作者首先使用 First-order logic 的規(guī)則，在三個邏輯推理數據集上進行了測試。實驗證明 SymbCoT 在 GPT3.5-turbo 與 GPT-4 上均能大幅超越傳統(tǒng) CoT 的性能，甚至超越了使用外部工具的框架（Logic-LM）。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

為了驗證該框架的普適性，作者隨后使用 Constraint Optimization 符號表達的推理規(guī)則在另外兩個數據集上進行了測試。實驗證明使用不同的邏輯規(guī)則也能帶來更好的性能。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

復雜推理能力：

作者分析了不同方法在不同推理深度上的表現，發(fā)現隨著推理深度的增加，SymbCoT 相對于 CoT 的改進變得更加明顯，表明 SymbCoT 在處理更復雜問題上的優(yōu)勢。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

魯棒性：

作者比較了完全基于 LLM 的推理器與依賴外部解析器的方法（如 Logic-LM）在執(zhí)行符號表達式語法時的成功率，發(fā)現 SymbCoT 在語法執(zhí)行上的成功率顯著提高，展示了對語法錯誤的顯著魯棒性。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

可信的邏輯推理：

傳統(tǒng) CoT 在邏輯推理的時候有時候會基于錯誤的推理過程得到正確的答案，這種情況會誤導使用者從而造成不好的后果。SymbCoT 基于嚴密邏輯推理與驗證，有效消除了傳統(tǒng) CoT 中過程不可信的缺陷。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

符號與自然語言混合表達的優(yōu)勢：

作者分析了 LLM 從自然語言到符號語言的轉換過程中可能遺漏的關鍵信息或引入的不準確性，發(fā)現 SymbCoT 通過結合符號和自然語言表達來糾正翻譯錯誤并增強邏輯推理的有效性。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

不同 LLM 的影響：

作者還比較了 GPT-3.5 和 GPT-4 在三個 FOL 數據集上的表現，發(fā)現在升級模型后，SymbCoT 方法的性能提升最為顯著，強調了 SymbCoT 方法與更先進模型之間的協同效應。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力，開源框架SymbCoT來了-AI.x社區(qū)

總體來說，SymbCoT 是一個更準確、更可信且更魯棒的邏輯推理框架，適合用于要求復雜且精確的邏輯推理任務。

本文轉自機器之心，作者：機器之心

原文鏈接:??https://mp.weixin.qq.com/s/qYDBKHQmJg4TKXgwIoaapQ??

標簽

已于2024-6-7 12:51:39修改

贊

收藏

回復

舉報

回復

相關推薦

大模型推理框架RTP-LLM對LoRA的支持

wx5bbef785639a1 ? 3905瀏覽 ? 0回復
Transformer在復雜推理任務中的新進展：多步邏輯推理中的匹配策略

xuxiangda ? 4829瀏覽 ? 0回復
ACL 2024 | 提升大模型持續(xù)學習性能，哈工大、度小滿提出共享注意力框架SAPT

輕薄滴假象 ? 2570瀏覽 ? 0回復
ACL2024：一個開源的通用語言代理訓練框架LUMOS

AIGC最前線 ? 2564瀏覽 ? 0回復
T-Eval：大模型智能體能力評測基準解讀 | ACL 2024

戀戀青鳥 ? 3296瀏覽 ? 0回復
TOT(Tree of Thought) | 讓GPT-4像人類一樣思考

arnoldzhw ? 2448瀏覽 ? 0回復
從openAI最新模型GPT-o1再談思維鏈(Cot)技術，大模型該怎么提升其邏輯推理能力？

AI探索時代 ? 6436瀏覽 ? 0回復
突破大語言模型的邏輯瓶頸：Logic-of-Thought方法讓LLM更懂"推理" | 用外部數據增強大語言模型：RAG全面解

sbf_2000 ? 3553瀏覽 ? 0回復
Anthropic提出的Contextual RAG開源實現Open Contextual RAG來了

Syrupup ? 2230瀏覽 ? 0回復
StaR ｜用少量推理數據讓模型學會通用推理能力，顯著提升模型復雜推理

arnoldzhw ? 2789瀏覽 ? 0回復
使用MCTS顯著提升LLM在復雜任務的推理能力

arnoldzhw ? 5775瀏覽 ? 0回復
ACL2024 |解釋引導的大語言模型主動蒸餾：一種優(yōu)化知識轉移的創(chuàng)新框架 "ELAD"

arnoldzhw ? 2534瀏覽 ? 0回復
純研究O1的論文都發(fā)出來了，讓我想起來研究紅樓夢的紅學

熵減AI ? 1485瀏覽 ? 0回復
物理世界的原生推理能力、靈活性讓人驚掉下巴！

51CTO技術棧 ? 1562瀏覽 ? 0回復
挑戰(zhàn)LLM邏輯推理極限！新基準TEXTGAMES能否揭開大模型的短板？

sbf_2000 ? 1282瀏覽 ? 0回復
Java 版 Manus 實現來了，Spring AI Alibaba 發(fā)布開源 OpenManus 實現

玄姐聊AGI ? 1779瀏覽 ? 0回復
基于DeepSeek推理的文本聚類

51CTO內容精選 ? 940瀏覽 ? 0回復
ReSearch: 突破性強化學習框架實現大模型推理搜索能力無縫整合

頓數AI ? 1400瀏覽 ? 0回復
清華大學 | 強化學習是否激勵LLM中超越基本模型的推理能力？

柏企閱文 ? 433瀏覽 ? 0回復

輕薄滴假象

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

DeepSeek一口氣開源3個項目，還有梁文鋒親自參與，昨晚API大降價 2025-02-27 12:40:06發(fā)布
全球首個AI CUDA工程師來了！將PyTorch原生實現提速10-100倍 2025-02-21 13:20:31發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構設計深度剖析 & 使用 Spring AI + MCP 四步教你實現 Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：單個4090可推理，2000億稀疏大模型「天工MoE」開源

下一篇： Stability AI開源47秒音頻生成模型，蟲鳴鳥叫、搖滾、鼓點都能生成

社區(qū)精華內容

目錄

<em id="dkkam"><samp id="dkkam"></samp></em>

<blockquote id="dkkam"><delect id="dkkam"></delect></blockquote>