自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

GPT-4等大模型自己制作工具,識別ChatGPT造假

人工智能 新聞
本周的重要論文包括大模型迎來進化轉(zhuǎn)折點,不只使用而且會自己制作工具了;北大、華為的研究者們提出的識別各式 AI 生成語料的可靠文本檢測器。

目錄:

  1. Multiscale Positive-Unlabeled Detection of AI-Generated Texts
  2. Towards Revealing the Mystery behind Chain of Thought: a Theoretical Perspective
  3. Large Language Models as Tool Makers
  4. SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification
  5. Cheap and Quick: Efficient Vision-Language Instruction Tuning for Large Language Models
  6. mPLUG-2: A Modularized Multi-modal Foundation Model Across Text, Image and Video
  7. Where to Go Next for Recommender Systems? ID- vs. Modality-based Recommender Models Revisited

論文 1:Multiscale Positive-Unlabeled Detection of AI-Generated Texts

  • 作者:Yuchuan Tian, Hanting Chen 等
  • 論文地址:https://arxiv.org/abs/2305.18149

摘要:AI 造假的成功率很高,前幾天「10 分鐘騙 430 萬」還上了熱搜。在最熱門的大語言模型上,北大、華為的研究者們最近探索了一種識別方法。如下列舉了幾個人和 AI 分別對同一問題做出回答的例子:

圖片

推薦:識別「ChatGPT 造假」,效果超越 OpenAI:北大、華為的 AI 生成檢測器來了

論文 2:Towards Revealing the Mystery behind Chain of Thought: a Theoretical Perspective

  • 作者:Guhao Feng、Bohang Zhang 等
  • 論文地址:https://arxiv.org/abs/2305.15408

摘要:思維鏈提示(CoT)是大模型涌現(xiàn)中最神秘的現(xiàn)象之一,尤其在解決數(shù)學推理和決策問題中取得了驚艷效果。CoT 到底有多重要呢?它背后成功的機制是什么?本文中,北大的幾位研究者證明了 CoT 在實現(xiàn)大語言模型(LLM)推理中是不可或缺的,并從理論和實驗角度揭示了 CoT 如何釋放 LLM 的巨大潛力。

本文選取了兩個非?;A但核心的數(shù)學任務:算術(shù)和方程(下圖給出了這兩個任務的輸入輸出示例)

圖片

推薦:思維鏈如何釋放語言模型的隱藏能力?最新理論研究揭示其背后奧秘

論文 3:Large Language Models as Tool Makers

  • 作者:Tianle Cai、 Xuezhi Wang 等
  • 論文地址:https://arxiv.org/pdf/2305.17126.pdf

摘要:受到制造工具對人類重要性的啟發(fā),在本文中,Google Deepmind、普林斯頓和斯坦福大學的研究者將這種「進化」的概念應用于 LLM 領(lǐng)域,進行了初步探索。他們提出了一個閉環(huán)框架,在這個框架中 LLM 作為工具制作者(LLMs As Tool Makers ,LATM),使其能夠生成自己的可重新使用的工具來處理新任務。

圖片

推薦:GPT-4 等大模型迎來進化轉(zhuǎn)折點:不只是使用,還會自己制作工具了

論文 4:SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification

  • 作者:Xupeng Miao、Gabriele Oliaro 等
  • 論文地址:https://arxiv.org/abs/2305.09781

摘要:近日,來自卡耐基梅隆大學(CMU)的 Catalyst Group 團隊發(fā)布了一款「投機式推理」引擎 SpecInfer,可以借助輕量化的小模型來幫助大模型,在完全不影響生成內(nèi)容準確度的情況下,實現(xiàn)兩到三倍的推理加速。

圖片

推薦:LLM 推理提速 2.8 倍,CMU 清華姚班校友提出「投機式推理」引擎 SpecInfer,小模型撬動大模型高效推理

論文 5:Cheap and Quick: Efficient Vision-Language Instruction Tuning for Large Language Models

  • 作者:Gen Luo、 Yiyi Zhou 等
  • 論文地址:https://arxiv.org/pdf/2305.15023.pdf

摘要:本文提出了一種新穎且經(jīng)濟實惠的解決方案,用于有效地將 LLMs 適應到 VL(視覺語言)任務中,稱為 MMA。MMA 不使用大型神經(jīng)網(wǎng)絡來連接圖像編碼器和 LLM,而是采用輕量級模塊,即適配器,來彌合 LLMs 和 VL 任務之間的差距,同時也實現(xiàn)了圖像模型和語言模型的聯(lián)合優(yōu)化。同時,MMA 還配備了一種路由算法,可以幫助 LLM 在不損害其自然語言理解能力的情況下,在單模態(tài)和多模態(tài)指令之間實現(xiàn)自動切換。

圖片

推薦:訓練時間減少 71.4%,存儲成本節(jié)省 99.9%,廈大指令調(diào)優(yōu)新方案 MMA 讓羊駝模型實現(xiàn)多模態(tài)

論文 6:mPLUG-2: A Modularized Multi-modal Foundation Model Across Text, Image and Video

  • 作者:Haiyang Xu、 Qinghao Ye 等
  • 論文地址:https://arxiv.org/pdf/2302.00402.pdf

摘要:對于多模態(tài)基礎模型,我們希望其不僅可以處理特定的多模態(tài)相關(guān)任務,還希望其處理單模態(tài)任務時也具有優(yōu)異的性能。阿?達摩院團隊發(fā)現(xiàn)現(xiàn)有的模型往往不能很好的平衡模態(tài)協(xié)作和模態(tài)糾纏的問題,這限制了模型在各種單模態(tài)和跨模態(tài)下游任務的性能。

基于此,達摩院的研究者提出了 mPLUG-2,其通過模塊化的?絡結(jié)構(gòu)設計來平衡多模態(tài)之間的協(xié)作和糾纏問題,mPLUG-2 在 30 + 多 / 單模態(tài)任務,取得同等數(shù)據(jù)量和模型規(guī)模 SOTA 或者 Comparable 效果,在 VideoQA 和 VideoCaption 上超越 Flamingo、VideoCoca、GITv2 等超?模型取得絕對 SOTA。此外,mPLUG-Owl 是阿?巴巴達摩院 mPLUG 系列的最新工作,延續(xù)了 mPLUG 系列的模塊化訓練思想,把 LLM 升級為?個多模態(tài)?模型。mPLUG-2 的研究論文已被 ICML 2023 接收。

圖片

推薦:ICML 2023 | 基于模塊化思想,阿里達摩院提出多模態(tài)基礎模型 mPLUG-2

論文 7:Where to Go Next for Recommender Systems? ID- vs. Modality-based Recommender Models Revisited

  • 作者:Zheng Yuan、Fajie Yuan 等
  • 論文地址:https://arxiv.org/abs/2303.13835

摘要:本文調(diào)查了一個富有潛力的問題,即多模態(tài)推薦系統(tǒng) MoRec 是否有望終結(jié) IDRec 在推薦系統(tǒng)領(lǐng)域長達 10 年的主導地位,基于此,論文進行了深入研究。相關(guān)成果已被 SIGIR 2023 接收。下圖為網(wǎng)絡架構(gòu)。

圖片

推薦:SIGIR 2023 | 推薦系統(tǒng)何去何從,經(jīng)典 ID 范式要被顛覆?

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2023-05-30 14:18:00

工具模型

2023-06-08 08:09:43

2023-10-11 13:09:52

訓練模型

2023-08-04 13:28:20

GPT代碼用戶

2023-05-08 12:47:48

IBM模型

2023-06-19 08:19:50

2023-05-30 13:29:25

2023-12-26 08:17:23

微軟GPT-4

2023-03-15 07:49:57

GPT-4ChatGPT

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2023-04-28 15:27:06

微軟模型

2023-11-24 09:00:00

2025-04-16 09:35:03

2023-06-14 14:57:38

模型AI

2024-12-25 20:01:13

2023-05-31 14:23:44

人工智能

2023-12-04 12:56:08

AI數(shù)據(jù)

2023-04-09 16:17:05

ChatGPT人工智能

2023-05-29 09:29:52

GPT-4語言模型

2023-05-08 07:53:12

GPT-4代碼
點贊
收藏

51CTO技術(shù)棧公眾號