自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

還沒排上SearchGPT?比Perplexity更好用的國產(chǎn)開源平替了解一下?

人工智能 新聞
有一款國產(chǎn)的開源平替,在和能聯(lián)網(wǎng)的 ChatGPT 和專攻 AI 搜索引擎的 Perplexity.ai 的 PK 中,它的回答在深度、廣度和準(zhǔn)確度方面都都秒了這兩款明星產(chǎn)品。

有 AI 在的科技圈,似乎沒有中場休息。除了大模型發(fā)布不斷,各家科技大廠也在尋找著第一個「殺手級」AI 應(yīng)用的落腳之地。

OpenAI 首先瞄準(zhǔn)的是谷歌 1750 億美元的搜索業(yè)務(wù)市場。7 月 25 日,OpenAI 帶著 AI 搜索引擎——SearchGPT 高調(diào)入場。在演示 demo 中,搜索引擎的使用體驗不再像以往一樣,需要我們逐個點開網(wǎng)頁鏈接,判斷信息有沒有用。SearchGPT 像端上了一桌精美的套餐,所有答案都幫你總結(jié)好了。

圖片

在演示 demo 中,SearchGPT 分析了在應(yīng)季最適合種植哪種品種的番茄。

不過,鑒于年初發(fā)布的 Sora 到目前都還未正式開放,估計很多人排上 SearchGPT 的體驗名額也遙遙無期。

然而,有一款國產(chǎn)的開源平替,在和能聯(lián)網(wǎng)的 ChatGPT 和專攻 AI 搜索引擎的 Perplexity.ai 的 PK 中,它的回答在深度、廣度和準(zhǔn)確度方面都都秒了這兩款明星產(chǎn)品。

它甚至可以在不到 3 分鐘內(nèi)收集并整合 300 多頁相關(guān)信息。這換成人類專家,需要大約 3 小時才能做完。

圖片

這款「國貨」就是多智能體框架 MindSearch(思?索),由來自中科大和上海人工智能實驗室的研究團(tuán)隊聯(lián)合研發(fā)。正如其名,MindSearch 是一個會「思索」的系統(tǒng),面對你輸入的問題,它將先調(diào)用負(fù)責(zé)充分「思」考問題的智能體,再啟用全面搜「索」的智能體,這些智能體分工合作,理解你的需求,并為你呈上從互聯(lián)網(wǎng)的五湖四海搜羅來的新鮮信息。

圖片

  • 論文鏈接:https://arxiv.org/abs/2407.20183
  • 項目主頁:https://mindsearch.netlify.app/

圖片

MindSearch 演示 demo

那么,MindSearch 是憑什么打敗 ChatGPT 和 Perplexity.ai 的呢?和別的 AI 搜索引擎相比,MindSearch 有什么獨到之處嗎?

答案還得從它的名字說起。MindSearch 的核心競爭力在于采用了多智能體框架模擬人的思維過程。

如果向 Perplexity.ai 提問「王者榮耀當(dāng)前賽季哪個射手最強?」它會直接搜索這個問題,并總結(jié)網(wǎng)上已有的回復(fù)。把這個問題交給 MindSearch,它會把這個問題拆解成一個邏輯鏈:「當(dāng)前賽季是哪個賽季?」,「從哪些指標(biāo)可以衡量王者榮耀的射手的強度?」,再匯總所能查詢到的答案。

圖片

技術(shù)實現(xiàn)

WebPlanner:基于圖結(jié)構(gòu)進(jìn)行規(guī)劃

僅依靠向大型語言模型輸入提示詞的方式并不能勝任智能搜索引擎。首先,LLM 不能充分理解復(fù)雜問題中的拓?fù)潢P(guān)系,比如前一段掛在熱搜上的大模型無法理解 9.9 和 9.11 誰大的問題,就是這個問題的生動注腳。字與字之間的關(guān)系,LLM 都很難在簡單對話中理解,那么「這個季節(jié)種哪個品種的番茄最合適?」這種需要深入思考,分解成多個角度來回答的問題,對于 LLM 就更難了。換句話說,LLM 很難將用戶的意圖逐步轉(zhuǎn)化為搜索任務(wù),并提供準(zhǔn)確的響應(yīng),因此它總是提供一些模版式的知識和套話。

基于此,研究團(tuán)隊設(shè)計了高級規(guī)劃器 WebPlanner,它通過構(gòu)建有向無環(huán)圖(DAG)來捕捉從提問到解答之間的最優(yōu)執(zhí)行路徑。對于用戶提出的每個問題 Q,WebPlanner 將其解決方案的軌跡表示為 G (Q) = ?V, E?。在這個圖中,V 代表節(jié)點的集合,每個節(jié)點 v 代表一個獨立的網(wǎng)頁搜索任務(wù),包括一個輔助的起始節(jié)點(代表初始問題)和一個結(jié)束節(jié)點(代表最終答案)。E 代表有向邊,指示節(jié)點之間的邏輯和推理關(guān)系。

研究團(tuán)隊進(jìn)一步利用 LLM 優(yōu)越的代碼能力,引導(dǎo)模型編寫代碼與 DAG 圖交互。為了實現(xiàn)這一點,研究團(tuán)隊預(yù)定義了原子代碼函數(shù),讓模型可以在圖中添加節(jié)點或邊。在解答用戶問題的過程中,LLM 先閱讀整個對話,還有它在網(wǎng)上搜索到的信息。閱讀完這些信息后,LLM 會根據(jù)這些信息產(chǎn)生一些思考和新的代碼,這些代碼將通過 Python 解釋器添加在用于推理的圖結(jié)構(gòu)中。

一旦有新節(jié)點加入圖中,WebPlanner 將啟動 WebSearcher 來執(zhí)行搜索任務(wù),并整理搜索到的信息。由于新節(jié)點只依賴于之前步驟中生成的節(jié)點,所以這些節(jié)點可以并行處理,大大提高了信息收集的速度。當(dāng)所有的信息收集完畢,WebPlanner 將添加結(jié)束節(jié)點,輸出最終答案。

圖片

WebSearcher:分層檢索網(wǎng)頁

由于互聯(lián)網(wǎng)上的信息實在太多,就算是 LLM 也不能一下子處理完所有的頁面。針對這個問題,研究團(tuán)隊選擇了先廣泛搜索再精確選擇的策略,設(shè)計了一個 RAG 智能體 ——WebSearcher。

首先,LLM 將根據(jù) WebPlanner 分配的問題,生成幾個類似的搜索問題,擴(kuò)大搜索的范圍。接下來,系統(tǒng)將調(diào)用不同搜索引擎的 API 查詢問題,例如分別在 Google、Bing 和 DuckDuckGo 查一下,得到網(wǎng)頁的鏈接、標(biāo)題和摘要等關(guān)鍵信息。接著,LLM 將從這些搜索結(jié)果中選出最重要的網(wǎng)頁來仔細(xì)閱讀,匯總得出最終答案。

圖片

MindSearch 中,LLM 如何管理上下文

作為一個多智能體框架,MindSearch 為如何管理長上下文提供了全新嘗試。當(dāng)需要快速閱讀大量網(wǎng)頁時,由于最終答案只依賴 WebSearcher 的搜索結(jié)果,WebPlanner 將專注于分析用戶提出的問題,不會被過長的網(wǎng)頁信息分心。

這種明確的分工也大大減少了上下文計算量。如何在多個智能體之間高效共享信息和上下文并非易事,研究團(tuán)隊在實證中發(fā)現(xiàn),如果只依靠 WebPlanner 的分析,有可能會在信息收集階段由于 WebSearcher 內(nèi)部的局部感知場丟失有用的信息。為了解決這個問題,他們利用有向圖邊構(gòu)建的拓?fù)潢P(guān)系來簡化上下文如何在不同智能體間傳遞。

具體來說,在 WebSearcher 執(zhí)行搜索任務(wù)時,它的父節(jié)點以及根節(jié)點的回答將作為前綴添加在其回答中。因此,每個 WebSearcher 可以有效地專注于其子任務(wù),同時不會丟失之前的相關(guān)上下文或者忘記最終的查詢目標(biāo)。

本地部署

7 月初,上海人工智能實驗室已經(jīng)開源了搭載 MindSearch 架構(gòu)的 InternLM2.5-7B-Chat 模型。

除了直接點擊鏈接,跳轉(zhuǎn)到體驗 Demo 試玩。研究團(tuán)隊還公開了 MindSearch 的完整前后端實現(xiàn),基于智能體框架 Lagent,感興趣的朋友可以在本地部署模型。

  • 在線 Demo:https://mindsearch.openxlab.org.cn/
  • 開源代碼:https://github.com/InternLM/mindsearch

在 GitHub 下載 MindSearch 倉庫后,輸入如下命令就可以打造屬于自己的 MindSearch 了:

# 啟動服務(wù)
python -m mindsearch.app --lang en --model_format internlm_server

## 一鍵啟動多種前端

# Install Node.js and npm
# for Ubuntu
sudo apt install nodejs npm
# for windows
# download from https://nodejs.org/zh-cn/download/prebuilt-installer
# Install dependencies
cd frontend/React
npm install
npm start
責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2022-04-20 12:17:50

命令Batcat

2022-04-25 10:04:56

df命令Linux

2024-11-20 09:27:06

2023-11-18 09:09:08

GNUBSD協(xié)議

2022-03-22 10:57:37

Xshell開源SSH

2023-04-02 21:39:14

ChatGPT開源

2024-11-12 14:20:00

模型AI

2020-08-27 15:35:01

存儲

2020-02-10 14:26:10

GitHub代碼倉庫

2024-09-19 09:30:39

緩存框架抽象

2020-12-10 08:44:35

WebSocket輪詢Comet

2024-07-26 09:29:38

2022-03-24 13:36:18

Java悲觀鎖樂觀鎖

2015-03-17 15:18:02

私有云公共云數(shù)據(jù)中心

2020-03-01 17:53:38

Excel大數(shù)據(jù)微軟

2023-11-27 17:17:52

文件搜索應(yīng)用程序

2020-10-20 14:12:54

B站開源彈幕

2019-02-20 14:16:43

2018-06-05 17:40:36

人工智能語音識別

2024-04-11 12:19:01

Rust數(shù)據(jù)類型
點贊
收藏

51CTO技術(shù)棧公眾號