搜索引擎+GraphRAG+智能體,打造AI智能搜索
最近,人工智能領(lǐng)域涌現(xiàn)的新搜索引擎MindSearch正成為行業(yè)的新寵。這款開源的搜索引擎具備卓越的信息處理能力,能夠在幾分鐘內(nèi)完成人類需要數(shù)小時才能做到的工作,充分展現(xiàn)出AI在信息檢索和整合方面的驚人潛力。
本文帶讀者了解MindSearch的核心特性,看其如何領(lǐng)先于競爭對手;同時,文章中還會提供指南,指導(dǎo)如何在本地搭建這款A(yù)I搜索引擎。
1 MindSearch簡介
MindSearch是由上海人工智能實驗室聯(lián)合研發(fā)團隊推出的開源AI搜索框架,擅長大規(guī)模信息的收集與整理。
借助InternLM2.5 7B對話模型,MindSearch能夠在短時間內(nèi)從300多個網(wǎng)頁中提取關(guān)鍵信息,完成這項通常人類需要3小時的任務(wù)。
MindSearch采用多代理框架模擬人類思考過程,先規(guī)劃然后執(zhí)行搜索,從而確保信息的精確度和全面性。
該項目完全開源,用戶可以免費體驗并進(jìn)行本地部署。
2 MindSearch優(yōu)勢
MindSearch由兩大核心組件構(gòu)成:WebPlanner和WebSearcher。
WebPlanner將用戶問題細(xì)化為搜索任務(wù),并智能規(guī)劃搜索路徑,整個過程通過圖結(jié)構(gòu)呈現(xiàn)。WebSearcher則負(fù)責(zé)執(zhí)行分層搜索,精準(zhǔn)地收集所需信息。
MindSearch的獨到之處在于其高效的復(fù)雜問題處理和信息提取能力。借助多代理架構(gòu),它能在幾分鐘內(nèi)完成人類三小時的工作量,確立了其在AI搜索領(lǐng)域的領(lǐng)先地位。
3 MindSearch更勝一籌
MindSearch之所以能超越ChatGPT和Perplexity.ai,關(guān)鍵在其模仿人類思維的多代理框架。
在實際應(yīng)用中,MindSearch的性能表現(xiàn)十分出色。它能夠迅速從眾多網(wǎng)頁中搜集并整合信息,面對復(fù)雜的查詢?nèi)蝿?wù),如“本季《王者榮耀》哪位射手表現(xiàn)最佳?”,它不僅分析賽季特點和射手性能指標(biāo),還能綜合多方數(shù)據(jù),提供全面而精確的答案,效率遠(yuǎn)超人類專家。在與ChatGPT-web和Perplexity的對比測試中,MindSearch的表現(xiàn)尤為突出。
4 本地部署MindSearch
步驟1:安裝依賴
- 打開終端或命令提示符,準(zhǔn)備輸入安裝命令。
- 從GitHub克隆MindSearch倉庫,將所需文件下載到本地:
git clone https://github.com/InternLM/MindSearch
- 進(jìn)入克隆后的MindSearch目錄:
cd MindSearch
- 安裝項目所需的Python包,倉庫中包含requirements.txt文件,列出了所有必需的包。運行以下命令進(jìn)行安裝:
pip install -r requirements.txt
步驟2:設(shè)置MindSearch API
要啟動MindSearch API,需要運行一個Python模塊。命令有幾個選項:
- 使用--lang en參數(shù)設(shè)置模型語言為英語,若需使用中文,可將en改為cn。
- 通過--model_format參數(shù)指定模型格式,例如使用internlm_server來優(yōu)化中文的InternLM2.5-7b-chat模型,或選擇gpt4來使用GPT-4模型。
接下來,啟動FastAPI服務(wù)器,根據(jù)配置調(diào)整命令參數(shù):
- 對于開源模型,使用命令:
python -m mindsearch.app --lang en --model_format internlm_server
- 若要使用GPT-4模型,首先需要在項目文件中修改API模型配置,將'YOUR OPENAI API KEY'替換為你的OpenAI實際API密鑰:
gpt4 = dict(type=GPTAPI,
model_type='gpt-4-turbo',
key=os.environ.get('OPENAI_API_KEY', 'YOUR OPENAI API KEY'))
然后,確保啟動服務(wù)器的命令正確指向GPT-4模型格式:
python -m mindsearch.app --lang en --model_format gpt4
步驟3:搭建MindSearch前端界面
- 啟動Gradio界面
確保進(jìn)入 Gradio 腳本所在的 MindSearch 項目根目錄,并在終端中使用以下命令啟動 Gradio 界面:
python frontend/mindsearch_gradio.py
- 運行Streamlit應(yīng)用
使用以下命令運行 Streamlit 應(yīng)用程序。 Streamlit 會自動在默認(rèn)網(wǎng)絡(luò)瀏覽器中打開網(wǎng)絡(luò)應(yīng)用程序.方便你進(jìn)行操作和使用。
streamlit run frontend/mindsearch_streamlit.py
5 總結(jié)
MindSearch以其簡潔而強大的功能,為信息檢索和整合領(lǐng)域帶來了突破性的解決方案。它獨有的多代理框架,融合了大型語言模型的認(rèn)知優(yōu)勢和搜索引擎的數(shù)據(jù)廣度,使其在眾多現(xiàn)有工具中脫穎而出。
通過細(xì)化查詢、有效管理上下文信息以及實施分層檢索策略,MindSearch大幅提升了網(wǎng)絡(luò)信息檢索的精確性和全面性。它能夠迅速處理大量網(wǎng)頁數(shù)據(jù),為用戶提供了快速而準(zhǔn)確的信息獲取渠道,從而支持用戶做出更加明智的決策。
本文轉(zhuǎn)載自?? AI科技論談??,作者: AI科技論談
