自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

不到1美元,打造全球第3超強AI助手!港大3人開源最強Deep Research

人工智能 新聞
最近,來自香港大學(xué)的3位研究員開源了一款平替版「Deep Research」,只需1美元即可擁有全自動AI研究助理!它能自主搜索、分析互聯(lián)網(wǎng)信息,還能處理復(fù)雜編程任務(wù),甚至能自動解析PDF、生成可視化報告。性能位列全球第三,開源第一。

OpenAI的Deep Research一經(jīng)發(fā)布便引發(fā)了全網(wǎng)的熱議。

作為新一代通用AI助手,它具備自主搜索和分析互聯(lián)網(wǎng)海量信息的能力,并能通過編程手段對復(fù)雜數(shù)據(jù)進(jìn)行深度分析,迅速在全球范圍內(nèi)獲得了極大反響。

在即將到來的AGI時代,各行各業(yè)都需要這樣的智能助手來提升工作效率。

然而,目前Deep Research僅向Pro用戶開放,每月200美元的訂閱費用讓人望而卻步。

CEO奧特曼表示,Deep Research已展現(xiàn)出完成具有實際經(jīng)濟價值任務(wù)的能力,這標(biāo)志著AI發(fā)展的一個重要里程碑

為推動這項技術(shù)的普及,來自香港大學(xué)黃超教授實驗室的三位研究員開源了創(chuàng)新型Agent框架Auto-Deep-Research,并一舉在General AI Assistant benchmark GAIA評測中奪得第三,是開源方案中的最優(yōu)解。

值得注意的是,Auto-Deep-Research僅基于Claude-3.5-Sonnet構(gòu)建,在成本效益上具有顯著優(yōu)勢。

此外,系統(tǒng)還支持DeepSeek、Hugging Face等主流模型,為用戶提供了更多選擇。

技術(shù)驅(qū)動全自動框架AutoAgent:https://github.com/HKUDS/AutoAgent

Auto-Deep-Research:https://github.com/HKUDS/Auto-Deep-Research

論文地址:https://arxiv.org/abs/2502.05957

目前,團隊還在開發(fā)更多前沿功能,包括Claude的Model Context Protocol(MCP)和GUI Agent等。

實際案例演示

讓我們通過一個具體案例,深入了解Auto-Deep-Research的實際應(yīng)用能力。

以下是AutoAgent團隊展示的一個金融分析案例,展現(xiàn)了系統(tǒng)如何處理復(fù)雜的多步驟分析任務(wù)。

Task:Please analyze the Apple and Microsoft 10-K forms that I uploaded, search online for current news about these two companies, and then help me conduct a quantitative analysis based on the information you find, create visualizations, and generate a detailed report.

這個任務(wù)展示了Auto-Deep-Research處理復(fù)雜分析場景的強大能力。

系統(tǒng)需要深入解析兩份總計超過200頁的PDF文檔,同時進(jìn)行網(wǎng)絡(luò)信息搜索、數(shù)據(jù)分析與可視化,最終生成全面的分析報告。

演示視頻通過三個并行窗口直觀展示了整個工作流程:左側(cè)是Auto-Deep-Research的終端交互界面,右上顯示Agent 的文件工作目錄,右下則是Agent 操控的瀏覽器窗口。

在用戶上傳文件并明確需求后,系統(tǒng)便全自動運行,依次完成文件解析、網(wǎng)絡(luò)搜索、代碼編寫與調(diào)試等任務(wù)。

整個過程無需人工干預(yù),僅用約10分鐘就生成了一份專業(yè)的分析報告和配套的數(shù)據(jù)可視化成果,充分體現(xiàn)了系統(tǒng)的自動化處理能力。

Agent生成的和圖像如下所示:(報告見文末)

最強開源Deep Research

Auto-Deep-Research采用模塊化的多Agent架構(gòu)設(shè)計,由三個專業(yè)子Agent和一個核心調(diào)度器(Orchestrator Agent)組成:

  • Web Agent專注于互聯(lián)網(wǎng)信息的無障礙訪問和深度搜索
  • Coding Agent負(fù)責(zé)編程實現(xiàn)和調(diào)試,具備嚴(yán)密的邏輯分析能力
  • Local File Agent致力于多格式文件的解析和內(nèi)容理解

網(wǎng)絡(luò)搜索神器Web Agent

網(wǎng)絡(luò)搜索組件Web Agent是Auto-Deep-Research的核心模塊之一,它整合了一套完整的網(wǎng)絡(luò)工具集,能夠高效執(zhí)行從基礎(chǔ)搜索到文件下載的各類網(wǎng)絡(luò)任務(wù)。

Web Agent將日常網(wǎng)頁瀏覽行為抽象為10個高級工具,包括點擊(click)、網(wǎng)頁搜索(web_search)、訪問網(wǎng)址(visit_url)等核心功能。這些工具覆蓋了網(wǎng)頁搜索、頁面導(dǎo)航、內(nèi)容瀏覽和文件下載等常見操作場景。

在技術(shù)架構(gòu)上,Web Agent基于BrowserGym框架開發(fā),通過將底層瀏覽器操作封裝為高級工具集,不僅提升了操作靈活性,也為功能擴展提供了良好基礎(chǔ)。這種模塊化設(shè)計確保了Web Agent能夠從容應(yīng)對各類網(wǎng)絡(luò)任務(wù)需求。

編程專家助手Coding Agent

編程專家組件Coding Agent是一個全能型編程助手,它能夠熟練處理數(shù)據(jù)分析、機器學(xué)習(xí)到系統(tǒng)管理等各類編程任務(wù),無論是復(fù)雜計算還是自動化操作,都能高效完成。

為實現(xiàn)智能編程,Coding Agent配備了11個專業(yè)工具,涵蓋代碼腳本創(chuàng)建、Python代碼執(zhí)行、特定命令實現(xiàn)以及目錄管理等核心功能。這套完整的工具體系使其能夠從容應(yīng)對各類編程需求。

在系統(tǒng)架構(gòu)上,Coding Agent采用Docker沙箱環(huán)境確保代碼執(zhí)行安全,并支持與E2B等第三方沙箱系統(tǒng)無縫集成。同時,其交互式終端環(huán)境設(shè)計讓代碼執(zhí)行過程和結(jié)果一目了然,大大提升了操作體驗。

文件分析大師Local File Agent

文件處理專家Local File Agent是一個全能型文件管理專家,它能夠統(tǒng)一處理和分析各類本地文件,讓復(fù)雜的文件處理工作變得簡單高效。

Local File Agent最突出的優(yōu)勢在于其強大的文件兼容性。它可以處理幾乎所有常見格式,包括文檔類(doc、pdf、txt、ppt)、多媒體類(mp4、mov、wav、mp3)以及數(shù)據(jù)類(csv、xlsx)等多模態(tài)文件。通過將不同格式統(tǒng)一轉(zhuǎn)換為Markdown,實現(xiàn)了高效的文件分析和處理。

在用戶體驗方面,Local File Agent采用交互式Markdown瀏覽器環(huán)境,即使面對超長文本或復(fù)雜文件,也能通過分頁顯示實現(xiàn)清晰呈現(xiàn),使文件處理過程更加流暢直觀。

高效調(diào)配,性能領(lǐng)先

Auto-Deep-Research采用精簡而高效的架構(gòu)設(shè)計,僅需一個核心調(diào)度器——Orchestrator Agent便可驅(qū)動整個系統(tǒng)高效運轉(zhuǎn)。

其工作流程清晰明確:Orchestrator Agent接收任務(wù)后,將其分解為多個子任務(wù)并分派給專業(yè)Agent。各Agent完成子任務(wù)后,結(jié)果返回給調(diào)度器進(jìn)行評估,隨后動態(tài)調(diào)整并分配新的子任務(wù),循環(huán)往復(fù)直至完成整體目標(biāo)。

這種優(yōu)雅而強大的設(shè)計在GAIA benchmark評測中取得了驕人成績:總排名第三,開源方案中位列第一,僅次于OpenAI等閉源系統(tǒng)。

值得一提的是,這是前三名中唯一采用Claude-3.5-Donnet的方案,無需依賴更昂貴的o1系列深度思考模型,從而也使其成為了前三方案中最具性價比的選擇。

更令人欣喜的是,這個框架具備強大的擴展性,不僅支持接入Deepseek-R1模型,還可部署本地開源模型。

這意味著,人人都可以搭建屬于自己的Deep Research系統(tǒng),讓智能研究助手不再是可望而不可即的夢想。

AutoAgent框架

值得一提的是,團隊還發(fā)布了一個的不需要coding的智能體開發(fā)框架——AutoAgent。

下圖展示了AutoAgent的全自動、語言驅(qū)動的通用智能體系統(tǒng)。其核心組件包括智能體系統(tǒng)實用程序、由LLM驅(qū)動的可操作引擎、自管理文件系統(tǒng)和自博弈智能體定制模塊。

這是一個輕量級存靠語言驅(qū)動的Agent構(gòu)建平臺,讓用戶只需通過自然語言描述就能輕松創(chuàng)建專屬AI助手,完全無需編程基礎(chǔ)。

前文介紹的Auto-Deep-Research正是基于AutoAgent開發(fā)的一個典型應(yīng)用。

作為一個全方位的Agent開發(fā)生態(tài)系統(tǒng),AutoAgent不僅提供了Auto-Deep-Research這樣的即用解決方案,還包含更多強大組件:

系統(tǒng)的智慧核心:智能決策引擎LLM Engine

LLM Engine作為系統(tǒng)的中樞大腦,承擔(dān)著理解用戶需求、制定執(zhí)行策略和協(xié)調(diào)多Agent協(xié)作的重要職責(zé)。這個強大的決策引擎讓人類用戶與AI助手之間的互動達(dá)到前所未有的流暢度。

在架構(gòu)設(shè)計上,團隊選用LiteLLM作為標(biāo)準(zhǔn)化接口,實現(xiàn)了與超過100種主流語言模型的無縫對接。這種設(shè)計就像一個通用翻譯器,確保系統(tǒng)能夠與各類AI模型順暢交互。同時,LLM Engine采用連續(xù)記憶機制,將歷史行動和觀察結(jié)果作為決策依據(jù),不斷優(yōu)化判斷能力。

在技術(shù)實現(xiàn)層面,團隊創(chuàng)新性地設(shè)計了雙模式工具調(diào)用機制:

1. 面向原生支持工具調(diào)用的商業(yè)模型的「直接調(diào)用模式」;

2. 通過將工具調(diào)用轉(zhuǎn)換為結(jié)構(gòu)化XML代碼生成任務(wù)的「轉(zhuǎn)換調(diào)用模式」,讓更多開源模型也能融入系統(tǒng)生態(tài)。

這種靈活的設(shè)計既保障了系統(tǒng)效能,又為用戶提供了更廣泛的模型選擇空間。

知識檢索的智慧管家:智能文件管理系統(tǒng)Vector DB

Vector DB是一個先進(jìn)的向量數(shù)據(jù)庫系統(tǒng),為AI助手提供強大的文件理解和檢索能力。它就像一位智能管家,能夠自動化處理和組織用戶提供的各類文件資源,實現(xiàn)知識的高效管理。

在技術(shù)架構(gòu)上,系統(tǒng)配備了完整的智能工具鏈。當(dāng)用戶上傳PDF、Word、文本文件,甚至是壓縮包或文件夾時,系統(tǒng)會自動進(jìn)行格式統(tǒng)一化處理,并通過save_raw_docs_to_vector_db工具將內(nèi)容存儲到指定的數(shù)據(jù)庫集合中,確保數(shù)據(jù)的規(guī)范化管理。

在實際應(yīng)用場景中,AI助手可以利用query_db和answer_query等專業(yè)工具,實現(xiàn)對存儲內(nèi)容的精準(zhǔn)檢索和智能問答。這種設(shè)計讓AI助手擁有了自主管理專屬知識庫的能力,大大提升了信息獲取和處理效率。相當(dāng)于為AI配備了一個智能知識助理,隨時待命調(diào)用所需信息。

打造專屬AI助手的平臺:智能定制系統(tǒng)Self-Play Agent

智能定制系統(tǒng)是一個創(chuàng)新型自編程框架,讓用戶能夠輕松構(gòu)建場景化的AI助手和多Agent系統(tǒng)。它就像一位經(jīng)驗豐富的系統(tǒng)架構(gòu)師,能夠?qū)⒂脩舻臉?gòu)想精準(zhǔn)轉(zhuǎn)化為實際應(yīng)用,而整個過程簡單直觀。

系統(tǒng)提供兩種靈活的定制模式:簡潔高效的「直接創(chuàng)建模式」和深度定制的「工作流創(chuàng)建模式」。

在直接創(chuàng)建模式中,即使是技術(shù)小白也能輕松打造專業(yè)級多Agent系統(tǒng)。例如,當(dāng)用戶需要一個投資組合管理助手時,只需提供基本需求描述,系統(tǒng)就能自動完成創(chuàng)建。這個過程分為三個核心步驟:需求分析與資源評估、Agent架構(gòu)規(guī)劃、XML規(guī)范文件生成。

為增強系統(tǒng)能力,團隊開發(fā)了智能工具編輯器,實現(xiàn)與LangChain、RapidAPI和Hugging Face等主流平臺的無縫集成。目前已支持8大類共145個API接口和9類模型庫。編輯器不僅能自動生成工具代碼,還會進(jìn)行嚴(yán)格的測試驗證,確保工具可靠運行。

在多Agent協(xié)作場景中,系統(tǒng)會自動部署智能調(diào)度員(Orchestrator Agent)統(tǒng)籌各專業(yè)Agent的工作,如同一位富有經(jīng)驗的項目經(jīng)理,確保團隊協(xié)作的流暢性。

工作流創(chuàng)建模式則為專業(yè)用戶提供了更深度的定制能力。通過創(chuàng)新的事件驅(qū)動機制,實現(xiàn)了Agent間更靈活的協(xié)作模式。整個工作流由工作流表單Agent(負(fù)責(zé)需求分析和邏輯設(shè)計)和工作流編輯Agent(負(fù)責(zé)實現(xiàn)和執(zhí)行)協(xié)同完成,既保證了強大功能,又兼具極高靈活性。

One More Thing

前文提到的報告如下:

# Apple vs Microsoft: Q4 FY2024 Financial Analysis


## Executive Summary
This analysis compares the financial performance of Apple and Microsoft for Q4 FY2024. Both companies showed strong revenue growth, with Microsoft leading in terms of YoY growth rate but Apple maintaining higher absolute revenue.


## Financial Performance Analysis


### Revenue
- Apple: $94.9B (↑6% YoY)
- Microsoft: $64.7B (↑15% YoY)


### Key Metrics
1. Growth Rates
   - Microsoft showed stronger YoY growth at 15%
   - Apple's more modest 6% growth reflects its larger revenue base


2. Segment Performance
   - Apple's services revenue reached an all-time high
   - Microsoft's Intelligent Cloud revenue grew 19% YoY to $28.5B


3. Profitability
   - Microsoft reported net income of $22B (↑10% YoY)
   - Apple's EPS was $0.97 ($1.64 excluding one-time charges)


## Segment Analysis


### Apple
- Products: 75.4% of revenue
- Services: 24.6% of revenue
- Services reached all-time high
- Hardware segments showing maturity


### Microsoft
- Intelligent Cloud: 44.0% of revenue
- Strong cloud performance
- Hardware challenges (Surface revenue decline)
- Gaming segment growth through Activision Blizzard


## Market Position and Competition


### Strengths
Apple:
- Largest tech company by revenue
- Strong services growth
- High customer loyalty
- Robust cash flow ($27B)


Microsoft:
- Cloud leadership
- Strong enterprise presence
- Successful gaming expansion
- AI integration


### Challenges
Apple:
- Hardware segment maturity
- Regulatory pressures
- China market dependence


Microsoft:
- Hardware division struggles
- Gaming hardware decline
- Integration costs


## Future Outlook and Recommendations


### Apple
1. Continue services expansion
2. Leverage AI integration
3. Explore new hardware categories
4. Focus on emerging markets


### Microsoft
1. Maintain cloud momentum
2. Accelerate AI deployment
3. Restructure hardware division
4. Integrate gaming acquisitions


## Conclusion
Both companies demonstrate strong financial health and market leadership, with d


責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-04-25 09:09:00

2025-02-17 08:12:00

AI模型生成

2025-02-05 08:00:00

2009-12-16 09:55:00

谷歌ChromeSafari

2025-02-06 08:12:41

2024-04-30 08:28:44

開源大模型Llama

2025-02-03 12:07:52

2024-04-23 07:00:00

2013-07-08 16:08:28

2021-01-02 09:40:08

IaaS存儲云計算邊緣計算

2020-04-21 15:51:26

Python技能AWS

2019-08-26 10:09:51

機器人人工智能編程

2015-04-08 11:45:52

2024-11-06 13:03:49

2012-05-23 09:09:30

H3C智慧城市

2024-03-18 14:17:06

大模型開源人工智能

2025-03-10 10:26:16

2024-02-15 09:00:00

LLaVA模型開源視頻聊天助手

2025-03-03 08:36:24

2023-12-05 12:46:22

點贊
收藏

51CTO技術(shù)棧公眾號