突發(fā)!OpenAI免費開放Deep research,超強AI Agent
今天凌晨4點30,OpenAI推出輕量級版本的Deep research功能提高當前的速率限制,以擴大Plus、Team和Pro用戶的使用范圍。
值得一提的是,從今天開始免費ChatGPT用戶可以使用Deep research,并且支持最新的o4-mini模型。
下面「AIGC開放社區(qū)」就用免費版為大家展示一下Deep research的免費功能。現(xiàn)在打開免費版ChatGPT,你就會發(fā)現(xiàn)下面多了一個“深度研究功能”,這個就是Deep research。
例如,我們想寫一份論文,提示詞:我想寫一份關于量子計算的論文,能幫我找一些資料嗎?
ChatGPT會回答你,能否繼續(xù)補充一下你寫論文的資料。還列舉了5個案例。
咱們直接回答,就按你說的那5點吧。這個時候你會發(fā)現(xiàn),Deep research已經開始工作,按照那5點開始整合資料了。
這個搜索的時間會按照你提供的主題而定。如果是一個簡單的問題,可能就是幾分鐘,像論文這種需要搜索、整合大量資料的內容,時間就會很長。咱們這個量子計算論文就用了將近25分鐘。
搜索完畢后,ChatGPT會提供所有整合內容,并提供源鏈接幫你節(jié)省大量搜索時間。相當的好用,關鍵免費的非常香。
想寫論文、寫旅游攻略、寫小說、金融分析的用Deep research非常高效。
Deep research是OpenAI在今年2月3日發(fā)布的AI Agent模型,用戶只需提供一個提示詞,深度研究就能搜索、分析并綜合數百個在線資源,生成一份媲美專業(yè)研究分析師水平的全面報告。
最初Deep Research是基于o3 模型的優(yōu)化版本開發(fā)的,并針對網頁瀏覽和數據分析場景進行了專項適配,能夠運用推理能力搜索、解讀和分析互聯(lián)網上海量的文本、圖像和 PDF 文件,并根據獲取的信息靈活調整研究方向。
端到端強化學習是 Deep Research 技術的關鍵所在。傳統(tǒng)的機器學習方法在處理復雜任務時,往往需要人為地劃分多個階段進行訓練和優(yōu)化,而端到端強化學習則讓模型從輸入到輸出進行整體的學習和優(yōu)化。
Deep Research通過這種學習方式,學會了規(guī)劃和執(zhí)行多步驟的研究軌跡。在面對一個復雜的研究課題時,它能夠像人類研究者一樣,制定出合理的研究計劃,先確定從哪些渠道獲取信息,然后根據獲取到的信息進行分析,判斷下一步的研究方向。
如果在研究過程中發(fā)現(xiàn)之前的計劃存在偏差,它還能像經驗豐富的研究者一樣進行回溯,重新調整研究策略,確保最終能得到準確且有價值的結果。
在這個學習過程中,模型不斷地與環(huán)境進行交互,從環(huán)境反饋中學習最優(yōu)的行為策略。在瀏覽網頁獲取信息時,模型會根據網頁內容的相關性、可信度等因素,決定是否深入瀏覽該網頁,以及如何提取其中有用的信息。這種基于實時信息進行決策和調整的能力,是 Deep Research 能夠高效完成復雜研究任務的重要保障。
除了端到端強化學習,去除模型的延遲限制也是 Deep Research 的重要技術突破。傳統(tǒng)的大模型為了追求快速響應,往往在處理復雜問題時只能淺嘗輒止,無法進行深入的思考和分析。
Deep Research模型由多個模塊組成,有點類似分層的AI Agent協(xié)同工作。信息發(fā)現(xiàn)模塊,能夠快速定位到各類網站、文檔、數據庫等信息源,并從中提取出有價值的線索。
當用戶想要了解某一特定疾病的最新研究進展時,信息發(fā)現(xiàn)模塊會迅速在學術數據庫、科研機構網站、醫(yī)學論壇等多個平臺上搜索相關的論文、研究報告、專家觀點等信息,為后續(xù)的分析和綜合提供豐富的素材。
信息發(fā)現(xiàn)模塊還具備強大的信息篩選能力。它能夠根據關鍵詞、語義關聯(lián)、信息的時效性和可信度等多個維度對搜索到的信息進行初步篩選,排除那些與用戶問題無關或價值較低的信息,大大提高了信息處理的效率和質量。
在篩選過程中,它會運用自然語言處理技術對信息內容進行分析,準確理解信息的含義,確保篩選出的信息與用戶需求高度匹配。
信息綜合模塊,能將來自不同渠道的信息進行整合和梳理,識別出信息之間的邏輯關系,將零散的信息組織成一個有條理的整體。
測試數據方面,“人類最終考試”,是一項涵蓋廣泛知識領域的基準測試。包含約 3000 個簡答題和多項選擇題 ,涉及約 100 個不同學科。結果顯示,Deep Research 模型的準確率達到 26.6%,超過R1、o1、Grok2等知名開閉源模型。