OpenAI推出新人工智能代理Deep Research
上個(gè)月,DeepSeek改寫了人工智能的劇本,這促使整個(gè)行業(yè)坐下來關(guān)注。一些科技巨頭被迫重新思考他們的游戲,因?yàn)榕f的戰(zhàn)術(shù)可能會(huì)在這個(gè)快速變化的環(huán)境中削弱自己。
OpenAI是人工智能領(lǐng)域的關(guān)鍵參與者,對(duì)DeepSeek的挑戰(zhàn)做出了回應(yīng),承諾“提供更好的模型”并加快產(chǎn)品發(fā)布。就在宣布這一消息幾天后,這家總部位于舊金山的公司發(fā)布了一款新的人工智能代理,旨在進(jìn)行深入而復(fù)雜的研究。
名為Deep Research (深度研究)的新產(chǎn)品可以在互聯(lián)網(wǎng)上對(duì)包括科學(xué)、金融、工程和政策在內(nèi)的各種主題進(jìn)行多步驟研究。它建立在最近宣布的o3推理AI模型的特殊版本之上。
根據(jù)OpenAI的說法,Deep Research可用于廣泛的應(yīng)用程序,包括為研究人員提供深入的知識(shí),幫助購物者尋找超個(gè)性化的推薦。OpenAI在一篇博客文章中聲稱,Deep Research可以“在幾十分鐘內(nèi)完成人類需要幾個(gè)小時(shí)才能完成的任務(wù)”
OpenAI分享道:“Deep Research獨(dú)立發(fā)現(xiàn)、推理并整合來自網(wǎng)絡(luò)的見解。”為了實(shí)現(xiàn)這一點(diǎn),它接受了需要瀏覽器和Python工具使用的真實(shí)任務(wù)的訓(xùn)練,使用了我們第一個(gè)推理模型OpenAI o1背后的相同強(qiáng)化學(xué)習(xí)方法。”
“雖然o1在編碼、數(shù)學(xué)和其他技術(shù)領(lǐng)域表現(xiàn)出了令人印象深刻的能力,但許多現(xiàn)實(shí)世界的挑戰(zhàn)需要從不同的在線來源收集廣泛的背景和信息。深入的研究建立在這些推理能力的基礎(chǔ)上,以彌合這一差距,使其能夠解決人們?cè)诠ぷ骱腿粘I钪忻媾R的問題?!?/span>
Deep Research現(xiàn)已面向OpenAI Pro用戶開放,每月最多可查詢100次。此外,團(tuán)隊(duì)用戶接下來將被授予訪問權(quán)限,企業(yè)用戶隨后將被授予。該公司在不久的將來會(huì)發(fā)布更具成本效益的Deep Research版本時(shí),所有付費(fèi)用戶都將有更高優(yōu)惠。
目前,該代理僅通過網(wǎng)絡(luò)提供,并計(jì)劃在本月晚些時(shí)候集成移動(dòng)和桌面應(yīng)用程序。
在性能基準(zhǔn)方面,OpenAI分享說,Deep Research在Humanities Last Exam上的準(zhǔn)確率達(dá)到了26.6%的新高,這是一種基于專家級(jí)問題的人工智能評(píng)估工具。
那么,Deep Research與DeepSeek的R1相比如何?這兩家公司在功能上似乎不是直接競(jìng)爭(zhēng)對(duì)手。Deep Research更適合結(jié)構(gòu)化研究、引文管理和自動(dòng)推理。而R1更適合解決復(fù)雜的數(shù)學(xué)和計(jì)算問題。盡管如此,兩者之間的比較是不可避免的,特別是考慮到它們名稱的相似和發(fā)布日期的接近。
Sam Altman在今年伊始大膽宣稱,OpenAI現(xiàn)在對(duì)如何創(chuàng)建AGI充滿信心。Deep Research的發(fā)布與公司開發(fā)AGI的更廣泛目標(biāo)相一致。
OpenAI的Deep Research有可能大大減少在線研究所需的時(shí)間和精力。通過簡(jiǎn)單的查詢,用戶可以輕松找到個(gè)人研究分析師。然而,說起來容易做起來難。
人工智能幻覺仍然是GenAI模型中的一個(gè)持續(xù)挑戰(zhàn),Deep Research也不例外。OpenAI承認(rèn),根據(jù)其內(nèi)部評(píng)估,Deep Research有時(shí)會(huì)產(chǎn)生幻覺或做出不正確的反應(yīng)。在進(jìn)行深入研究時(shí),這可能是一個(gè)主要問題。
OpenAI分享說,Deep Research可能“難以區(qū)分權(quán)威信息和謠言,目前在信心校準(zhǔn)方面表現(xiàn)出弱點(diǎn),往往無法準(zhǔn)確傳達(dá)不確定性?!比欢?,它預(yù)計(jì)隨著更多的使用和時(shí)間,這些問題會(huì)得到改善。
DeepSeek R1的發(fā)布重新引發(fā)了關(guān)于開源代碼在人工智能世界中的作用的爭(zhēng)論。盡管OpenAI有著開源的初衷和名字,但它已經(jīng)轉(zhuǎn)向了閉源開發(fā)方法。
Altman上周在Reddit AMA上寫道,他承認(rèn)OpenAI“站在了歷史的錯(cuò)誤一邊”,現(xiàn)在需要“想出一個(gè)不同的開源策略”。然而,他很快提到,并非OpenAI的每個(gè)人都認(rèn)同這一觀點(diǎn),這也不是最高優(yōu)先級(jí)的事情。
OpenAI首席產(chǎn)品官Kevin Weil表示,該公司被認(rèn)為將其一些較舊、不太先進(jìn)的型號(hào)開源。它也在考慮在引擎蓋下透露更多信息。他承認(rèn)在透明度和競(jìng)爭(zhēng)風(fēng)險(xiǎn)之間取得平衡的挑戰(zhàn),但指出OpenAI正在積極探索在不損害其競(jìng)爭(zhēng)優(yōu)勢(shì)的情況下加強(qiáng)披露的方法。
OpenAI可能正在考慮一種更開源的方法,但這可能不會(huì)很快發(fā)生。該公司指控DeepSeek非法使用其人工智能模型,然而,Altman表示,該公司“沒有計(jì)劃起訴DeepSeek?!庇腥さ氖牵琌penAI本身也面臨著十幾起非法使用受版權(quán)保護(hù)的互聯(lián)網(wǎng)數(shù)據(jù)來訓(xùn)練其模型的訴訟。OpenAI似乎擔(dān)心他們的模型被復(fù)制的可能性,開源確實(shí)可以使復(fù)制更容易。OpenAI是否愿意承擔(dān)這種風(fēng)險(xiǎn)還有待觀察。