GPT-4價格已被砍成1/150 !OpenAI副總裁回應DeepSeek的競爭,揭秘內部員工花式使用自家產品,有很多工程難題 原創(chuàng)
編輯 | 言征
2天前,就在馬斯克宣布要以 974 億美元收購 OpenAI 后,OpenAI 工程副總裁斯里尼瓦斯·納拉亞南( Srinivas Narayanan) 接受了華爾街日報的一次線下對話,這次對話同樣也是出于一場中美 AI 博弈的新語境下:DeepSeek R1低成本訓練出可以對標 Open AI o1的強推理模型,甚至登頂了應用排行榜,美國現在已經封禁了DeepSeek應用的下載。
主持人當然沒有放過斯里尼瓦斯,問了他這個非常敏感的問題。那么 OpenAI 內部究竟是如何看待 DeepSeek 的?是否還在調查 DeepSeek 有使用 OpenAI 模型產生的數據用于蒸餾?
相信大家同樣也會關注這些問題。斯里尼瓦斯認為,DeepSeek 展示了價格 - 能力曲線上的另一個點。并毫不掩飾 OpenAI 同樣在這條曲線上做了同樣驚艷的努力:“如果你看看我們自己的模型在過去幾年里,GPT-4 模型的價格在短短幾年內已經降為了原來的1/150?!?/p>
除了 DeepSeek,作為工程副總裁,斯里尼瓦斯還分享了許多 OpenAI 內部在推理模型和Agent方面的進展,o1 模型已經有了很多用例,而首款智能體產品Operator 和 Deep Research 同樣也各自有著工程挑戰(zhàn),OpenAI 內部正在這些方面做很有意思的實踐探索。
觀眾之中也提了非常精彩的提問,諸如 OpenAI 下一步有關 Agent 的計劃,OpenAI 自己內部是如何使用ChatGPT等自己開發(fā)的產品的等等。
還有一個有趣的挑戰(zhàn),因為一旦你將 AI 部署到現實世界中,它必須學會與人們關心的所有系統(tǒng)進行交互。
話不多說,這里先列幾個精彩觀點:
1.為了領先,背后有大量的研究工作。你可能需要進行 100 次實驗,然后才決定要繼續(xù)進行哪次實驗。
2.如果你看看我們自己的模型在過去幾年里,GPT-4 模型的價格在短短幾年內已經降為了原來的1/150。
3.ChatGPT 已經在 OpenAI 內部得到廣泛應用,包括代碼輔助、知識共享、合同分析和客戶服務等。
4.企業(yè)對AI的需求不僅在于模型的開源性,更在于AI產品的整體質量、成本效益和易用性。
5.OpenAI 的目標是提供高質量、可定制且易于使用的 AI 工具,幫助企業(yè)解決實際問題。
6.OpenAI 也在探索新的開源策略,以更好地平衡技術創(chuàng)新和安全性。
7.構建模型、擴展模型以及每個新模型在基礎設施上都面臨著新的可擴展性限制,因此在訓練模型方面存在大量的工程挑戰(zhàn)。同樣,在推理優(yōu)化、降低成本方面也有著非常有趣的挑戰(zhàn)。
8.在一年內,類似能力的模型價格可能降低為 1/10 。
以下是采訪內容整理,供君一覽(技術干貨不少,很精彩):
1.OpenAI眼中的推理
主持人:
我們先從推理的定義開始吧,以及為什么在座的企業(yè)需要 AI 模型具備推理能力。OpenAI 對推理的定義是什么,為什么這對企業(yè)很重要呢?
斯里尼瓦斯:
推理本質上是一種系統(tǒng)性思考和解決更復雜問題的能力。如果問一個人非常簡單的問題,我們幾乎會立即給出答案。但如果問一個復雜的數學問題,你不可能立刻給出答案。你可能需要花更長時間去思考,需要推理,需要判斷自己是否在正確的道路上。所以,AI 系統(tǒng)具備這種能力,能夠處理更復雜的任務,長時間思考并評估自己是否在正確的道路上,這就是我們所說的推理。
主持人:
推理也是通往人工通用智能(AGI)的路徑嗎?OpenAI 曾多次提到 AGI,它的含義是什么,推理是否是通往 AGI 的必經之路?
斯里尼瓦斯:
是的,絕對如此。AGI 這個詞有很多種不同的解釋和含義,但我們有一種說法是,AI 能夠解決具有經濟價值的任務。世界上有很多對我們社會來說很重要的任務,要完成它們,你需要能夠處理復雜任務并深入思考問題。所以,我認為推理是通往 AGI 的路徑。
2.OpenAI首個Agent產品的使用情況如何
主持人:
今天我們早些時候還提到了 AI 代理(agents)和 OpenAI。你們推出了自己的 AI 代理,其中一個叫 Operator,它可以幫助人類使用計算機;另一個叫 Deep Research,它因其能夠代表人類進行信息研究而引起了廣泛關注。能否介紹一下這些代理在你們的客戶以及 ChatGPT 用戶中的使用情況?
斯里尼瓦斯:
首先,我想說,我們確實談到了代理,但其實這是一個非常令人驚嘆的技術時代。我認為 AI 可能是我們一生中最大的技術變革。但我確實認為今年將特別深刻地展示這一點。
舉個例子,在我回答問題之前,我們最近推出了 o1 和 o3 Mini。更近一些,我們還展示了模型如何像我們所說的“思維鏈摘要器”一樣工作。當你看到模型面對復雜的數學或科學問題時,再看看它的回答,看看它是如何思考的,有時你會感到非常激動。能夠擁有這些能夠思考復雜問題的 AI 系統(tǒng),這真是太神奇了,令人興奮不已。
現在回答你的問題,人們是如何使用這些技術的?我舉幾個例子。比如有一家叫 Oscar Health 的公司,它通過推理模型更好地理解患者結果。
主持人:
他們使用的是 Operator 代理。
斯里尼瓦斯:
不,他們實際上使用的是我們的基礎 o1 模型。我稍后會談到 Operator 和 Deep Research。你可以把 Operator 和 Deep Research 看作是在基礎推理模型之上構建的,專門用于特定任務的模型。我會先從基礎推理模型及其用途說起,然后再具體談談 Operator 和 Deep Research。
推理模型 o1 正在被 Oscar Health 使用,推理模型還在生物科學領域有很有趣的用途。有一家公司用它來更好地估計臨床試驗結果,以便確定哪些藥物用于藥物發(fā)現。還有一個來自伯克利國家實驗室的驚人例子,他們試圖利用推理模型來理解哪些突變基因可能導致罕見疾病的癥狀。這些是極其強大的例子,推理模型正在幫助我們解決這些非常困難和復雜的問題。
推理模型的用途不僅限于醫(yī)療保健,還涉及稅務分析等領域。它的應用非常廣泛。我們看到人們用它來策略性地解決問題、研究問題、編寫代碼,我們稍后可能會談到。所以,推理模型的用戶群體非常廣泛。
現在,我們來談談 Deep Research,這是我們最近推出的系統(tǒng),你可以利用推理模型來完成一些高級研究任務。
比如,你可能要分析一家公司或整個行業(yè)的財務狀況。我們通常會進行搜索,瀏覽文件,查找特定信息,整理后進行總結,還可能會進行后續(xù)搜索?,F在,我們有了能夠代表我們自動完成這些任務的 AI 模型。
你可以這樣想,一個人可能需要花費數小時來完成這些任務。比如,如果我問你“過去十年零售行業(yè)發(fā)生了什么變化”,這不是一個很明顯的問題。你可能要花幾個小時才能寫出一份研究報告?,F在,我們有了能夠在幾分鐘內完成這些任務的模型,并給出答案。我認為這是一個非常強大的工具。
Operator 是另一個例子,我們現在可以讓 AI 系統(tǒng)在瀏覽器環(huán)境中代替我們操作。比如,如果你想在本周末預訂一家餐廳,你可能知道自己想要什么,然后說:“幫我預訂一家本周末的墨西哥餐廳?!彼酪ニ阉?OpenTable,知道你的喜好,會問“這個有空嗎?”然后代表你自動完成這些操作。你可以設置規(guī)則等。我認為我們已經部署了這些,盡管還處于早期階段,我們還將從人們的使用中學習很多。
3.如何評價DeepSeek R1
主持人(重頭戲):
你剛才提到的在當前 AI 領域工作的興奮之情,我想問一下,中國 AI 公司 DeepSeek 的出現以及他們自己的 R1 模型(這是一個推理模型)意味著什么。據說 DeepSeek 的 R1 模型訓練只花費了區(qū)區(qū)幾百萬美元,這是否意味著基礎模型領域整體面臨價格壓力?這對你們自己的 o1、o3 和 o3-mini 推理模型是否構成價格壓力?
斯里尼瓦斯:
我認為 DeepSeek 展示的是,你可以以比我們之前推出的模型更經濟的方式獲得一個很好的模型。但我認為這只是技術趨勢的一部分。他們展示了價格 - 能力曲線上的另一個點。如果你看看我們自己的模型在過去幾年里,GPT-4 模型的價格在短短幾年內已經下降為原來的 1/150 。所以你會看到一個持續(xù)的趨勢,即功能強大的模型將繼續(xù)變得更便宜。
DeepSeek 在這方面有一些創(chuàng)新,他們展示了價格 - 能力曲線上的另一個點。我們將繼續(xù)這種趨勢,你也會看到我們的模型變得更便宜。所以我認為他們證明的是,這種趨勢將繼續(xù)下去,你將看到我們和其他公司也會這樣做。
4.如何看待DeepSeek的疑似蒸餾OpenAI的數據
主持人:
你們對 DeepSeek 的回應之一是正在調查 DeepSeek 是否使用或蒸餾了你們模型的訓練數據來創(chuàng)建自己的模型或聊天機器人。那么這項調查的進展如何?你們還在調查是否是這種情況嗎?
斯里尼瓦斯:
是的,我們仍在調查,并正在評估。我認為我們目前沒有具體的內容可以分享。根據評估的結果,我們可能會在稍后分享一些內容。但更重要的是,我認為重要的是這種趨勢,即我們將繼續(xù)擁有功能強大但價格更低的模型。
此外,還有一個關于蒸餾的普遍趨勢。蒸餾意味著你可以構建一個較小的模型,讓它從一個較大的模型中學習。我們自己的平臺上也有端到端的蒸餾功能。這不是我們第一次可以在我們的平臺上進行這樣的操作,例如,你可以在一個 400b 模型的基礎上微調一個迷你模型,或者在 4b 模型的基礎上進行微調。這意味著公司可以在比以前更低的價格點上,為特定任務獲得功能強大的模型。所以我認為這種趨勢將繼續(xù)下去,你也會在推理模型上看到這一點。
最令人驚嘆的是,我們現在有一個叫做強化微調的過程,可以利用我們開發(fā)自己模型時使用的相同推理技術,并將其提供給我們的客戶,讓他們能夠使用相同的推理技術為特定任務微調較小的模型。我認為這種趨勢將指向一個方向,即你可以獲得針對特定任務的小型、成本效益高的模型。
主持人:
我想這可能會引起在座企業(yè)的共鳴。但你們的推理模型,尤其是你們最強大的模型,成本還會降低多少?你說過有些模型的成本至少已經降為了原來的1/150,但還有很長的路要走,它們還能變得多便宜?
斯里尼瓦斯:
我想我可以借鑒歷史趨勢。一般來說,我認為在一年內,類似能力的模型價格可能降低為 1/10 。有很多創(chuàng)新,既包括我們在構建新一代模型時的創(chuàng)新,也包括我們如何優(yōu)化這些模型以更高效地在 GPU 集群上運行。我認為這種趨勢將繼續(xù)下去。
5.星際之門為什么需要這么多算力
主持人:
我想問一下關于 Stargate 的問題,這是你們與特朗普總統(tǒng)、軟銀和甲骨文在白宮宣布的所謂 5000 億美元的合資企業(yè)。OpenAI 為什么需要這么多計算能力?答案可能很明顯,但你能告訴觀眾為什么需要這么多計算能力嗎?是為了更好的推理模型,還是為了 AGI?它的用途是什么?
斯里尼瓦斯:
是的,我認為有幾個方面。一方面,為了推進智能的發(fā)展,我們知道有一些規(guī)模法則,即你應用更多的計算能力、更多的數據,當然,還有算法創(chuàng)新。我們可以繼續(xù)獲得更智能的模型。我們解鎖了兩種不同的規(guī)模維度。第一種是我們過去在 GPT 時代所擁有的,即訓練這些大型語言模型。第二種是我們解鎖的,你可以在所謂的推理過程中應用更多的計算能力,即你提問,模型做出回應。這是我們可以擴展模型的另一個維度。我們相信,通過更多的計算能力,你可以繼續(xù)構建更好、更先進的智能模型。
第二個方面是一旦我們談到這些模型的成本降低,這意味著構建應用程序并提供好處的機會是巨大的。每次成本降低,你都在為世界各地的人們提供一系列更經濟實惠的應用程序。因此,我們需要大量基礎設施的一個重要部分,也是為了能夠部署這些模型,用于人們正在構建的所有這些令人難以置信的應用程序。所以我認為,在某種程度上,這場革命將非常深刻,就像 120 年前的電力一樣。因此,我認為我們需要大量的基礎設施,才能真正將 AI 的好處帶給全人類。
主持人:
那么,真的是在推理方面,使用模型方面,AI 的使用將轉向那里嗎?我還想知道,DeepSeek 至少讓我和硅谷的許多人認為,我們是否過度依賴 GPU 方面了?我們都看到了英偉達市場調整的情況。你說過,這既是在訓練方面,也是在推理方面。
斯里尼瓦斯:
這既是在訓練方面,也是在推理方面。我認為市場調整被夸大了。
我認為重要的是要認識到,在訓練模型之前,背后有很多研究工作。有時,當你談論訓練模型的成本時,你必須包括你正在進行的所有不同研究實驗的總和。而這些有時會在一些標題中被忽略。為了領先,背后有大量的研究工作。你可能需要進行 100 次實驗,然后才決定要繼續(xù)進行哪次實驗。這些在一些標題中沒有被計算在內。
主持人:
所以你必須考慮這一點。那么,DeepSeek 真的只花了區(qū)區(qū)幾百萬美元就訓練了他們的模型嗎?這真的可行嗎?
斯里尼瓦斯:
我認為這是一個非常不同的問題,即運行一次模型的成本與擁有一個能夠持續(xù)產生研究創(chuàng)新的系統(tǒng)需要的成本。
主持人:
那么,這是一個“不”的答案嗎?也許。
斯里尼瓦斯:
我不能代表他們,因為我沒有深入了解他們是如何做到的,但我從一般的研究工作角度給你一個見解。然后,背后有大量的研究工作。然后,當你訓練一個單一模型時,這個單一模型的成本,是的,這可能非常不同。但你必須將所有這些加在一起。
6.OpenAI內部的工程挑戰(zhàn)
主持人:
我想問一下,圍繞在這樣一個重要的 AI 公司工作時的工程挑戰(zhàn),尤其是在這個關鍵時期,你們正在為這些困難的問題構建解決方案,比如那些想要使用你們產品的企業(yè),以及數百萬使用你們產品的消費者。
我也想知道,所有這些頭條新聞,尤其是最近關于埃隆·馬斯克提出以 974 億美元收購 OpenAI 的消息,是否會對你們造成干擾?我們今天早些時候聽到你們的董事長布雷特·泰勒談到過這個問題。當周圍發(fā)生這么多事情時,你們如何專注于構建和解決這些困難的挑戰(zhàn)?
斯里尼瓦斯:
Adobe Acrobat AI Assistant 幫助我通過 AI 助手與客戶建立信任,我可以快速找到合同細節(jié),將所有這些整合在一起,有助于我定位自己為專家,并且讓我有信心與客戶交談。我將專注于工程挑戰(zhàn)。我認為布雷特和山姆已經回答了關于埃隆的問題,我可以重復他們的答案。公司的使命并不是出售公司。
工程挑戰(zhàn)實際上是非常令人興奮的。顯然,構建模型、擴展模型以及每個新模型在基礎設施上都面臨著新的可擴展性限制,因此在訓練模型方面存在大量的工程挑戰(zhàn)。在推理優(yōu)化、降低成本方面也有非常有趣的挑戰(zhàn)。但在大規(guī)模部署這些產品時,也有大量的工程挑戰(zhàn)。我們的產品增長速度非常快,可能是歷史上增長最快的產品之一。所以,這意味著你如何準備你的工程組織以實現規(guī)?;??
還有一個有趣的挑戰(zhàn),因為一旦你將 AI 部署到現實世界中,它必須學會與人們關心的所有系統(tǒng)進行交互。它必須與企業(yè)中的各種應用程序進行交互,必須理解企業(yè)所擁有的獨特數據集。因此,我們還需要在使 AI 能夠理解應用程序、理解文檔等方面進行大量的工程創(chuàng)新。我認為,在我們?yōu)榇砦磥碜鰷蕚鋾r,如何使企業(yè)能夠利用這種代理技術自動化工作流程,這是一個非常令人興奮的工程挑戰(zhàn)。
7.OpenAI在推出行業(yè)定制工具
主持人:
那么我們可以期待 OpenAI 在這方面直接推出更多的產品創(chuàng)新嗎?你們通常將它描述為一種通用的、適用于每個人的工具,但像醫(yī)療保健、法律或零售等特定行業(yè)對你們的技術有不同的用途。你們是否計劃推出更多針對特定行業(yè)的工具?
斯里尼瓦斯:
我們正在使很多人能夠做到這一點。我們通常做的是構建能夠使其他人構建所有這些應用程序的工具集,我們構建的工具將是非常通用的。它可以使得醫(yī)療保健公司能夠使用我們的模型、使用我們的工具,并弄清楚如何將它們集成起來,然后在它們的基礎上構建這些令人驚嘆的應用程序。
主持人:
那么對于那些需要你們提供更多幫助的公司呢?你們是否計劃推出類似定制工具的東西,或者更定制化的東西?
斯里尼瓦斯:
我認為定制化是我們戰(zhàn)略的一個非常重要的部分,我們已經推出了一整套定制化工具,使公司能夠定制 GPT-4 等。最近,我們推出了一個叫做強化微調的工具,這非常令人興奮。這種新的推理范式意味著,如果你能將公司中的某些工作流程或任務表達出來,并提供一種評估答案的方法,你現在可以構建能夠從這些少量樣本中學習的定制化模型。有時,只需要幾十個樣本。這與之前的定制化時代相比是一個巨大的轉變。在之前的時代,你可能需要數千個,甚至更多的樣本,但現在,推理模型能夠很好地泛化。
我認為這非常令人興奮,基本的原則是,你可以將任何任務,弄清楚你想要如何思考它,并找到一種評估它的方式。如果你能將你的工作表達出來,或者將你的問題以這種方式表達出來,你將擁有令人驚嘆的 AI。我認為這是一個非常重要的基礎。
8.私有化模型的重要性,不止于開源
主持人:
我想問一下關于你們令人驚嘆的 AI,以及它被專有化的重要性,即它被鎖在幕后而不是開源。你們確實開源了一些模型,但在 DeepSeek 的 SS R1 模型發(fā)布后不久,你們的 CEO 山姆·阿爾特曼說,我們可能站在歷史的錯誤一邊,也許我們需要一種新的開源策略。你如何看待這一說法?是否意味著你們需要開始開源 o1、o3 等模型?這到底是什么意思?
斯里尼瓦斯:
我們正在內部討論。你們需要記住幾件事。當我們與客戶交談時,這不僅僅關乎模型是否開源。他們關心的是整個生態(tài)系統(tǒng)。他們關心的是擁有高質量、成本效益高、易于使用且可定制的模型。我們認為,為了實現造福人類的使命,構建這些產品也非常重要。此外,正如山姆所說,我們正在重新思考我們的戰(zhàn)略。
歷史上,我們一直擔心我們的前沿模型開源后的安全性,因為很難理解風險以及人們可能以何種方式使用它們。隨著我們不斷學習,我們也會調整我們的戰(zhàn)略。但回到企業(yè)真正關心的問題,這不僅僅是模型或權重是否開源,他們真正關心的是擁有一個易于使用且能夠解決他們問題的出色產品,而且這個產品是成本效益高的。這是我們一直聽到的,我們也將繼續(xù)構建這樣的產品。
Q&A:OpenAI內部是如何使用ChatGPT或者自家模型的
主持人:
好的,非常感謝。我想確保我們有時間回答觀眾的問題,我看到這里有很多問題。我想,拉里,你是第一個舉手的人。后面那位先生,你先來吧。
觀眾提問1:
感謝你們所做的一切。這是一個令人驚嘆的時代。大約一年半前,Meta 發(fā)布了 Cicero,它基本上是一個游戲,通過將定制化的戰(zhàn)略推理與語言模型相結合,玩得相當出色。
我的問題是,我們距離那個時代還有多遠,那時像我們這樣的普通公司能夠將我們自己的專業(yè)推理模型與你們的工具結合起來,并在我們自己的領域獲得類似的能力,比如真正的代理行為,體現我們專有的邏輯來完成相當復雜的任務?
斯里尼瓦斯:
絕對如此,我實際上認為現在就是那個時代,強化微調產品應該能夠實現你們所說的用例,即每個企業(yè)都有自己獨特的任務,你們有特定的思考過程。如果你能夠客觀地弄清楚如何評估這個思考過程,我們現在有了可以非常快速地學習的通用模型。所以,我絕對建議你們嘗試并進行實驗。
觀眾提問2:
嗨,我的問題是,你們什么時候會構建一個像 Operator 一樣的模型來構建應用程序本身?你們會進入應用開發(fā)領域嗎?如果是的話,時間框架是什么?可以重復一下問題嗎?是的,就像 Operator 在操作事物一樣。你們什么時候會推出一個能夠真正構建應用程序本身的模型,即 SaaS 應用程序?
斯里尼瓦斯:
一方面,我們編碼模型的質量正在不斷提高。如今,人們已經在使用輔助編碼來開發(fā)各種軟件,無論是在 IDE 中,還是在 ChatGPT 中,我們都有能力創(chuàng)建輕量級應用程序。你可以創(chuàng)建 JavaScript,可以創(chuàng)建簡單的網站。所以,我認為創(chuàng)建簡單應用程序的技術已經存在。隨著模型推理能力的提高,你應該能夠利用它們?yōu)槟銊?chuàng)建更復雜的應用程序。其中一個領域,我們將看到推理模型被部署,那就是編碼領域。隨著推理質量的提高,你應該能夠非常輕松地創(chuàng)建更復雜的應用程序。
主持人:
好的,薩蒂什,我們會派人把麥克風遞給你。
觀眾提問3:
斯里尼瓦斯,感謝你。這確實是一個令人興奮的時代。我在一家金融機構工作,對于廣泛采用和適應 OpenAI 的一個主要障礙是可解釋性的問題。我很高興聽到你談到“思維鏈”。
你能進一步闡述一下嗎?我們如何采用它?
斯里尼瓦斯:
思維鏈基本上是內心的獨白。你可以這樣想,如果你問我一個復雜的問題,你會思考并得出答案。模型中的那個獨白過程就是我們所說的“思維鏈”。最近,我們開始將這些思維鏈進行總結,并在產品中以“總結思維鏈”的形式提供?,F在,我們已經擴展了這一功能,你可以更深入地了解思維鏈過程是什么樣的。
實際上,我認為這是可解釋性方面的一個非常強大的工具,因為人們總是會問:“你是如何得出這些答案的?”而我們可以回答:“這是我是如何思考這個問題的,這是我的評估過程,這就是我認為這是正確答案的原因?!彼?,我認為這是在幫助人們獲得可解釋性答案方面的一個重大進步。
觀眾提問4:
謝謝你,沙馬·穆罕默德·卡·馬克斯,首席信息官兼首席技術官。我們一直是 OpenAI 的早期采用者,在人們知道什么是 OpenAI ChatGPT 之前,我們就是它的忠實粉絲了。這真的很酷。
我們在公司內部有很多不同的工具和應用,有些面向客戶,有些是內部使用的。所以,我們主要的一個問題和關注點是我們如何確保我們擁有的專有信息、專有數據以及從社區(qū)角度獲得的知識,不會被用來讓對其他人開放的模型變得更聰明呢?這是一個我們需要走鋼絲并保持平衡的問題,因為我們擁有 30 多年的知識,這讓我們與眾不同。我們不希望將這些知識用于訓練模型,讓計算機可能會利用這些知識。
斯里尼瓦斯:
絕對如此,我們非常重視這一點。對于我們的企業(yè)客戶、團隊客戶以及 API 用戶,我們不會使用你們的數據進行訓練。這是我們做出的承諾。你應該完全放心。我們很樂意與你合作,告訴你事情是如何運作的。但基本上,是的,我們不會使用客戶的數據進行訓練。
主持人:
好的,我想我們還有時間回答一到兩個問題。這邊有一位穿著夾克的先生。
觀眾提問4:
嗨,我是斯蒂芬·卡韋利,我有一個關于 Operator 的問題。因為從代理的角度來看,這是我們都期待的一個能力,有很多用例。下一步會是什么?
斯里尼瓦斯:
是的,我認為這非常令人興奮。我們希望逐步學習人們是如何使用它的。我們希望對模型在執(zhí)行某些操作方面的能力建立信心。如果今天你想在付款之前進行確認,我會要求你進行確認。所以我認為有很多不同的用例,我們期望人們會使用它并進行部署。但既然還處于早期階段,你也希望逐步學習它在所有這些用例中的表現如何。更廣泛地說,模型的質量會提高。
你會對模型建立更多的信任。你會因為你也期望在你希望提供輸入的時候確認,而不是讓模型自行操作。這些都是我們將要學習的東西。更廣泛地說,Operator 不應該只在瀏覽器中工作,它應該能夠處理整個計算機或任何不同的環(huán)境。所以我認為它還有許多其他方面的成長空間。是的,我們希望它能夠在你的授權和偏好下代表你操作。
主持人:
好的,我還有一個最后的問題要問你,斯里尼瓦斯。我知道在座的大多數,如果不是全部的話,都使用過 ChatGPT 或 GPT 的某個版本。OpenAI 是如何使用自己的產品的?你們是如何使用 ChatGPT 或你們的 API 的任何版本的?
斯里尼瓦斯:
是的,我們用它來完成很多事情。作為一名工程師,我先從工程方面說起,然后我會談到其他功能。
作為工程師,我們用它來輔助編碼。我們用它來查找代碼中的錯誤。我們有很多 Slack 頻道,人們會在上面詢問有關某些技術或某些 API 的問題,我們有自動化的助手來幫助回答這些問題。
我們還用它來進行內部知識共享,比如公司里總是有很多項目在進行,像“這個項目是什么?我該如何了解更多?”我們有一個工具可以做到這一點。你可以直接問:“項目 X 是什么?”它會給你一個很好的總結。除了工程領域,我們的財務團隊還用它來分析我們與各種供應商簽訂的法律合同,看看是否有我們需要了解的細微之處。我們用它來處理客戶服務,自動回答客戶的問題。所以它在公司內部被廣泛使用。
主持人:
我想這對在座的許多人來說可能是一種鼓舞,因為這正是他們使用 AI 的方式。非常感謝你抽出時間。
斯里尼瓦斯:
謝謝你。
本文轉載自??51CTO技術棧??,作者:言征
