自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

GPT-4價(jià)格已被砍成1/150 !OpenAI副總裁回應(yīng)DeepSeek的競(jìng)爭(zhēng),揭秘內(nèi)部員工花式使用自家產(chǎn)品,有很多工程難題

原創(chuàng) 精選
人工智能
斯里尼瓦斯認(rèn)為,DeepSeek 展示了價(jià)格 - 能力曲線上的另一個(gè)點(diǎn)。并毫不掩飾 OpenAI 同樣在這條曲線上做了同樣驚艷的努力:“如果你看看我們自己的模型在過去幾年里,GPT-4 模型的價(jià)格在短短幾年內(nèi)已經(jīng)降為了原來的1/150。”

編輯 | 言征

2天前,就在馬斯克宣布要以 974 億美元收購(gòu) OpenAI 后,OpenAI 工程副總裁斯里尼瓦斯·納拉亞南( Srinivas Narayanan) 接受了華爾街日?qǐng)?bào)的一次線下對(duì)話,這次對(duì)話同樣也是出于一場(chǎng)中美 AI 博弈的新語(yǔ)境下:DeepSeek R1低成本訓(xùn)練出可以對(duì)標(biāo) Open AI o1的強(qiáng)推理模型,甚至登頂了應(yīng)用排行榜,美國(guó)現(xiàn)在已經(jīng)封禁了DeepSeek應(yīng)用的下載。

主持人當(dāng)然沒有放過斯里尼瓦斯,問了他這個(gè)非常敏感的問題。那么 OpenAI 內(nèi)部究竟是如何看待 DeepSeek 的?是否還在調(diào)查 DeepSeek 有使用 OpenAI 模型產(chǎn)生的數(shù)據(jù)用于蒸餾?

相信大家同樣也會(huì)關(guān)注這些問題。斯里尼瓦斯認(rèn)為,DeepSeek 展示了價(jià)格 - 能力曲線上的另一個(gè)點(diǎn)。并毫不掩飾 OpenAI 同樣在這條曲線上做了同樣驚艷的努力:“如果你看看我們自己的模型在過去幾年里,GPT-4 模型的價(jià)格在短短幾年內(nèi)已經(jīng)降為了原來的1/150?!?/span>

除了 DeepSeek,作為工程副總裁,斯里尼瓦斯還分享了許多 OpenAI 內(nèi)部在推理模型和Agent方面的進(jìn)展,o1 模型已經(jīng)有了很多用例,而首款智能體產(chǎn)品Operator 和 Deep Research 同樣也各自有著工程挑戰(zhàn),OpenAI 內(nèi)部正在這些方面做很有意思的實(shí)踐探索。

觀眾之中也提了非常精彩的提問,諸如 OpenAI 下一步有關(guān) Agent 的計(jì)劃,OpenAI 自己內(nèi)部是如何使用ChatGPT等自己開發(fā)的產(chǎn)品的等等。

還有一個(gè)有趣的挑戰(zhàn),因?yàn)橐坏┠銓?AI 部署到現(xiàn)實(shí)世界中,它必須學(xué)會(huì)與人們關(guān)心的所有系統(tǒng)進(jìn)行交互。

話不多說,這里先列幾個(gè)精彩觀點(diǎn):

1.為了領(lǐng)先,背后有大量的研究工作。你可能需要進(jìn)行 100 次實(shí)驗(yàn),然后才決定要繼續(xù)進(jìn)行哪次實(shí)驗(yàn)。

2.如果你看看我們自己的模型在過去幾年里,GPT-4 模型的價(jià)格在短短幾年內(nèi)已經(jīng)降為了原來的1/150。

3.ChatGPT 已經(jīng)在 OpenAI 內(nèi)部得到廣泛應(yīng)用,包括代碼輔助、知識(shí)共享、合同分析和客戶服務(wù)等。

4.企業(yè)對(duì)AI的需求不僅在于模型的開源性,更在于AI產(chǎn)品的整體質(zhì)量、成本效益和易用性。

5.OpenAI 的目標(biāo)是提供高質(zhì)量、可定制且易于使用的 AI 工具,幫助企業(yè)解決實(shí)際問題。

6.OpenAI 也在探索新的開源策略,以更好地平衡技術(shù)創(chuàng)新和安全性。

7.構(gòu)建模型、擴(kuò)展模型以及每個(gè)新模型在基礎(chǔ)設(shè)施上都面臨著新的可擴(kuò)展性限制,因此在訓(xùn)練模型方面存在大量的工程挑戰(zhàn)。同樣,在推理優(yōu)化、降低成本方面也有著非常有趣的挑戰(zhàn)。

8.在一年內(nèi),類似能力的模型價(jià)格可能降低為 1/10 。

以下是采訪內(nèi)容整理,供君一覽(技術(shù)干貨不少,很精彩):

1.OpenAI眼中的推理

主持人:

我們先從推理的定義開始吧,以及為什么在座的企業(yè)需要 AI 模型具備推理能力。OpenAI 對(duì)推理的定義是什么,為什么這對(duì)企業(yè)很重要呢?

斯里尼瓦斯:

推理本質(zhì)上是一種系統(tǒng)性思考和解決更復(fù)雜問題的能力。如果問一個(gè)人非常簡(jiǎn)單的問題,我們幾乎會(huì)立即給出答案。但如果問一個(gè)復(fù)雜的數(shù)學(xué)問題,你不可能立刻給出答案。你可能需要花更長(zhǎng)時(shí)間去思考,需要推理,需要判斷自己是否在正確的道路上。所以,AI 系統(tǒng)具備這種能力,能夠處理更復(fù)雜的任務(wù),長(zhǎng)時(shí)間思考并評(píng)估自己是否在正確的道路上,這就是我們所說的推理。

主持人:

推理也是通往人工通用智能(AGI)的路徑嗎?OpenAI 曾多次提到 AGI,它的含義是什么,推理是否是通往 AGI 的必經(jīng)之路?

斯里尼瓦斯:

是的,絕對(duì)如此。AGI 這個(gè)詞有很多種不同的解釋和含義,但我們有一種說法是,AI 能夠解決具有經(jīng)濟(jì)價(jià)值的任務(wù)。世界上有很多對(duì)我們社會(huì)來說很重要的任務(wù),要完成它們,你需要能夠處理復(fù)雜任務(wù)并深入思考問題。所以,我認(rèn)為推理是通往 AGI 的路徑。

2.OpenAI首個(gè)Agent產(chǎn)品的使用情況如何

主持人:

今天我們?cè)缧r(shí)候還提到了 AI 代理(agents)和 OpenAI。你們推出了自己的 AI 代理,其中一個(gè)叫 Operator,它可以幫助人類使用計(jì)算機(jī);另一個(gè)叫 Deep Research,它因其能夠代表人類進(jìn)行信息研究而引起了廣泛關(guān)注。能否介紹一下這些代理在你們的客戶以及 ChatGPT 用戶中的使用情況?

斯里尼瓦斯:

首先,我想說,我們確實(shí)談到了代理,但其實(shí)這是一個(gè)非常令人驚嘆的技術(shù)時(shí)代。我認(rèn)為 AI 可能是我們一生中最大的技術(shù)變革。但我確實(shí)認(rèn)為今年將特別深刻地展示這一點(diǎn)。

舉個(gè)例子,在我回答問題之前,我們最近推出了 o1 和 o3 Mini。更近一些,我們還展示了模型如何像我們所說的“思維鏈摘要器”一樣工作。當(dāng)你看到模型面對(duì)復(fù)雜的數(shù)學(xué)或科學(xué)問題時(shí),再看看它的回答,看看它是如何思考的,有時(shí)你會(huì)感到非常激動(dòng)。能夠擁有這些能夠思考復(fù)雜問題的 AI 系統(tǒng),這真是太神奇了,令人興奮不已。

現(xiàn)在回答你的問題,人們是如何使用這些技術(shù)的?我舉幾個(gè)例子。比如有一家叫 Oscar Health 的公司,它通過推理模型更好地理解患者結(jié)果。

主持人:

他們使用的是 Operator 代理。

斯里尼瓦斯:

不,他們實(shí)際上使用的是我們的基礎(chǔ) o1 模型。我稍后會(huì)談到 Operator 和 Deep Research。你可以把 Operator 和 Deep Research 看作是在基礎(chǔ)推理模型之上構(gòu)建的,專門用于特定任務(wù)的模型。我會(huì)先從基礎(chǔ)推理模型及其用途說起,然后再具體談?wù)?Operator 和 Deep Research。

推理模型 o1 正在被 Oscar Health 使用,推理模型還在生物科學(xué)領(lǐng)域有很有趣的用途。有一家公司用它來更好地估計(jì)臨床試驗(yàn)結(jié)果,以便確定哪些藥物用于藥物發(fā)現(xiàn)。還有一個(gè)來自伯克利國(guó)家實(shí)驗(yàn)室的驚人例子,他們?cè)噲D利用推理模型來理解哪些突變基因可能導(dǎo)致罕見疾病的癥狀。這些是極其強(qiáng)大的例子,推理模型正在幫助我們解決這些非常困難和復(fù)雜的問題。

推理模型的用途不僅限于醫(yī)療保健,還涉及稅務(wù)分析等領(lǐng)域。它的應(yīng)用非常廣泛。我們看到人們用它來策略性地解決問題、研究問題、編寫代碼,我們稍后可能會(huì)談到。所以,推理模型的用戶群體非常廣泛。

現(xiàn)在,我們來談?wù)?Deep Research,這是我們最近推出的系統(tǒng),你可以利用推理模型來完成一些高級(jí)研究任務(wù)。

比如,你可能要分析一家公司或整個(gè)行業(yè)的財(cái)務(wù)狀況。我們通常會(huì)進(jìn)行搜索,瀏覽文件,查找特定信息,整理后進(jìn)行總結(jié),還可能會(huì)進(jìn)行后續(xù)搜索?,F(xiàn)在,我們有了能夠代表我們自動(dòng)完成這些任務(wù)的 AI 模型。

你可以這樣想,一個(gè)人可能需要花費(fèi)數(shù)小時(shí)來完成這些任務(wù)。比如,如果我問你“過去十年零售行業(yè)發(fā)生了什么變化”,這不是一個(gè)很明顯的問題。你可能要花幾個(gè)小時(shí)才能寫出一份研究報(bào)告?,F(xiàn)在,我們有了能夠在幾分鐘內(nèi)完成這些任務(wù)的模型,并給出答案。我認(rèn)為這是一個(gè)非常強(qiáng)大的工具。

Operator 是另一個(gè)例子,我們現(xiàn)在可以讓 AI 系統(tǒng)在瀏覽器環(huán)境中代替我們操作。比如,如果你想在本周末預(yù)訂一家餐廳,你可能知道自己想要什么,然后說:“幫我預(yù)訂一家本周末的墨西哥餐廳?!彼酪ニ阉?OpenTable,知道你的喜好,會(huì)問“這個(gè)有空嗎?”然后代表你自動(dòng)完成這些操作。你可以設(shè)置規(guī)則等。我認(rèn)為我們已經(jīng)部署了這些,盡管還處于早期階段,我們還將從人們的使用中學(xué)習(xí)很多。

3.如何評(píng)價(jià)DeepSeek R1

主持人(重頭戲):

你剛才提到的在當(dāng)前 AI 領(lǐng)域工作的興奮之情,我想問一下,中國(guó) AI 公司 DeepSeek 的出現(xiàn)以及他們自己的 R1 模型(這是一個(gè)推理模型)意味著什么。據(jù)說 DeepSeek 的 R1 模型訓(xùn)練只花費(fèi)了區(qū)區(qū)幾百萬(wàn)美元,這是否意味著基礎(chǔ)模型領(lǐng)域整體面臨價(jià)格壓力?這對(duì)你們自己的 o1、o3 和 o3-mini 推理模型是否構(gòu)成價(jià)格壓力?

斯里尼瓦斯:

我認(rèn)為 DeepSeek 展示的是,你可以以比我們之前推出的模型更經(jīng)濟(jì)的方式獲得一個(gè)很好的模型。但我認(rèn)為這只是技術(shù)趨勢(shì)的一部分。他們展示了價(jià)格 - 能力曲線上的另一個(gè)點(diǎn)。如果你看看我們自己的模型在過去幾年里,GPT-4 模型的價(jià)格在短短幾年內(nèi)已經(jīng)下降為原來的 1/150 。所以你會(huì)看到一個(gè)持續(xù)的趨勢(shì),即功能強(qiáng)大的模型將繼續(xù)變得更便宜。

DeepSeek 在這方面有一些創(chuàng)新,他們展示了價(jià)格 - 能力曲線上的另一個(gè)點(diǎn)。我們將繼續(xù)這種趨勢(shì),你也會(huì)看到我們的模型變得更便宜。所以我認(rèn)為他們證明的是,這種趨勢(shì)將繼續(xù)下去,你將看到我們和其他公司也會(huì)這樣做。

4.如何看待DeepSeek的疑似蒸餾OpenAI的數(shù)據(jù)

主持人:

你們對(duì) DeepSeek 的回應(yīng)之一是正在調(diào)查 DeepSeek 是否使用或蒸餾了你們模型的訓(xùn)練數(shù)據(jù)來創(chuàng)建自己的模型或聊天機(jī)器人。那么這項(xiàng)調(diào)查的進(jìn)展如何?你們還在調(diào)查是否是這種情況嗎?

斯里尼瓦斯:

是的,我們?nèi)栽谡{(diào)查,并正在評(píng)估。我認(rèn)為我們目前沒有具體的內(nèi)容可以分享。根據(jù)評(píng)估的結(jié)果,我們可能會(huì)在稍后分享一些內(nèi)容。但更重要的是,我認(rèn)為重要的是這種趨勢(shì),即我們將繼續(xù)擁有功能強(qiáng)大但價(jià)格更低的模型。

此外,還有一個(gè)關(guān)于蒸餾的普遍趨勢(shì)。蒸餾意味著你可以構(gòu)建一個(gè)較小的模型,讓它從一個(gè)較大的模型中學(xué)習(xí)。我們自己的平臺(tái)上也有端到端的蒸餾功能。這不是我們第一次可以在我們的平臺(tái)上進(jìn)行這樣的操作,例如,你可以在一個(gè) 400b 模型的基礎(chǔ)上微調(diào)一個(gè)迷你模型,或者在 4b 模型的基礎(chǔ)上進(jìn)行微調(diào)。這意味著公司可以在比以前更低的價(jià)格點(diǎn)上,為特定任務(wù)獲得功能強(qiáng)大的模型。所以我認(rèn)為這種趨勢(shì)將繼續(xù)下去,你也會(huì)在推理模型上看到這一點(diǎn)。

最令人驚嘆的是,我們現(xiàn)在有一個(gè)叫做強(qiáng)化微調(diào)的過程,可以利用我們開發(fā)自己模型時(shí)使用的相同推理技術(shù),并將其提供給我們的客戶,讓他們能夠使用相同的推理技術(shù)為特定任務(wù)微調(diào)較小的模型。我認(rèn)為這種趨勢(shì)將指向一個(gè)方向,即你可以獲得針對(duì)特定任務(wù)的小型、成本效益高的模型。

主持人:

我想這可能會(huì)引起在座企業(yè)的共鳴。但你們的推理模型,尤其是你們最強(qiáng)大的模型,成本還會(huì)降低多少?你說過有些模型的成本至少已經(jīng)降為了原來的1/150,但還有很長(zhǎng)的路要走,它們還能變得多便宜?

斯里尼瓦斯:

我想我可以借鑒歷史趨勢(shì)。一般來說,我認(rèn)為在一年內(nèi),類似能力的模型價(jià)格可能降低為 1/10 。有很多創(chuàng)新,既包括我們?cè)跇?gòu)建新一代模型時(shí)的創(chuàng)新,也包括我們?nèi)绾蝺?yōu)化這些模型以更高效地在 GPU 集群上運(yùn)行。我認(rèn)為這種趨勢(shì)將繼續(xù)下去。

5.星際之門為什么需要這么多算力

主持人:

我想問一下關(guān)于 Stargate 的問題,這是你們與特朗普總統(tǒng)、軟銀和甲骨文在白宮宣布的所謂 5000 億美元的合資企業(yè)。OpenAI 為什么需要這么多計(jì)算能力?答案可能很明顯,但你能告訴觀眾為什么需要這么多計(jì)算能力嗎?是為了更好的推理模型,還是為了 AGI?它的用途是什么?

斯里尼瓦斯:

是的,我認(rèn)為有幾個(gè)方面。一方面,為了推進(jìn)智能的發(fā)展,我們知道有一些規(guī)模法則,即你應(yīng)用更多的計(jì)算能力、更多的數(shù)據(jù),當(dāng)然,還有算法創(chuàng)新。我們可以繼續(xù)獲得更智能的模型。我們解鎖了兩種不同的規(guī)模維度。第一種是我們過去在 GPT 時(shí)代所擁有的,即訓(xùn)練這些大型語(yǔ)言模型。第二種是我們解鎖的,你可以在所謂的推理過程中應(yīng)用更多的計(jì)算能力,即你提問,模型做出回應(yīng)。這是我們可以擴(kuò)展模型的另一個(gè)維度。我們相信,通過更多的計(jì)算能力,你可以繼續(xù)構(gòu)建更好、更先進(jìn)的智能模型。

第二個(gè)方面是一旦我們談到這些模型的成本降低,這意味著構(gòu)建應(yīng)用程序并提供好處的機(jī)會(huì)是巨大的。每次成本降低,你都在為世界各地的人們提供一系列更經(jīng)濟(jì)實(shí)惠的應(yīng)用程序。因此,我們需要大量基礎(chǔ)設(shè)施的一個(gè)重要部分,也是為了能夠部署這些模型,用于人們正在構(gòu)建的所有這些令人難以置信的應(yīng)用程序。所以我認(rèn)為,在某種程度上,這場(chǎng)革命將非常深刻,就像 120 年前的電力一樣。因此,我認(rèn)為我們需要大量的基礎(chǔ)設(shè)施,才能真正將 AI 的好處帶給全人類。

主持人:

那么,真的是在推理方面,使用模型方面,AI 的使用將轉(zhuǎn)向那里嗎?我還想知道,DeepSeek 至少讓我和硅谷的許多人認(rèn)為,我們是否過度依賴 GPU 方面了?我們都看到了英偉達(dá)市場(chǎng)調(diào)整的情況。你說過,這既是在訓(xùn)練方面,也是在推理方面。

斯里尼瓦斯:

這既是在訓(xùn)練方面,也是在推理方面。我認(rèn)為市場(chǎng)調(diào)整被夸大了。

我認(rèn)為重要的是要認(rèn)識(shí)到,在訓(xùn)練模型之前,背后有很多研究工作。有時(shí),當(dāng)你談?wù)撚?xùn)練模型的成本時(shí),你必須包括你正在進(jìn)行的所有不同研究實(shí)驗(yàn)的總和。而這些有時(shí)會(huì)在一些標(biāo)題中被忽略。為了領(lǐng)先,背后有大量的研究工作。你可能需要進(jìn)行 100 次實(shí)驗(yàn),然后才決定要繼續(xù)進(jìn)行哪次實(shí)驗(yàn)。這些在一些標(biāo)題中沒有被計(jì)算在內(nèi)。

主持人:

所以你必須考慮這一點(diǎn)。那么,DeepSeek 真的只花了區(qū)區(qū)幾百萬(wàn)美元就訓(xùn)練了他們的模型嗎?這真的可行嗎?

斯里尼瓦斯:

我認(rèn)為這是一個(gè)非常不同的問題,即運(yùn)行一次模型的成本與擁有一個(gè)能夠持續(xù)產(chǎn)生研究創(chuàng)新的系統(tǒng)需要的成本。

主持人:

那么,這是一個(gè)“不”的答案嗎?也許。

斯里尼瓦斯:

我不能代表他們,因?yàn)槲覜]有深入了解他們是如何做到的,但我從一般的研究工作角度給你一個(gè)見解。然后,背后有大量的研究工作。然后,當(dāng)你訓(xùn)練一個(gè)單一模型時(shí),這個(gè)單一模型的成本,是的,這可能非常不同。但你必須將所有這些加在一起。

6.OpenAI內(nèi)部的工程挑戰(zhàn)

主持人:

我想問一下,圍繞在這樣一個(gè)重要的 AI 公司工作時(shí)的工程挑戰(zhàn),尤其是在這個(gè)關(guān)鍵時(shí)期,你們正在為這些困難的問題構(gòu)建解決方案,比如那些想要使用你們產(chǎn)品的企業(yè),以及數(shù)百萬(wàn)使用你們產(chǎn)品的消費(fèi)者。

我也想知道,所有這些頭條新聞,尤其是最近關(guān)于埃隆·馬斯克提出以 974 億美元收購(gòu) OpenAI 的消息,是否會(huì)對(duì)你們?cè)斐筛蓴_?我們今天早些時(shí)候聽到你們的董事長(zhǎng)布雷特·泰勒談到過這個(gè)問題。當(dāng)周圍發(fā)生這么多事情時(shí),你們?nèi)绾螌W⒂跇?gòu)建和解決這些困難的挑戰(zhàn)?

斯里尼瓦斯:

Adobe Acrobat AI Assistant 幫助我通過 AI 助手與客戶建立信任,我可以快速找到合同細(xì)節(jié),將所有這些整合在一起,有助于我定位自己為專家,并且讓我有信心與客戶交談。我將專注于工程挑戰(zhàn)。我認(rèn)為布雷特和山姆已經(jīng)回答了關(guān)于埃隆的問題,我可以重復(fù)他們的答案。公司的使命并不是出售公司。

工程挑戰(zhàn)實(shí)際上是非常令人興奮的。顯然,構(gòu)建模型、擴(kuò)展模型以及每個(gè)新模型在基礎(chǔ)設(shè)施上都面臨著新的可擴(kuò)展性限制,因此在訓(xùn)練模型方面存在大量的工程挑戰(zhàn)。在推理優(yōu)化、降低成本方面也有非常有趣的挑戰(zhàn)。但在大規(guī)模部署這些產(chǎn)品時(shí),也有大量的工程挑戰(zhàn)。我們的產(chǎn)品增長(zhǎng)速度非??欤赡苁菤v史上增長(zhǎng)最快的產(chǎn)品之一。所以,這意味著你如何準(zhǔn)備你的工程組織以實(shí)現(xiàn)規(guī)?;??

還有一個(gè)有趣的挑戰(zhàn),因?yàn)橐坏┠銓?AI 部署到現(xiàn)實(shí)世界中,它必須學(xué)會(huì)與人們關(guān)心的所有系統(tǒng)進(jìn)行交互。它必須與企業(yè)中的各種應(yīng)用程序進(jìn)行交互,必須理解企業(yè)所擁有的獨(dú)特?cái)?shù)據(jù)集。因此,我們還需要在使 AI 能夠理解應(yīng)用程序、理解文檔等方面進(jìn)行大量的工程創(chuàng)新。我認(rèn)為,在我們?yōu)榇砦磥碜鰷?zhǔn)備時(shí),如何使企業(yè)能夠利用這種代理技術(shù)自動(dòng)化工作流程,這是一個(gè)非常令人興奮的工程挑戰(zhàn)。

7.OpenAI在推出行業(yè)定制工具

主持人:

那么我們可以期待 OpenAI 在這方面直接推出更多的產(chǎn)品創(chuàng)新嗎?你們通常將它描述為一種通用的、適用于每個(gè)人的工具,但像醫(yī)療保健、法律或零售等特定行業(yè)對(duì)你們的技術(shù)有不同的用途。你們是否計(jì)劃推出更多針對(duì)特定行業(yè)的工具?

斯里尼瓦斯:

我們正在使很多人能夠做到這一點(diǎn)。我們通常做的是構(gòu)建能夠使其他人構(gòu)建所有這些應(yīng)用程序的工具集,我們構(gòu)建的工具將是非常通用的。它可以使得醫(yī)療保健公司能夠使用我們的模型、使用我們的工具,并弄清楚如何將它們集成起來,然后在它們的基礎(chǔ)上構(gòu)建這些令人驚嘆的應(yīng)用程序。

主持人:

那么對(duì)于那些需要你們提供更多幫助的公司呢?你們是否計(jì)劃推出類似定制工具的東西,或者更定制化的東西?

斯里尼瓦斯:

我認(rèn)為定制化是我們戰(zhàn)略的一個(gè)非常重要的部分,我們已經(jīng)推出了一整套定制化工具,使公司能夠定制 GPT-4 等。最近,我們推出了一個(gè)叫做強(qiáng)化微調(diào)的工具,這非常令人興奮。這種新的推理范式意味著,如果你能將公司中的某些工作流程或任務(wù)表達(dá)出來,并提供一種評(píng)估答案的方法,你現(xiàn)在可以構(gòu)建能夠從這些少量樣本中學(xué)習(xí)的定制化模型。有時(shí),只需要幾十個(gè)樣本。這與之前的定制化時(shí)代相比是一個(gè)巨大的轉(zhuǎn)變。在之前的時(shí)代,你可能需要數(shù)千個(gè),甚至更多的樣本,但現(xiàn)在,推理模型能夠很好地泛化。

我認(rèn)為這非常令人興奮,基本的原則是,你可以將任何任務(wù),弄清楚你想要如何思考它,并找到一種評(píng)估它的方式。如果你能將你的工作表達(dá)出來,或者將你的問題以這種方式表達(dá)出來,你將擁有令人驚嘆的 AI。我認(rèn)為這是一個(gè)非常重要的基礎(chǔ)。

8.私有化模型的重要性,不止于開源

主持人:

我想問一下關(guān)于你們令人驚嘆的 AI,以及它被專有化的重要性,即它被鎖在幕后而不是開源。你們確實(shí)開源了一些模型,但在 DeepSeek 的 SS R1 模型發(fā)布后不久,你們的 CEO 山姆·阿爾特曼說,我們可能站在歷史的錯(cuò)誤一邊,也許我們需要一種新的開源策略。你如何看待這一說法?是否意味著你們需要開始開源 o1、o3 等模型?這到底是什么意思?

斯里尼瓦斯:

我們正在內(nèi)部討論。你們需要記住幾件事。當(dāng)我們與客戶交談時(shí),這不僅僅關(guān)乎模型是否開源。他們關(guān)心的是整個(gè)生態(tài)系統(tǒng)。他們關(guān)心的是擁有高質(zhì)量、成本效益高、易于使用且可定制的模型。我們認(rèn)為,為了實(shí)現(xiàn)造福人類的使命,構(gòu)建這些產(chǎn)品也非常重要。此外,正如山姆所說,我們正在重新思考我們的戰(zhàn)略。

歷史上,我們一直擔(dān)心我們的前沿模型開源后的安全性,因?yàn)楹茈y理解風(fēng)險(xiǎn)以及人們可能以何種方式使用它們。隨著我們不斷學(xué)習(xí),我們也會(huì)調(diào)整我們的戰(zhàn)略。但回到企業(yè)真正關(guān)心的問題,這不僅僅是模型或權(quán)重是否開源,他們真正關(guān)心的是擁有一個(gè)易于使用且能夠解決他們問題的出色產(chǎn)品,而且這個(gè)產(chǎn)品是成本效益高的。這是我們一直聽到的,我們也將繼續(xù)構(gòu)建這樣的產(chǎn)品。

Q&A:OpenAI內(nèi)部是如何使用ChatGPT或者自家模型的

主持人:

好的,非常感謝。我想確保我們有時(shí)間回答觀眾的問題,我看到這里有很多問題。我想,拉里,你是第一個(gè)舉手的人。后面那位先生,你先來吧。

觀眾提問1:

感謝你們所做的一切。這是一個(gè)令人驚嘆的時(shí)代。大約一年半前,Meta 發(fā)布了 Cicero,它基本上是一個(gè)游戲,通過將定制化的戰(zhàn)略推理與語(yǔ)言模型相結(jié)合,玩得相當(dāng)出色。

我的問題是,我們距離那個(gè)時(shí)代還有多遠(yuǎn),那時(shí)像我們這樣的普通公司能夠?qū)⑽覀冏约旱膶I(yè)推理模型與你們的工具結(jié)合起來,并在我們自己的領(lǐng)域獲得類似的能力,比如真正的代理行為,體現(xiàn)我們專有的邏輯來完成相當(dāng)復(fù)雜的任務(wù)?

斯里尼瓦斯:

絕對(duì)如此,我實(shí)際上認(rèn)為現(xiàn)在就是那個(gè)時(shí)代,強(qiáng)化微調(diào)產(chǎn)品應(yīng)該能夠?qū)崿F(xiàn)你們所說的用例,即每個(gè)企業(yè)都有自己獨(dú)特的任務(wù),你們有特定的思考過程。如果你能夠客觀地弄清楚如何評(píng)估這個(gè)思考過程,我們現(xiàn)在有了可以非??焖俚貙W(xué)習(xí)的通用模型。所以,我絕對(duì)建議你們嘗試并進(jìn)行實(shí)驗(yàn)。

觀眾提問2:

嗨,我的問題是,你們什么時(shí)候會(huì)構(gòu)建一個(gè)像 Operator 一樣的模型來構(gòu)建應(yīng)用程序本身?你們會(huì)進(jìn)入應(yīng)用開發(fā)領(lǐng)域嗎?如果是的話,時(shí)間框架是什么?可以重復(fù)一下問題嗎?是的,就像 Operator 在操作事物一樣。你們什么時(shí)候會(huì)推出一個(gè)能夠真正構(gòu)建應(yīng)用程序本身的模型,即 SaaS 應(yīng)用程序?

斯里尼瓦斯:

一方面,我們編碼模型的質(zhì)量正在不斷提高。如今,人們已經(jīng)在使用輔助編碼來開發(fā)各種軟件,無論是在 IDE 中,還是在 ChatGPT 中,我們都有能力創(chuàng)建輕量級(jí)應(yīng)用程序。你可以創(chuàng)建 JavaScript,可以創(chuàng)建簡(jiǎn)單的網(wǎng)站。所以,我認(rèn)為創(chuàng)建簡(jiǎn)單應(yīng)用程序的技術(shù)已經(jīng)存在。隨著模型推理能力的提高,你應(yīng)該能夠利用它們?yōu)槟銊?chuàng)建更復(fù)雜的應(yīng)用程序。其中一個(gè)領(lǐng)域,我們將看到推理模型被部署,那就是編碼領(lǐng)域。隨著推理質(zhì)量的提高,你應(yīng)該能夠非常輕松地創(chuàng)建更復(fù)雜的應(yīng)用程序。

主持人:

好的,薩蒂什,我們會(huì)派人把麥克風(fēng)遞給你。

觀眾提問3:

斯里尼瓦斯,感謝你。這確實(shí)是一個(gè)令人興奮的時(shí)代。我在一家金融機(jī)構(gòu)工作,對(duì)于廣泛采用和適應(yīng) OpenAI 的一個(gè)主要障礙是可解釋性的問題。我很高興聽到你談到“思維鏈”。

你能進(jìn)一步闡述一下嗎?我們?nèi)绾尾捎盟?/span>

斯里尼瓦斯:

思維鏈基本上是內(nèi)心的獨(dú)白。你可以這樣想,如果你問我一個(gè)復(fù)雜的問題,你會(huì)思考并得出答案。模型中的那個(gè)獨(dú)白過程就是我們所說的“思維鏈”。最近,我們開始將這些思維鏈進(jìn)行總結(jié),并在產(chǎn)品中以“總結(jié)思維鏈”的形式提供?,F(xiàn)在,我們已經(jīng)擴(kuò)展了這一功能,你可以更深入地了解思維鏈過程是什么樣的。

實(shí)際上,我認(rèn)為這是可解釋性方面的一個(gè)非常強(qiáng)大的工具,因?yàn)槿藗兛偸菚?huì)問:“你是如何得出這些答案的?”而我們可以回答:“這是我是如何思考這個(gè)問題的,這是我的評(píng)估過程,這就是我認(rèn)為這是正確答案的原因?!彼裕艺J(rèn)為這是在幫助人們獲得可解釋性答案方面的一個(gè)重大進(jìn)步。

觀眾提問4:

謝謝你,沙馬·穆罕默德·卡·馬克斯,首席信息官兼首席技術(shù)官。我們一直是 OpenAI 的早期采用者,在人們知道什么是 OpenAI ChatGPT 之前,我們就是它的忠實(shí)粉絲了。這真的很酷。

我們?cè)诠緝?nèi)部有很多不同的工具和應(yīng)用,有些面向客戶,有些是內(nèi)部使用的。所以,我們主要的一個(gè)問題和關(guān)注點(diǎn)是我們?nèi)绾未_保我們擁有的專有信息、專有數(shù)據(jù)以及從社區(qū)角度獲得的知識(shí),不會(huì)被用來讓對(duì)其他人開放的模型變得更聰明呢?這是一個(gè)我們需要走鋼絲并保持平衡的問題,因?yàn)槲覀儞碛?30 多年的知識(shí),這讓我們與眾不同。我們不希望將這些知識(shí)用于訓(xùn)練模型,讓計(jì)算機(jī)可能會(huì)利用這些知識(shí)。

斯里尼瓦斯:

絕對(duì)如此,我們非常重視這一點(diǎn)。對(duì)于我們的企業(yè)客戶、團(tuán)隊(duì)客戶以及 API 用戶,我們不會(huì)使用你們的數(shù)據(jù)進(jìn)行訓(xùn)練。這是我們做出的承諾。你應(yīng)該完全放心。我們很樂意與你合作,告訴你事情是如何運(yùn)作的。但基本上,是的,我們不會(huì)使用客戶的數(shù)據(jù)進(jìn)行訓(xùn)練。

主持人:

好的,我想我們還有時(shí)間回答一到兩個(gè)問題。這邊有一位穿著夾克的先生。

觀眾提問4:

嗨,我是斯蒂芬·卡韋利,我有一個(gè)關(guān)于 Operator 的問題。因?yàn)閺拇淼慕嵌葋砜?,這是我們都期待的一個(gè)能力,有很多用例。下一步會(huì)是什么?

斯里尼瓦斯:

是的,我認(rèn)為這非常令人興奮。我們希望逐步學(xué)習(xí)人們是如何使用它的。我們希望對(duì)模型在執(zhí)行某些操作方面的能力建立信心。如果今天你想在付款之前進(jìn)行確認(rèn),我會(huì)要求你進(jìn)行確認(rèn)。所以我認(rèn)為有很多不同的用例,我們期望人們會(huì)使用它并進(jìn)行部署。但既然還處于早期階段,你也希望逐步學(xué)習(xí)它在所有這些用例中的表現(xiàn)如何。更廣泛地說,模型的質(zhì)量會(huì)提高。

你會(huì)對(duì)模型建立更多的信任。你會(huì)因?yàn)槟阋财谕谀阆M峁┹斎氲臅r(shí)候確認(rèn),而不是讓模型自行操作。這些都是我們將要學(xué)習(xí)的東西。更廣泛地說,Operator 不應(yīng)該只在瀏覽器中工作,它應(yīng)該能夠處理整個(gè)計(jì)算機(jī)或任何不同的環(huán)境。所以我認(rèn)為它還有許多其他方面的成長(zhǎng)空間。是的,我們希望它能夠在你的授權(quán)和偏好下代表你操作。

主持人:

好的,我還有一個(gè)最后的問題要問你,斯里尼瓦斯。我知道在座的大多數(shù),如果不是全部的話,都使用過 ChatGPT 或 GPT 的某個(gè)版本。OpenAI 是如何使用自己的產(chǎn)品的?你們是如何使用 ChatGPT 或你們的 API 的任何版本的?

斯里尼瓦斯:

是的,我們用它來完成很多事情。作為一名工程師,我先從工程方面說起,然后我會(huì)談到其他功能。

作為工程師,我們用它來輔助編碼。我們用它來查找代碼中的錯(cuò)誤。我們有很多 Slack 頻道,人們會(huì)在上面詢問有關(guān)某些技術(shù)或某些 API 的問題,我們有自動(dòng)化的助手來幫助回答這些問題。

我們還用它來進(jìn)行內(nèi)部知識(shí)共享,比如公司里總是有很多項(xiàng)目在進(jìn)行,像“這個(gè)項(xiàng)目是什么?我該如何了解更多?”我們有一個(gè)工具可以做到這一點(diǎn)。你可以直接問:“項(xiàng)目 X 是什么?”它會(huì)給你一個(gè)很好的總結(jié)。除了工程領(lǐng)域,我們的財(cái)務(wù)團(tuán)隊(duì)還用它來分析我們與各種供應(yīng)商簽訂的法律合同,看看是否有我們需要了解的細(xì)微之處。我們用它來處理客戶服務(wù),自動(dòng)回答客戶的問題。所以它在公司內(nèi)部被廣泛使用。

主持人:

我想這對(duì)在座的許多人來說可能是一種鼓舞,因?yàn)檫@正是他們使用 AI 的方式。非常感謝你抽出時(shí)間。

斯里尼瓦斯:

謝謝你。

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2013-02-19 10:53:38

中興通信網(wǎng)絡(luò)

2023-03-16 08:13:56

人工智能?OpenAI

2009-04-20 12:58:13

NehalemintelSUN

2015-06-24 17:12:42

iRobot

2023-03-16 17:28:59

技術(shù)AI

2009-12-01 09:09:58

谷歌Digg

2023-12-12 16:32:14

Commvault

2015-10-22 17:55:10

Hewlett Pac葉健

2023-04-09 16:17:05

ChatGPT人工智能

2009-03-14 18:52:11

IE8微軟企業(yè)優(yōu)勢(shì)

2023-06-14 14:57:38

模型AI

2010-08-17 10:42:03

甲骨文數(shù)據(jù)中心

2014-11-03 09:43:33

2009-04-11 17:52:42

Nehalem服務(wù)器IBM

2023-03-16 17:26:09

AI模型

2023-08-22 20:18:27

數(shù)據(jù)泄露數(shù)據(jù)安全

2009-04-27 09:39:45

雅虎巴茨解雇

2011-06-01 20:48:59

諾基亞Androidsymbian

2011-10-28 09:38:50

WebOS

2024-05-14 07:30:52

OpenAIGPT-4模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)