自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

o1不是聊天模型！前SpaceX工程師：這樣用o1才能解決復(fù)雜問(wèn)題

作者：新智元 2025-01-20 09:28:00

人工智能新聞

Ben Hylak從最初對(duì)o1不滿到逐漸掌握使用技巧，成功將其轉(zhuǎn)化為解決重要問(wèn)題的得力工具。本文探討了如何正確使用o1，解鎖其強(qiáng)大的報(bào)告生成和推理分析能力。

「我是如何從討厭o1到每天用它來(lái)解決我最重要的問(wèn)題的？

我學(xué)會(huì)了如何正確使用它。」

Ben Hylak曾是SpaceX軟件工程師、蘋(píng)果VisionOS人機(jī)交互設(shè)計(jì)師，后來(lái)離職創(chuàng)立了Dawn Analytics。

起初，Ben Hylak對(duì)o1滿是質(zhì)疑，如今卻成為了o1的活躍用戶。

o1不是一個(gè)聊天模型，這正是關(guān)鍵所在。

o1 pro剛宣布推出，Ben就果斷訂閱了。畢竟，只要它每月能頂替1-2個(gè)工程師的工作量，這每月200美元的訂閱費(fèi)就花得值。

然而，經(jīng)過(guò)一整天認(rèn)真的試用，Ben得出結(jié)論：這模型簡(jiǎn)直太糟糕了。

每次提出問(wèn)題，Ben都得等上5分鐘，結(jié)果等來(lái)的卻是一堆前后矛盾的廢話，還莫名其妙地附上架構(gòu)圖和優(yōu)劣勢(shì)分析列表。

Ben把吐槽放到了網(wǎng)上，不少人表示贊同，但也有一些人強(qiáng)烈反對(duì)。這些觀點(diǎn)來(lái)自行業(yè)一線的專(zhuān)業(yè)人士，有人對(duì)o1 pro的表現(xiàn)大為驚嘆。

Ben漸漸意識(shí)到自己完全弄錯(cuò)了，他一直把o1當(dāng)成聊天模型來(lái)用，可o1壓根就不是聊天模型。

如果o1不是聊天模型，那它究竟是什么？

它更像是一個(gè)「報(bào)告生成器」。

只要你能提供充足的上下文信息，并且清晰地闡明所需的輸出內(nèi)容，它通常能完美解決問(wèn)題。

提供充足的背景信息

提供海量的上下文信息。無(wú)論你認(rèn)為「海量」是多少，在此基礎(chǔ)上乘以10倍。

當(dāng)使用諸如Claude 3.5 Sonnet或4o這類(lèi)聊天模型時(shí)，一般是從一個(gè)簡(jiǎn)單問(wèn)題和一些上下文信息入手。如果模型還需要更多上下文，它往往會(huì)向你提問(wèn)。

聊天模型正是通過(guò)互動(dòng)的方式從你那里獲取更多上下文。

o1只會(huì)按照你問(wèn)題的字面意思作答，不會(huì)主動(dòng)從你這里獲取上下文信息。

所以，你得盡可能多地向o1提供上下文。

哪怕只是問(wèn)一個(gè)簡(jiǎn)單的工程問(wèn)題，也請(qǐng)做好以下這些：

詳細(xì)說(shuō)明你已經(jīng)試過(guò)的所有方法，以及這些方法為何行不通。
提供所有數(shù)據(jù)庫(kù)架構(gòu)的完整導(dǎo)出文件。
闡述公司的業(yè)務(wù)內(nèi)容、規(guī)模大小，同時(shí)對(duì)特有的術(shù)語(yǔ)進(jìn)行定義。

簡(jiǎn)單來(lái)講，就把o1當(dāng)成新入職的員工來(lái)對(duì)待。

為o1提供上下文的簡(jiǎn)單技巧：用Mac或手機(jī)上的語(yǔ)音備忘錄，直接通過(guò)語(yǔ)音對(duì)整個(gè)問(wèn)題場(chǎng)景進(jìn)行描述，時(shí)長(zhǎng)在1-2分鐘，把轉(zhuǎn)錄的文本粘貼進(jìn)去。

聚焦「要什么」而非「怎么做」

給o1提供盡可能多的背景信息后，關(guān)鍵是講清楚你期望的最終輸出成果。

我們習(xí)慣告訴模型怎么回答，如請(qǐng)以資深軟件工程師的身份，仔細(xì)思考后作答。

但o1的使用方法不一樣。別告訴o1該怎么做，只說(shuō)要什么，然后讓o1自己來(lái)，它會(huì)規(guī)劃并解決后續(xù)步驟。

這能充分發(fā)揮o1的自主推理能力，實(shí)際運(yùn)行效率或許比手動(dòng)審核、對(duì)話溝通的方式更高。

你必須清楚具體需求，比如，是想讓o1實(shí)現(xiàn)某個(gè)特定架構(gòu)，還是創(chuàng)建一個(gè)最小化的測(cè)試應(yīng)用。

o1第一次就能生成正確答案的能力著實(shí)令人驚嘆。除了成本和延遲，o1在幾乎所有其他方面都更為出色。

o1的優(yōu)勢(shì)與不足

o1的優(yōu)勢(shì)

一次性生成單個(gè)或多個(gè)文件：只需粘貼大量代碼以及與正在構(gòu)建內(nèi)容相關(guān)的上下文信息，它就能一次性完成整個(gè)文件（甚至多個(gè)文件）的生成。生成的內(nèi)容幾乎沒(méi)有錯(cuò)誤，并且會(huì)嚴(yán)格遵循代碼庫(kù)中已有的模式。

較少出現(xiàn)幻覺(jué)：總體而言，o1在理解問(wèn)題時(shí)似乎很少產(chǎn)生混淆。

醫(yī)學(xué)診斷：對(duì)于醫(yī)學(xué)專(zhuān)業(yè)人士而言，o1通常能給出與正確答案極為接近的診斷。

解釋概念：o1在闡釋極為復(fù)雜的工程概念方面表現(xiàn)卓越。

評(píng)估：o1展現(xiàn)出了作為評(píng)估工具的潛力，它經(jīng)常能在上下文信息有限的情況下，判斷生成結(jié)果是否正確。

o1尚未實(shí)現(xiàn)

特定語(yǔ)氣/風(fēng)格的寫(xiě)作：o1在寫(xiě)作方面的表現(xiàn)欠佳，特別是在模仿特定語(yǔ)氣或風(fēng)格時(shí)。它自帶一種濃厚的學(xué)術(shù)/公司報(bào)告風(fēng)格，而且始終如此。這可能是因?yàn)榇罅康耐评韙oken將語(yǔ)氣導(dǎo)向了這個(gè)方向。

構(gòu)建完整的應(yīng)用：o1一次性生成單個(gè)或多個(gè)文件的能力很強(qiáng)，但它無(wú)法直接構(gòu)建完整的SaaS應(yīng)用，至少需要大量反復(fù)調(diào)整。不過(guò)，它基本上能一次性生成完整的前端功能模塊，或簡(jiǎn)單的后端功能模塊。

網(wǎng)友評(píng)論：o1/pro是我用過(guò)的第一個(gè)可以很好地完成高級(jí)軟件架構(gòu)的模型！

責(zé)任編輯：張燕妮來(lái)源：新智元

AI 工具模型

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<sub id="l4au0"></sub>

<legend id="l4au0"><track id="l4au0"><dfn id="l4au0"></dfn></track></legend>