OpenAI新發(fā)布的canvas和Claude的Artifacts,哪個(gè)更好? 原創(chuàng)
整理 | 言征
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
近日,OpenAI 推出了 canvas,這是一個(gè)可以在 ChatGPT 中直接編寫和編碼項(xiàng)目的新界面。許多人想知道它是否比 Claude Sonnet 3.5 Artifacts 更好。
答案是否定的。
原因也很明顯:canvas 使用 GPT-4o,而4o模型的編碼并不比 Claude Sonnet 3.5 好。雖然 canvas 為開發(fā)人員提供了一些很好的功能,例如用戶協(xié)作和版本控制,但它缺乏代碼預(yù)覽等關(guān)鍵功能。
許多人現(xiàn)在都在使用 Claude 創(chuàng)建他們的第一個(gè)應(yīng)用程序。其中包括只有少數(shù)人需要的小眾應(yīng)用程序、小公司的內(nèi)部工具以及只是為了好玩的滑稽應(yīng)用程序。
圖片
例如,一位用戶最近嘗試可視化辦公桌的雙顯示器設(shè)置,并比較顯示器彼此相鄰的配合情況。Claude 在短短幾次交互中就為此目的創(chuàng)建了一個(gè)完全可用的應(yīng)用程序。
該款應(yīng)用程序雖然沒(méi)有特別令人興奮,但重點(diǎn)也恰恰在此——用戶看來(lái),讓自己來(lái)編寫這樣一個(gè)沒(méi)吸引力的應(yīng)用的代碼,根本不值得去花費(fèi)時(shí)間和精力,但交給 Claude ,在不到 5 分鐘的時(shí)間內(nèi)就可以創(chuàng)建它,使其成為一個(gè)有價(jià)值的工具。
因此,AI 輔助創(chuàng)建應(yīng)用程序,比拼的應(yīng)該是為誰(shuí)更快、誰(shuí)更能提供個(gè)性化的解決方案。
1.Canvas 雖好,但 Artifacts 更香
除了在幾分鐘內(nèi)構(gòu)建軟件外,用戶還報(bào)告了 Claude Artifacts 如何幫助他們學(xué)習(xí)編碼。一位努力學(xué)習(xí)如何編碼的開發(fā)人員說(shuō),通過(guò)能夠更徹底地看到項(xiàng)目實(shí)際上是如何組合在一起的,他開始獲得許多以前難以理解的概念。
“至少對(duì)我來(lái)說(shuō),最困難的事情之一是自學(xué),因?yàn)槲沂且粋€(gè)非常概念化的學(xué)習(xí)者。我需要能夠理解整個(gè)想法并深入研究它?;蛘?,我從一個(gè)部分開始,然后像知識(shí)的滾雪球一樣構(gòu)建,這通常是一種協(xié)作方法,因此很難完全靠自己完成。
“然而,和 Claude 一起,我度過(guò)了一段美好的時(shí)光,唯一的限制是我在給定時(shí)間里被限制了回復(fù)次數(shù),”他補(bǔ)充道。
業(yè)內(nèi)媒體AIM還試驗(yàn)了 Artifacts,我們能夠創(chuàng)建一個(gè)板球測(cè)驗(yàn)游戲、Temple Run 和 Flappy Bird,所有這些都帶有一行英語(yǔ)提示?!鞍葱柢浖呀?jīng)到來(lái),”醫(yī)療保健工具公司 Flexpa 的首席技術(shù)官 Joshua Kelly 說(shuō)。使用 Artifacts,他在短短 60 秒內(nèi)就為他的跑步構(gòu)建了一個(gè)簡(jiǎn)單的伸展時(shí)間應(yīng)用程序。
借助 Artifacts,現(xiàn)在每個(gè)人都可以創(chuàng)建簡(jiǎn)單的應(yīng)用程序,并且這些應(yīng)用程序可以與用戶共享。這意味著,我們正在慢慢邁向一個(gè)階段,每個(gè)人都將成為應(yīng)用程序開發(fā)人員,這一切都?xì)w功于 Artifacts。
即使我們不考慮 Artifacts,只考慮 Sonnet 3.5 進(jìn)行編碼,它也被證明是比大多數(shù)模型更好的選擇。
2.Claude 3.5,開發(fā)者愛(ài)了
幾周前,一位沒(méi)有軟件開發(fā)經(jīng)驗(yàn)的電工使用 Claude 3.5 Sonnet 構(gòu)建了一個(gè)多智能體JavaScript 應(yīng)用程序。開發(fā)人員將這個(gè)稱為 Panel of Expert (POE),它使用多個(gè) AI 代理以多步驟的方式處理查詢,所有這些都是通過(guò)以高級(jí)方式定義提示來(lái)完成的。
這只是一個(gè)例子。有多個(gè)用戶稱贊 Claude Sonnet 3.5 的編碼功能。一位開發(fā)人員在 Reddit 上表示,這絕對(duì)是非凡的?!八木幋a能力給我留下了深刻的印象。感覺(jué)過(guò)去幾天我的工作效率提高了 3.5 倍。我對(duì)我設(shè)法運(yùn)送的東西感到非常驚訝,這主要是由于 Claude,“他補(bǔ)充道。
擁有數(shù)十年經(jīng)驗(yàn)的開發(fā)人員也稱贊 Claude 的編程能力以及它如何有助于緩解大腦疲勞。一位擁有 40 多年經(jīng)驗(yàn)的開發(fā)人員表示,擁有像 Claude 這樣的設(shè)備是一個(gè)巨大的好處。
用戶還反饋說(shuō),Claude Sonnet 是為數(shù)不多的可以處理大型項(xiàng)目的模型之一。因此,Sonnet 經(jīng)常被比作具有無(wú)限內(nèi)存的中級(jí)工程師。
圖片
Claude Sonnet 不僅限于在幾次互動(dòng)中給出工作代碼,而且在調(diào)試方面也被認(rèn)為是最好的代碼之一。來(lái)自?shī)W地利的數(shù)據(jù)科學(xué)家 Liu Grey 在 X 上提到,Sonnet 立即修復(fù)了一個(gè)錯(cuò)誤,然后繼續(xù)改進(jìn)她的渲染管道,并在不增加 CPU、GPU 或內(nèi)存使用率的情況下將更新速率提高了一倍。
3.推理方面,o1
OpenAI o1 模型通常被認(rèn)為是最好的推理模型之一。但是,幾天前,一位在 Claude Sonnet 3.5 上使用反射技術(shù)的用戶在推理方面取得了比 o1 更好的結(jié)果,情況發(fā)生了轉(zhuǎn)變。
圖片
值得注意的是,開發(fā)人員也在盡可能地推動(dòng) Claude。一個(gè)很好的例子是 Claude 的開源 VSCode 擴(kuò)展,稱為 Cline(以前稱為 Claude Dev)。此擴(kuò)展會(huì)定期更新。一位用戶提到,在編碼知識(shí)為零的情況下,他在短短一天內(nèi)就成功地構(gòu)建了一個(gè) Web 應(yīng)用程序。
現(xiàn)在情況很明朗。開發(fā)人員喜歡 Claude Sonnet,并正在圍繞它開發(fā)解決方案。當(dāng)然,OpenAI 也在努力為開發(fā)者受眾趕上 canvas 等工具,但我們還沒(méi)有看到影響。
另一方面,Anthropic 還專注于通過(guò) Projects 和 Artifacts 等計(jì)劃為開發(fā)人員受眾帶來(lái)最佳體驗(yàn),使其成為開發(fā)人員和公司雙贏的局面。
4.寫在最后
Canvas 和 Artifacts 代表了 AI 聊天平臺(tái)和助手發(fā)展的下一階段。這場(chǎng)“界面大戰(zhàn)”接下來(lái)的看點(diǎn)是,其他平臺(tái)將開始探索如何將用戶留在平臺(tái)中,而非為不同的任務(wù)打開其他專用窗口。
本文轉(zhuǎn)載自51CTO技術(shù)棧,作者:言征
