整理 | 言征
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
近日,OpenAI 推出了 canvas,這是一個(gè)可以在 ChatGPT 中直接編寫和編碼項(xiàng)目的新界面。許多人想知道它是否比 Claude Sonnet 3.5 Artifacts 更好。
答案是否定的。
原因也很明顯:canvas 使用 GPT-4o,而4o模型的編碼并不比 Claude Sonnet 3.5 好。雖然 canvas 為開發(fā)人員提供了一些很好的功能,例如用戶協(xié)作和版本控制,但它缺乏代碼預(yù)覽等關(guān)鍵功能。
許多人現(xiàn)在都在使用 Claude 創(chuàng)建他們的第一個(gè)應(yīng)用程序。其中包括只有少數(shù)人需要的小眾應(yīng)用程序、小公司的內(nèi)部工具以及只是為了好玩的滑稽應(yīng)用程序。
圖片
例如,一位用戶最近嘗試可視化辦公桌的雙顯示器設(shè)置,并比較顯示器彼此相鄰的配合情況。Claude 在短短幾次交互中就為此目的創(chuàng)建了一個(gè)完全可用的應(yīng)用程序。
該款應(yīng)用程序雖然沒有特別令人興奮,但重點(diǎn)也恰恰在此——用戶看來,讓自己來編寫這樣一個(gè)沒吸引力的應(yīng)用的代碼,根本不值得去花費(fèi)時(shí)間和精力,但交給 Claude ,在不到 5 分鐘的時(shí)間內(nèi)就可以創(chuàng)建它,使其成為一個(gè)有價(jià)值的工具。
因此,AI 輔助創(chuàng)建應(yīng)用程序,比拼的應(yīng)該是為誰更快、誰更能提供個(gè)性化的解決方案。
1.Canvas 雖好,但 Artifacts 更香
除了在幾分鐘內(nèi)構(gòu)建軟件外,用戶還報(bào)告了 Claude Artifacts 如何幫助他們學(xué)習(xí)編碼。一位努力學(xué)習(xí)如何編碼的開發(fā)人員說,通過能夠更徹底地看到項(xiàng)目實(shí)際上是如何組合在一起的,他開始獲得許多以前難以理解的概念。
“至少對(duì)我來說,最困難的事情之一是自學(xué),因?yàn)槲沂且粋€(gè)非常概念化的學(xué)習(xí)者。我需要能夠理解整個(gè)想法并深入研究它?;蛘?,我從一個(gè)部分開始,然后像知識(shí)的滾雪球一樣構(gòu)建,這通常是一種協(xié)作方法,因此很難完全靠自己完成。
“然而,和 Claude 一起,我度過了一段美好的時(shí)光,唯一的限制是我在給定時(shí)間里被限制了回復(fù)次數(shù),”他補(bǔ)充道。
業(yè)內(nèi)媒體AIM還試驗(yàn)了 Artifacts,我們能夠創(chuàng)建一個(gè)板球測(cè)驗(yàn)游戲、Temple Run 和 Flappy Bird,所有這些都帶有一行英語提示?!鞍葱柢浖呀?jīng)到來,”醫(yī)療保健工具公司 Flexpa 的首席技術(shù)官 Joshua Kelly 說。使用 Artifacts,他在短短 60 秒內(nèi)就為他的跑步構(gòu)建了一個(gè)簡單的伸展時(shí)間應(yīng)用程序。
借助 Artifacts,現(xiàn)在每個(gè)人都可以創(chuàng)建簡單的應(yīng)用程序,并且這些應(yīng)用程序可以與用戶共享。這意味著,我們正在慢慢邁向一個(gè)階段,每個(gè)人都將成為應(yīng)用程序開發(fā)人員,這一切都?xì)w功于 Artifacts。
即使我們不考慮 Artifacts,只考慮 Sonnet 3.5 進(jìn)行編碼,它也被證明是比大多數(shù)模型更好的選擇。
2.Claude 3.5,開發(fā)者愛了
幾周前,一位沒有軟件開發(fā)經(jīng)驗(yàn)的電工使用 Claude 3.5 Sonnet 構(gòu)建了一個(gè)多智能體JavaScript 應(yīng)用程序。開發(fā)人員將這個(gè)稱為 Panel of Expert (POE),它使用多個(gè) AI 代理以多步驟的方式處理查詢,所有這些都是通過以高級(jí)方式定義提示來完成的。
這只是一個(gè)例子。有多個(gè)用戶稱贊 Claude Sonnet 3.5 的編碼功能。一位開發(fā)人員在 Reddit 上表示,這絕對(duì)是非凡的?!八木幋a能力給我留下了深刻的印象。感覺過去幾天我的工作效率提高了 3.5 倍。我對(duì)我設(shè)法運(yùn)送的東西感到非常驚訝,這主要是由于 Claude,“他補(bǔ)充道。
擁有數(shù)十年經(jīng)驗(yàn)的開發(fā)人員也稱贊 Claude 的編程能力以及它如何有助于緩解大腦疲勞。一位擁有 40 多年經(jīng)驗(yàn)的開發(fā)人員表示,擁有像 Claude 這樣的設(shè)備是一個(gè)巨大的好處。
用戶還反饋說,Claude Sonnet 是為數(shù)不多的可以處理大型項(xiàng)目的模型之一。因此,Sonnet 經(jīng)常被比作具有無限內(nèi)存的中級(jí)工程師。
圖片
Claude Sonnet 不僅限于在幾次互動(dòng)中給出工作代碼,而且在調(diào)試方面也被認(rèn)為是最好的代碼之一。來自奧地利的數(shù)據(jù)科學(xué)家 Liu Grey 在 X 上提到,Sonnet 立即修復(fù)了一個(gè)錯(cuò)誤,然后繼續(xù)改進(jìn)她的渲染管道,并在不增加 CPU、GPU 或內(nèi)存使用率的情況下將更新速率提高了一倍。
3.推理方面,o1
OpenAI o1 模型通常被認(rèn)為是最好的推理模型之一。但是,幾天前,一位在 Claude Sonnet 3.5 上使用反射技術(shù)的用戶在推理方面取得了比 o1 更好的結(jié)果,情況發(fā)生了轉(zhuǎn)變。
圖片
值得注意的是,開發(fā)人員也在盡可能地推動(dòng) Claude。一個(gè)很好的例子是 Claude 的開源 VSCode 擴(kuò)展,稱為 Cline(以前稱為 Claude Dev)。此擴(kuò)展會(huì)定期更新。一位用戶提到,在編碼知識(shí)為零的情況下,他在短短一天內(nèi)就成功地構(gòu)建了一個(gè) Web 應(yīng)用程序。
現(xiàn)在情況很明朗。開發(fā)人員喜歡 Claude Sonnet,并正在圍繞它開發(fā)解決方案。當(dāng)然,OpenAI 也在努力為開發(fā)者受眾趕上 canvas 等工具,但我們還沒有看到影響。
另一方面,Anthropic 還專注于通過 Projects 和 Artifacts 等計(jì)劃為開發(fā)人員受眾帶來最佳體驗(yàn),使其成為開發(fā)人員和公司雙贏的局面。
4.寫在最后
Canvas 和 Artifacts 代表了 AI 聊天平臺(tái)和助手發(fā)展的下一階段。這場(chǎng)“界面大戰(zhàn)”接下來的看點(diǎn)是,其他平臺(tái)將開始探索如何將用戶留在平臺(tái)中,而非為不同的任務(wù)打開其他專用窗口。
參考鏈接:https://analyticsindiamag.com/developers-corner/claude-3-5-brushes-off-canvas-with-a-stroke-of-code/