Claude 3.7登頂編程競技場,大幅領(lǐng)先100分!最新布料模擬實測再驚艷網(wǎng)友
公認的編程開發(fā)能力第一!Claude 3.7 Sonnet剛剛登頂WebDev競技場榜首。
大幅甩第二名100多分,在榜單前十的其它相鄰模型分差僅為幾分、幾十分的情況下。
那第二名是誰呢?還是Claude自己——Claude 3.5 Sonnet。
WebDev榜單與我們所熟知Chatbot Arena榜單“同宗同源”,也是由LMArena(LMSYS Org)打造,不過更專注于AI編程、網(wǎng)頁應(yīng)用開發(fā)能力。
值得一提的是,DeepSeek R1作為榜單前十唯一的開源模型排名第三,超越early-grok-3、o3-mini-high、Claude 3.5 Haiku等。
對于Claude 3.7 Sonnet高分登頂,有網(wǎng)友表示并不驚訝。
畢竟,這兩天網(wǎng)友們瘋狂實測Claude 3.7,一次又一次被驚艷到,最新實測更是再次刷新網(wǎng)友對Claude 3.7的認知。
Claude 3.7最新實測
比如前兩天下面這個Claude 3.7 Sonnet用p5js編寫布料模擬效果在網(wǎng)上瘋傳:
有位學(xué)者看到后,還曬出了自己1986年在MIT的碩士論文,主題正是“布料外觀建模”。他提到,過去完成這項工作需要數(shù)天時間,而現(xiàn)在AI只需幾分鐘就能超越他,不禁感嘆:
雖然他們現(xiàn)在還付我薪水,但這樣的日子還能持續(xù)多久呢?
現(xiàn)在,更扎心了老鐵。
網(wǎng)友又做出了另一版,還是帶有明暗關(guān)系的那種:
圖片
網(wǎng)友表示“這種效果即使是在高級圖形學(xué)課中,也很少有教怎么做的”。
除此之外,Reddit上一位老哥的最新分享也引發(fā)網(wǎng)友熱議。
他表示突然想起一個自己在1997年用Visual Basic 4編寫的古老應(yīng)用程序,于是將這個27年前的EXE文件上傳到了Claude 3.7并請求轉(zhuǎn)換為Python代碼,結(jié)果Claude不僅分析了文件組件,還在5分鐘內(nèi)用Pygame寫出完美轉(zhuǎn)換且可運行的Python代碼。
這位老哥還曬出了自己與Claude 3.7的聊天記錄:
網(wǎng)友get新玩法后紛紛開始效仿。
另外,有網(wǎng)友體驗了Claude 3.7的新GitHub集成功能后表示“它改變了工程師理解軟件的方式”:
可以Frok一個代碼庫選擇一個特定的文件夾,然后向它提問關(guān)于代碼的任何問題,Claude還會顯示每個文件夾在上下文窗口中所占的百分比,幫助你更好地理解代碼結(jié)構(gòu)和內(nèi)容。
比如,Claude 3.7可視化了yt-dlp(一個YouTube下載器)的工作流程:
沃頓商學(xué)院教授Ethan Mollick也放出了最新實測。
例如,基于“Bartleby the Scrivner”故事創(chuàng)建的小游戲:
還可以用Claude 3.7制作一個互動式的“時光機道具,能夠穿越回過去”:
Ethan Mollick特意寫了一篇Blog介紹Claude 3.7。
有意思的是,這篇Blog被Anthropic官方注意到了,官方表示Claude 3.7沒有那么大(花幾千萬美元訓(xùn)練的那種)。但之后的模型規(guī)模會增長。