Claude 3.7 Sonnet重磅發(fā)布,Claude最牛逼的東西,還得是它的編程
cursor公認的最強編程大模型Claude 3.5再次升級。
一、Claude 3.7 Sonnent發(fā)布
Anthropic 公司正式發(fā)布了其最新版本的人工智能模型Claude 3.7 Sonnet。
Claude 3.7 Sonnet 提高了單次會話的上下文長度,高達 128k tokens。我們可以一次性讀寫更多文本,修改更多的代碼,徹底消除會話長度焦慮。
該模型被設計為采用混合推理策略,其核心在于融合傳統(tǒng)的即時響應技術與深層邏輯推理機制,以應對復雜問題求解;在數(shù)學計算和編程任務中,其卓越表現(xiàn)已被充分驗證。
近期編碼基準測試中,SWE-bench Verified 的評測結(jié)果顯示,Claude 3.7 Sonnet 所獲得的得分明顯超越了前代產(chǎn)品 Claude 3.5 Sonnet 以及 OpenAI 的 o3-mini 與 DeepSeek R1 模型,這一成果彰顯了其在處理復雜代碼庫和高級工具應用中的優(yōu)越性能。
在 TAU-bench 基準測試中,該模型亦表現(xiàn)出顯著優(yōu)勢,其性能超越了 Claude 3.5 Sonnet 與 OpenAI 的 o1 模型,進一步驗證了其在多模態(tài)信息處理和代理編碼技術方面的創(chuàng)新實力。
二、Claude最牛逼的東西,還得是它的編程
非推理模型下的Claude 3.5 Sonnent,就能和OpenAI 最新模式o3-mini-high、671B的滿血DeepSeek R1打的有來有回,甚至至今還是諸多大廠專家心中的編程No.1。
那么,深度思考加持的Claude 3.7,豈不是天下無敵,獨孤求敗了。
在只是問答、寫作、編程、數(shù)學、推理、多模態(tài)等諸多表現(xiàn)都很牛逼,特別是加了“深度思考”之后,最新模型Claude 3.7 Sonnet可謂是牛氣沖天,直接晉升大模型T0梯隊。
配合 Anthropic 這次新推出的 Claude Code 工具,更能讓開發(fā)者爽到飛起。它能直接幫你檢索和編輯文件、編譯運行、甚至提交代碼到 GitHub,全程帶你邊玩邊寫。
三、編程專屬Claude Code
前不久,Anthropic 在社交媒體上發(fā)布了一條令人振奮的推文,大致內(nèi)容是:
Introducing Claude 3.7 Sonnet: our most intelligent model to date. It’s a hybrid reasoning model, producing near-instant responses or extended, step-by-step thinking. One model, two ways to think. We’re also releasing an agentic coding tool: Claude Code.
這則消息立刻引發(fā)了技術圈的熱烈討論。有網(wǎng)友在近期的網(wǎng)絡文章中興奮地形容:“Claude 3.7 Sonnet 就像升級版的 AI 導師,可以即刻回復你的小問題,也能深入剖析你的大疑惑,一次搞定兩種思維模式。”
Claude 3.7 Sonnet 最核心的亮點,莫過于它的“混合推理”能力。簡單來說,它可以在秒回模式和Thinking模式之間靈活切換:
秒回模式:適合處理那些不需要繁瑣思考的日常問題,Claude 3.7 Sonnet 會在極短時間內(nèi)給出答案,讓你宛如跟一位健談又機智的伙伴聊天。
Thinking模式:當你需要更深層次的思考或系統(tǒng)化的推理時,它又能像一位冷靜縝密的邏輯大師,給你提供條分縷析的解決方案,讓思路不再迷糊。
不少開發(fā)者在博客或技術論壇上分享了自己的“上手體驗”,表示在面對復雜需求時,Claude 3.7 Sonnet 的思考過程異常清晰,幾乎可以看作是一位加班不吃外賣、不打瞌睡的程序猿同事,真正讓人省心不少。
如果說“混合推理”功能是給普通用戶的高能助力,那么“Claude Code”就是程序員們的私人貼身外掛。它不僅能搜索、閱讀并編輯代碼,還能直接編寫、運行測試,甚至一鍵提交并推送到 GitHub,連命令行工具都能熟練運用。
據(jù)一些搶先體驗的用戶分享:
感覺就像擁有了一個自動化的研發(fā)團隊。
遇到難纏的 bug,Claude Code 能提供清晰的解決思路和操作指令。
再也不用凌晨三點查漏補缺,我先睡了,Claude Code 你先扛著。
這種“代理式”編程輔助,不僅能大幅提高開發(fā)效率,還能讓團隊協(xié)作更加順暢:有了 Claude Code 幫忙抓漏補缺,寫文檔、跑測試的瑣碎活兒就變得輕松許多,真正幫你把時間和精力釋放到更具創(chuàng)造性的工作上。
四、混合推理實測
開啟擴展模式
一句話搞定一個游戲。
一句話搞定一個大數(shù)據(jù)大屏預覽。
在功能上,Claude Code 是一個積極的協(xié)作者,可以搜索和閱讀代碼、編輯文件、編寫和運行測試、提交和推送代碼到 GitHub,以及使用命令行工具。
我們來看下它的幾個使用示例,比如解釋項目結(jié)構(gòu):
編寫測試:
構(gòu)建應用:
五、如何使用Claude 3.7 Sonnent
推薦谷歌瀏覽器訪問:https://claude.nezhagpt.cloud
無需魔法、個人獨享、同時支持手機/電腦。