自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

Qwen3真香！通義App滿血接入，一手實(shí)測(cè)在此

作者：量子位 2025-04-30 14:12:36

官方強(qiáng)調(diào)了新模型在Agent、編碼方面的能力提升，還增強(qiáng)了對(duì)MCP的支持。具體表現(xiàn)如何，我們直接在通義App里全方位實(shí)測(cè)。

開源大模型新王者，正在受到空前關(guān)注。

Qwen3預(yù)告一出，直接開啟不眠夜模式。

△來(lái)自編輯部本部

等到深夜正式上線并宣布登頂全球最強(qiáng)開源模型，更是瞬間引爆全網(wǎng)熱議。

圖片

網(wǎng)友們的反應(yīng)在meme中盡數(shù)體現(xiàn)（doge）。

圖片

畢竟，單看紙面參數(shù)，Qwen3就是個(gè)妥妥的大工程：

8款混合推理模型全部開源，參數(shù)量從0.6B到235B全面覆蓋；
32B模型就有超越OpenAI o1、DeepSeek R1的性能表現(xiàn)，在編程基準(zhǔn)測(cè)評(píng)中還超過了風(fēng)頭正盛的Gemini 2.5 Pro；
支持思考和非思考模式，支持119種語(yǔ)言和方言、加強(qiáng)對(duì)MCP支持……

還有網(wǎng)友認(rèn)為，這是“又一個(gè)DeepSeek時(shí)刻”。

圖片

這一次模型開源，通義App和網(wǎng)頁(yè)版也趕在第一時(shí)間滿血上線Qwen3，并且有專屬智能體體驗(yàn)。

圖片

新王究竟表現(xiàn)如何，我們第一時(shí)間深度實(shí)測(cè)，以見真章。

Qwen3住進(jìn)App，還能這樣玩兒

打開通義App/通義網(wǎng)頁(yè)版首頁(yè)，目前有兩種方式可以體驗(yàn)到Qwen3模型：

直接用輸入框?qū)υ挘ùa/數(shù)學(xué)/翻譯類問題默認(rèn)調(diào)用Qwen3-235B，其它問題不調(diào)用Qwen3）
選用“千問大模型”智能體（默認(rèn)使用旗艦版Qwen3-235B-A22B）

BTW，通義網(wǎng)頁(yè)版近期上線了新域名tongyi.com，不要走錯(cuò)。

OK，接下來(lái)進(jìn)入正題。

官方強(qiáng)調(diào)了新模型在Agent、編碼方面的能力提升，還增強(qiáng)了對(duì)MCP的支持。具體表現(xiàn)如何，我們直接在通義App里全方位實(shí)測(cè)。

第一關(guān)：代碼生成

先來(lái)個(gè)新模型“入門挑戰(zhàn)”——空間內(nèi)彈小球。

這個(gè)經(jīng)典測(cè)試在考驗(yàn)?zāi)Ｐ痛a能力的同時(shí)，還重點(diǎn)關(guān)注了它對(duì)物理世界的理解，幾乎每一個(gè)新模型都會(huì)被拉出來(lái)遛一遛。

提示詞如下（p5.js腳本、25個(gè)粒子、圓柱形容器）：

圖片

而第一次接受挑戰(zhàn)的旗艦版Qwen3模型，用時(shí)1分鐘，唰唰唰就生成了一百多行代碼：

將上述代碼實(shí)際運(yùn)行一下，結(jié)果be like：

圖片

雖然一眼看去沒有“小球直接沖出圓圈”這樣明顯的錯(cuò)誤，但也確實(shí)缺少3D空間感。

作為對(duì)比，我們拉出官方測(cè)評(píng)圖中，和滿血Qwen3代碼實(shí)力最相近的Grok 3模型。

圖片

重復(fù)相同操作，讓Grok 3基于同一提示詞生成代碼，并實(shí)際運(yùn)行：

圖片

二者的區(qū)別相當(dāng)明顯，后者（Grok 3）的空間感肉眼可見更強(qiáng)。

為了進(jìn)一步探究?jī)啥未a的差別，我們又直接讓Qwen3“自己找找差距”（doge）。

結(jié)果，它真的很認(rèn)真地進(jìn)行了全方位對(duì)比，包括渲染模式、容器結(jié)構(gòu)、粒子運(yùn)動(dòng)與碰撞測(cè)試等等。

最終結(jié)論也用表格進(jìn)行了呈現(xiàn)，一目了然：

圖片

甚至，基于它提出的改進(jìn)意見，我們繼續(xù)讓它出了一個(gè)新版本。

圖片

實(shí)際運(yùn)行后，這次的結(jié)果已經(jīng)非常符合我們的要求了。

圖片

事實(shí)上，深扒Qwen3的思考過程，我們才發(fā)現(xiàn)原來(lái)第一版的2D效果是它“深思熟慮”后的選擇。

這里主要考慮到了兼容性問題，所以簡(jiǎn)化成了俯視圖來(lái)呈現(xiàn)。

圖片

從上面這個(gè)簡(jiǎn)單測(cè)試，我們已經(jīng)能夠窺見Qwen3的程序員素養(yǎng)確實(shí)不錯(cuò)。

接下來(lái)難度升級(jí)，直接讓它幫打工人設(shè)計(jì)一個(gè)提醒喝水的電腦端App。

注意，為了能快速在瀏覽器端預(yù)覽生成效果，這里我們采用了“極簡(jiǎn)模式”，僅保留最基礎(chǔ)的功能，不涉及使用任何第三方庫(kù)。

結(jié)果生成的App有模有樣，還能真實(shí)點(diǎn)擊交互。

一旦讓具備工程能力的童鞋們上手，估計(jì)能實(shí)現(xiàn)更多復(fù)雜效果。

第二關(guān)：邏輯推理

接下來(lái)我們考查一下Qwen3的邏輯推理能力。

老規(guī)矩，先上一道經(jīng)典邏輯陷阱題：

農(nóng)夫要把一頭狼、一只羊和一盆菜帶過一條河。河邊只有一艘小船，農(nóng)夫每次只能帶一樣?xùn)|西過河。如果農(nóng)夫不在場(chǎng)時(shí)，狼會(huì)吃羊，羊會(huì)吃菜。如何安排農(nóng)夫的安全過河方案？

在故意關(guān)閉聯(lián)網(wǎng)模式后，Qwen3經(jīng)過一步步推理最終給出了正確答案。

農(nóng)夫應(yīng)按照以下順序操作：
帶羊過河，返回。
帶狼過河，帶回羊。
帶白菜過河，返回。
帶羊過河。
此方案通過7次移動(dòng)（4次過河，3次返回），確保所有物品安全抵達(dá)對(duì)岸。

而且從Qwen3的思考過程能夠看到，其思維方式和人類一樣，是通過不斷推翻各種方案來(lái)找出可行路徑。

圖片

再來(lái)一道超高難度專業(yè)數(shù)學(xué)題。

原題來(lái)自今年的普特南數(shù)學(xué)競(jìng)賽，該競(jìng)賽號(hào)稱最難本科數(shù)學(xué)考試，人類要考6小時(shí)，并且所選取的題目據(jù)稱前500名選手均未能完整作答。

而扔給Qwen3后，可以看到整體的思考時(shí)間確實(shí)明顯變長(zhǎng)，最終用時(shí)5分38秒給出了正確答案。

p.s. 千問智能體無(wú)法直接上傳圖片，最終選擇從App首頁(yè)上傳圖片，提取文字后繼續(xù)使用千問智能體作答。

更有趣的是，扒一扒其思考過程，還能看到模型在線表演“崩潰”：

圖片

當(dāng)然，雖然AI的解讀速度和正確率明顯勝于人類，但還是要和同類來(lái)比。

在國(guó)外網(wǎng)友的測(cè)試中，同一道題Grok 3（Think）在約8分鐘內(nèi)找到了解決方案。

所以對(duì)比下來(lái)，這一局算Qwen3略勝一籌。

圖片

第三關(guān)：多語(yǔ)言能力

另外據(jù)介紹，Qwen3的一大亮點(diǎn)是支持119種語(yǔ)言和方言，被網(wǎng)友戲稱“AI屆多鄰國(guó)”（doge）。

別的不說(shuō)，直接讓它來(lái)挑戰(zhàn)一把國(guó)內(nèi)專業(yè)譯者的地位試試。

將莎士比亞《哈姆雷特》的經(jīng)典選段丟給它，讓它按照“信達(dá)雅”翻譯成中文。

它還知道參考優(yōu)秀譯本，并且注意避免直接抄襲造成侵權(quán)。

圖片

最終生成的結(jié)果如下（左側(cè)），對(duì)比我們熟知的朱生豪經(jīng)典譯本（右側(cè)），你覺得AI味兒濃度如何？

圖片

第四關(guān)：賽博閨蜜、shopping比價(jià)、寫歌一網(wǎng)打盡

除了以上更側(cè)重模型基礎(chǔ)能力的考查，當(dāng)Qwen3被塞進(jìn)App后，我們還解鎖了更多玩法。

做旅游規(guī)劃這種就不必多說(shuō)了，關(guān)鍵還能充當(dāng)“賽博閨蜜”，幫忙選擇更適合發(fā)朋友圈的游客照。

圖片

日常也能用來(lái)購(gòu)物比價(jià)，比如分析出當(dāng)下最值得入手的3000元預(yù)算內(nèi)平板。

不僅用表格清晰列出了各品牌的核心參數(shù)，還按照不同需求進(jìn)行了推薦，一整個(gè)造福伸手黨。

此外，最近火上熱搜的“AI寫歌”，我們也用Qwen3嘗試了一把。

五一版·大張偉嗨歌這就新鮮出爐，光看歌詞確實(shí)有內(nèi)味兒了：

Okk，以上為我們的全部實(shí)測(cè)。

小結(jié)一下，通過在通義App使用Qwen3專屬智能體，我們能明顯感受到以下幾點(diǎn)：

Qwen3旗艦?zāi)Ｐ偷纳伤俣确浅？?，體驗(yàn)很絲滑；
模型擅長(zhǎng)推理，能夠解決經(jīng)典邏輯陷阱和復(fù)雜數(shù)學(xué)題；
代碼能力方面，已經(jīng)能夠快速實(shí)現(xiàn)一些簡(jiǎn)單需求；
由于載體是App，可拓展的玩法很多。

而且，通義App自上個(gè)月頁(yè)面改版后，整體設(shè)計(jì)更簡(jiǎn)潔，交互也更加完善了。

更多網(wǎng)友實(shí)測(cè)

與此同時(shí)，隨著Qwen3模型的爆火，更多網(wǎng)友也第一時(shí)間進(jìn)行了試玩。

有和“空間內(nèi)彈小球”類似效果的頁(yè)面設(shè)計(jì)：

圖片

還有用阿拉伯語(yǔ)、法語(yǔ)和印地語(yǔ)解釋愛因斯坦相對(duì)論的玩法，該博主聲稱：

簡(jiǎn)單到連十歲的小孩都能理解。

圖片

當(dāng)然，大家一直尤為鐘愛的小游戲開發(fā)也安排上了：

圖片

開源界的新王者

Qwen3引發(fā)熱議背后，可以看到的是，在開源影響力上，以Qwen為代表的國(guó)產(chǎn)大模型，已經(jīng)有超越Llama之勢(shì)。

這一點(diǎn)，從reddit LocalLLaMA等開發(fā)者聚集的板塊的最新話題中，亦可見一斑。

圖片

不僅是基準(zhǔn)評(píng)測(cè)數(shù)據(jù)的紙面超越，實(shí)測(cè)越多，模型實(shí)力究竟幾何就越能被客觀公允地認(rèn)知。

而如今的開源格局之變，并非一蹴而就。前有DeepSeek，今有Qwen3，背后體現(xiàn)的是來(lái)自中國(guó)的開源力量一以貫之的努力，和一如既往的“中國(guó)速度”。

以Qwen為例：

2024年11月底，開源推理模型QwQ；

2025年春節(jié)檔，連發(fā)Qwen2.5百萬(wàn)上下文版本、視覺理解模型Qwen2.5-VL，還有超大規(guī)模MoE模型Qwen-2.5 Max；

2025年3月，QwQ-32B以1/10成本比肩DeepSeek-R1；

多模態(tài)方面，還有萬(wàn)相Wan的持續(xù)開源和迭代……

這還只是短短5個(gè)月內(nèi)的進(jìn)展。

再加上更加開放和商用友好的Apache 2.0協(xié)議，開發(fā)者們的轉(zhuǎn)向，自然在情理之中。

圖片

圖片

作為普通用戶，一方面，可以在通義App這樣的官方應(yīng)用上更快感知到滿血模型的能力。

另一方面，也可以期待開源，帶來(lái)更多衍生應(yīng)用的可能性。

那么，再次打開傳送門：tongyi.com

如果你探索到了什么新鮮玩法，也歡迎在評(píng)論區(qū)跟大家分享~

參考鏈接：
[1]https://x.com/YUEXINWANG61157/status/1917059240360919318
[2]https://x.com/kis/status/1917090589931409750
[3]https://x.com/godofprompt/status/1917147674438255021

責(zé)任編輯：武曉燕來(lái)源：量子位

Qwen3 Agent MCP

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<ul id="9d4er"><center id="9d4er"></center></ul>