AI 輔助學(xué)習(xí)如何選大模型?兼初步測(cè)試 Llama 4
在這個(gè)教材知識(shí)爆炸的時(shí)代,如何高效地幫助孩子掌握知識(shí)、培養(yǎng)學(xué)習(xí)興趣,成為了許多家長(zhǎng)的共同課題。而以大語(yǔ)言模型為代表的人工智能技術(shù)的出現(xiàn),為解決這一難題提供了一種全新的可能。
利用 AI,不僅能幫助我們家長(zhǎng)快速掌握孩子正在學(xué)習(xí)的內(nèi)容,從而便于與他們進(jìn)行更有效的溝通,增進(jìn)「親子關(guān)系」;同時(shí),AI 還能拓展我們的思路,為孩子提供更多啟發(fā)和靈感,讓他們的學(xué)習(xí)過(guò)程更加豐富多彩。
大模型海選
首先,我們需要選擇一個(gè)你比較滿意的 AI 大模型來(lái)提供輔助。考慮到很多題目中包含圖片,這種情況下,我們應(yīng)該優(yōu)先選擇具備強(qiáng)大多模態(tài)能力(即能處理文本和圖像)的模型,以確保更全面、準(zhǔn)確的支持。
你可以準(zhǔn)備一些題目,初步測(cè)試候選大模型的能力。在這里,我們通過(guò)一道初中科學(xué)題來(lái)進(jìn)行實(shí)際操作示范,供大家參考。
我從網(wǎng)上找到了一道初中科學(xué)題,這道題的卷面上還有一些筆跡和劃痕。我想借此測(cè)試 AI 在實(shí)際應(yīng)用中的表現(xiàn),特別是這些卷面上的劃痕是否會(huì)干擾它的識(shí)別能力。
此題的正確答案為 D。
卷面留有錯(cuò)誤答案,順便看看會(huì)不會(huì)干擾到大模型。
我們先看國(guó)內(nèi)大模型,從中選出一個(gè)比較能打的,再對(duì)比下國(guó)外最新的大模型。
?kimi + 長(zhǎng)思考
成功被干擾到了,而且分析得也不夠詳細(xì),盡管長(zhǎng)思考了很久。
?夸克
?通義 Qwen2.5-max
?智譜清言
?MiniMax
?DeepSeek-R1
?豆包
結(jié)論
“
這么國(guó)產(chǎn)多大模型中,通過(guò)此題考驗(yàn)的只有豆包。
”
下面我們就以豆包為例,繼續(xù)就這道題目進(jìn)行深入解讀。
1、分析一下在實(shí)際題目中,一般是如何考查學(xué)生對(duì)這些知識(shí)點(diǎn)的理解和應(yīng)用。
2、這道題錯(cuò)選 C 的話,你覺(jué)得反映出學(xué)生在知識(shí)點(diǎn)的理解上哪方面出了問(wèn)題呢?
3、請(qǐng)用 Mermaid 代碼展示這些知識(shí)點(diǎn)及其關(guān)系。
Mermaid 代碼如下,
graph TD
A[光敏電阻特性] --> B[串聯(lián)電路規(guī)律]
A --> C[電磁繼電器原理]
B --> D[實(shí)際控制邏輯]
C --> D
A -->|光照增強(qiáng)→阻值減小| E[電阻變化]
B -->|I=U/R總| F[電流變化]
B -->|U與R成正比| G[電壓分配]
C -->|電流→磁性→觸點(diǎn)動(dòng)作| H[繼電器控制]
D -->|路燈亮滅邏輯| I[應(yīng)用場(chǎng)景]
subgraph 核心知識(shí)點(diǎn)
A[光敏電阻特性]
B[串聯(lián)電路規(guī)律]
C[電磁繼電器原理]
end
subgraph 關(guān)鍵關(guān)系
E --> F
F --> G
G --> H
H --> I
end
4、根據(jù)這些知識(shí)點(diǎn),重新出幾道不同難度的題目。
5、幫忙找一找講解這些知識(shí)點(diǎn)的相關(guān)視頻。
這里體現(xiàn)出字節(jié)跳動(dòng)的優(yōu)勢(shì),會(huì)關(guān)聯(lián)抖音視頻。
點(diǎn)開(kāi)其中一個(gè)視頻瞅一瞅,
怎么樣,感覺(jué)豆包能不能助你一臂之力呢?
下面我們對(duì)比一下國(guó)外大模型。
?ChatGPT
此題 ChatGPT 沒(méi)搞定,不過(guò)這里只測(cè)試了默認(rèn)的 GPT-4o。
?Claude 3.7
這個(gè)我試了好幾個(gè)地方的版本,包括 ??https://lmarena.ai?
? 上的 Thinking 版本,發(fā)現(xiàn)答案都沒(méi)弄對(duì),但下面這個(gè)版本出來(lái)的知識(shí)導(dǎo)圖還可以。
?Llama 4
Meta ai 剛剛發(fā)布的開(kāi)源大模型,迫不及待地看看能力如何。
發(fā)現(xiàn)在這個(gè)問(wèn)題上表現(xiàn)一般,等待推理型版本,以及后期大家的改進(jìn)。
?Gemini 2.5 Pro
就此題而言,最新版的 Gemini 給出的解讀還是非常到位,知識(shí)點(diǎn)也很詳細(xì)。
知識(shí)脈絡(luò)圖畫出來(lái)是這樣滴,
根據(jù)這些知識(shí)點(diǎn),重新出幾道不同難度的題目。
視頻推薦,
測(cè)試結(jié)果顯示,對(duì)于海外用戶來(lái)說(shuō),Gemini 是一個(gè)不錯(cuò)的選擇;而國(guó)內(nèi)用戶則可以使用豆包,也很香,其短視頻內(nèi)容更加豐富。期待其他大模型的繼續(xù)努力。
本文轉(zhuǎn)載自??機(jī)器學(xué)習(xí)與數(shù)學(xué)??,作者:大師兄
