大語(yǔ)言模型強(qiáng)化的多智能體如何使教育等關(guān)鍵領(lǐng)域受益?
近日,研究人員發(fā)布了??MathVC??,一個(gè)“虛擬課堂”,其中包含多個(gè)??大語(yǔ)言模型(LLM)模擬的學(xué)生角色??,與人類學(xué)生討論并共同解決數(shù)學(xué)問(wèn)題,旨在為他們提供另一個(gè)練習(xí)數(shù)學(xué)建模技能的場(chǎng)所。該系統(tǒng)目前僅針對(duì)中學(xué)教育。
網(wǎng)站: https://murongyue.github.io/MathVC.github.io/
論文: https://arxiv.org/pdf/2404.06711.pdf
代碼和演示(尚未發(fā)布):https://github.com/MurongYue/MathVC
開(kāi)發(fā)MathVC的首要問(wèn)題在于,大語(yǔ)言模型如何模擬像現(xiàn)實(shí)中的中學(xué)生一樣行為的角色?在技術(shù)上,該工作討論和探討了兩個(gè)對(duì)齊問(wèn)題,即特征對(duì)齊和會(huì)話程序?qū)R,以確保模擬的真實(shí)性:
- 特征對(duì)齊(每個(gè)角色):如何將LLM的角色模擬與真實(shí)人類學(xué)生的真實(shí)行為對(duì)齊?
- 會(huì)話程序?qū)R(角色間):如何將模擬中的整體會(huì)話程序與真實(shí)人類學(xué)生之間的真實(shí)數(shù)學(xué)問(wèn)題討論對(duì)齊?
作為跨學(xué)科主題的一個(gè)重大挑戰(zhàn),該項(xiàng)工作沒(méi)有可以用來(lái)對(duì)LLM進(jìn)行微調(diào)的真實(shí)學(xué)生數(shù)據(jù)。
因此,研究人員著重于為提示LLM提供更好的“基礎(chǔ)”。具體來(lái)說(shuō),研究人員設(shè)計(jì)了符號(hào)化的角色模式來(lái)模擬討論中學(xué)生角色的動(dòng)態(tài)思維過(guò)程,以及定義了會(huì)話階段和對(duì)話行為的元規(guī)劃器來(lái)調(diào)節(jié)整體多智能體對(duì)話。
這里展示了一個(gè)示例模擬,其中三個(gè)由LLM驅(qū)動(dòng)的學(xué)生角色正在協(xié)作解決來(lái)自GSM8k數(shù)據(jù)集的數(shù)學(xué)問(wèn)題??梢园l(fā)現(xiàn),MathVC可以模擬學(xué)生的更細(xì)粒度特征,例如他們可能一開(kāi)始犯錯(cuò),然后通過(guò)與虛擬同學(xué)的積極討論識(shí)別和解決錯(cuò)誤。這是無(wú)法通過(guò)傳統(tǒng)的模擬實(shí)現(xiàn)的,傳統(tǒng)模擬通常表面化(例如,學(xué)生角色口頭聲稱數(shù)學(xué)不好,但實(shí)際上進(jìn)行了完美的計(jì)算)。
本文轉(zhuǎn)載自公眾號(hào)AIGC最前線
