研究表明 GPT-4 模型具備自我糾錯(cuò)能力,有望推動(dòng) AI 代碼進(jìn)一步商業(yè)化
7 月 5 日消息,麻省理工學(xué)院(MIT)和微軟的研究學(xué)者發(fā)現(xiàn),GPT-4 模型具有優(yōu)秀的代碼自我糾錯(cuò)能力,而 GPT-3.5 不具有該特性,目前論文已經(jīng)發(fā)布于 ArXiv 中。
▲ 圖源 ArXiv
當(dāng)下市面上已經(jīng)涌現(xiàn)出了一批專為代碼而生的 AI 模型,但目前更多只是起到輔助開發(fā)者寫代碼的作用,例如IT之家小伙伴們熟悉的微軟 Copilot 助理,這些 AI 模型當(dāng)下僅能夠生成代碼片段,因此尚不能完全替代人工開發(fā)者。
研究人員通過研究 GPT-4 表示,當(dāng)下實(shí)際上可以通過“模型的自我糾錯(cuò)”方式,令模型“反思自身所存在的不足之處”,以提升代碼片段長(zhǎng)度、并改善輸出結(jié)果的準(zhǔn)確度。
▲ 圖源 ArXiv
▲ 圖源 ArXiv
來自愛丁堡大學(xué)的研究者符堯表示,只有 GPT-4 才具備自我改進(jìn)的能力,而較弱的 GPT-3.5 則沒有這種特性,這一發(fā)現(xiàn)表明大型模型可能具有一種新型能力,即通過一系列用戶反饋令 AI 自我糾錯(cuò),最終得到令用戶滿意的結(jié)果,這種自我糾錯(cuò)的能力可能只存在于足夠成熟的 AI 模型中。
在經(jīng)過自我糾錯(cuò)后,GPT-4 模型輸出的代碼有 71% 達(dá)到研究人員設(shè)定的要求,而使用 GPT-4 對(duì) GPT-3.5 所生成的代碼經(jīng)過糾錯(cuò)后,這一批代碼的通過率也達(dá)到了 54%。
研究人員表示,當(dāng)下可以將 GPT-4 的自我糾錯(cuò)方式應(yīng)用于商業(yè)中,在扣除一系列糾錯(cuò)冗余成本后,依然能夠產(chǎn)生一定的收益。論文總能夠在一定程度上反映行業(yè)未來的趨勢(shì),因此有望在今后涌現(xiàn)出一批基于 GPT-4 的代碼生成器。