可令 AI 模型計算復雜離散數(shù)學問題,谷歌 DeepMind 公布“FunSearch”訓練法
12 月 15 日消息,谷歌 DeepMind 日前公布了一種名為“FunSearch”的模型訓練法,號稱能夠計算包含“上限級問題”、“裝箱問題”在內的一系列“涉及數(shù)學、計算機科學領域的復雜問題”。
▲ 圖源 谷歌 DeepMind(下同)
據(jù)悉,F(xiàn)unSearch 模型訓練法主要為 AI 模型引入了一個“評估器(Evaluator)”系統(tǒng),AI 模型輸出一系列“創(chuàng)意解題方法”,“評估器”則負責評判模型輸出的解題辦法,反復迭代后,就能訓練出數(shù)學能力更強的 AI 模型。
谷歌 DeepMind 使用 PaLM 2 模型進行測試,研究人員建立了專用“代碼池”,使用代碼形式為模型輸入一系列問題,并設置了評估器流程,之后模型便會在每一次迭代中,自動從代碼池中挑選問題,生成“具有創(chuàng)造性的新解法”,并交由評估器進行評估,其中“最佳解法”將會被重新加入到代碼池中,重新開始另一次迭代。
IT之家注意到,FunSearch 訓練法對“離散數(shù)學(Combinatorics)”特別擅長,經(jīng)訓練法鍛煉后的模型,可以輕松解決極值組合數(shù)學問題,研究人員在新聞稿中便介紹了模型計算“上限級問題(數(shù)學中涉及計數(shù)和排列領域的一個中心問題)”的過程方法。
此外,研究人員也成功使用 FunSearch 訓練法解決了“裝箱問題(Bin Packing Problem)”,這是一個“將不同大小物品放進最少數(shù)量容器”的問題,F(xiàn)unSearch 為“裝箱問題”提供了一種“即時性”的解決方案,生成一項“根據(jù)物品現(xiàn)有體積自動進行調整”的程序。
研究人員提到,與其他利用神經(jīng)網(wǎng)絡進行學習的 AI 訓練法相比,經(jīng)過 FunSearch 訓練法鍛煉后的模型,輸出的代碼更易于檢查與部署,也就代表更容易被整合到實際工業(yè)環(huán)境中。