327個(gè)樣本打破常規(guī),這個(gè)"OpenAI o1復(fù)制之旅"有點(diǎn)燃 | RAG系統(tǒng)迎來(lái)重大突破!
1、327個(gè)樣本打破常規(guī),這個(gè)"OpenAI o1復(fù)制之旅"有點(diǎn)燃
人工智能領(lǐng)域最近又掀起一陣波瀾 —— OpenAI發(fā)布了令人矚目的O1模型。然而,這個(gè)模型的具體細(xì)節(jié)卻如同蒙著面紗一般神秘。面對(duì)這種情況,一群研究者決定開(kāi)啟了一場(chǎng)別開(kāi)生面的"O1復(fù)制之旅",試圖揭開(kāi)這層面紗。
最引人注目的是,研究團(tuán)隊(duì)提出了一個(gè)創(chuàng)新的"journey learning(旅程學(xué)習(xí))"范式。與傳統(tǒng)的"死記硬背"式學(xué)習(xí)不同,這種方法讓模型不僅要學(xué)會(huì)解決問(wèn)題,還要學(xué)習(xí)整個(gè)探索過(guò)程,包括試錯(cuò)、反思和回溯。這個(gè)方法的威力令人驚嘆:僅用327個(gè)訓(xùn)練樣本,就在MATH數(shù)據(jù)集上超越了傳統(tǒng)監(jiān)督學(xué)習(xí)8%以上的成績(jī),而且沒(méi)有使用任何額外技巧!
這個(gè)項(xiàng)目的與眾不同之處在于其開(kāi)創(chuàng)性的研究方式。研究團(tuán)隊(duì)選擇實(shí)時(shí)公開(kāi)他們的所有探索過(guò)程,包括成功與失敗。這就像是在進(jìn)行一場(chǎng)現(xiàn)場(chǎng)直播的科學(xué)探索,任何人都可以第一時(shí)間了解他們的發(fā)現(xiàn),參與討論,共同推進(jìn)研究進(jìn)展。
這場(chǎng)"復(fù)制之旅"不僅僅是對(duì)一個(gè)模型的簡(jiǎn)單模仿,更是對(duì)人工智能研究方式的一次革新。研究團(tuán)隊(duì)將所有技術(shù)假設(shè)、認(rèn)知探索路徑、自研工具等資源都開(kāi)放在GitHub上,為整個(gè)AI社區(qū)貢獻(xiàn)了寶貴的經(jīng)驗(yàn)。這種開(kāi)放、透明的研究方式,或許正在開(kāi)創(chuàng)AI研究的新范式。
論文標(biāo)題:O1 Replication Journey: A Strategic Progress Report -- Part 1
論文鏈接:??https://arxiv.org/abs/2410.18982??
2、RAG系統(tǒng)迎來(lái)重大突破!這個(gè)方法讓大模型答案準(zhǔn)確率提升10%
大語(yǔ)言模型的RAG系統(tǒng)雖然強(qiáng)大,但總是會(huì)出現(xiàn)一些令人尷尬的"跑偏"現(xiàn)象。比如當(dāng)你問(wèn)"法國(guó)的首都是哪里"時(shí),它可能會(huì)順帶給你講述其他法國(guó)城市的故事。這種"畫蛇添足"不僅影響回答的準(zhǔn)確性,更可能導(dǎo)致錯(cuò)誤信息的產(chǎn)生。
研究者們提出了一個(gè)巧妙的解決方案:ChunkRAG。這個(gè)方法就像是給RAG系統(tǒng)裝上了一個(gè)"智能過(guò)濾器"。它不再是簡(jiǎn)單地獲取整篇文檔,而是先將文檔切分成小塊,再讓大模型仔細(xì)評(píng)估每個(gè)小塊與問(wèn)題的相關(guān)性,最后只保留最相關(guān)的內(nèi)容來(lái)生成答案。
這種創(chuàng)新方法的效果令人振奮。在PopQA數(shù)據(jù)集上的測(cè)試顯示,ChunkRAG使系統(tǒng)的準(zhǔn)確率提升了驚人的10個(gè)百分點(diǎn)!拿之前的例子來(lái)說(shuō),當(dāng)你問(wèn)法國(guó)首都時(shí),它現(xiàn)在會(huì)干凈利落地回答:"法國(guó)的首都是巴黎",沒(méi)有任何多余信息。
這一突破對(duì)于需要高度準(zhǔn)確性的應(yīng)用場(chǎng)景,比如事實(shí)核查、多跳推理等尤為重要。它讓我們離真正可靠的AI助手又近了一步,相信未來(lái)會(huì)有更多領(lǐng)域因此受益。
論文標(biāo)題:ChunkRAG: Novel LLM-Chunk Filtering Method for RAG Systems
論文鏈接:??https://arxiv.org/abs/2410.19572??
本文轉(zhuǎn)載自 ??AI帝國(guó)??,作者: 無(wú)影寺
