自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

獲星1.9k,LLM微調(diào)神器Lamini上演速度與激情,免費(fèi)可用

人工智能 新聞
近日,Lamini 推出了全新的 Alpha 公測(cè)版,讓微調(diào)上演「速度與激情」?,F(xiàn)在只需十分鐘、三至五行代碼就能實(shí)現(xiàn)微調(diào),更重要的是 0 費(fèi)用。

LLM 微調(diào)從一件復(fù)雜的事情,已經(jīng)通過不斷的技術(shù)改進(jìn)變得易上手起來。

這不,免費(fèi)且迅速的 LLM 微調(diào)已經(jīng)可以實(shí)現(xiàn)了。

4 月底,斯坦福的一群開發(fā)者發(fā)布了 Lamini,號(hào)稱可以為每個(gè)開發(fā)人員提供從 GPT-3 帶到 ChatGPT 的超能力。

近日,Lamini 推出了全新的 Alpha 公測(cè)版,讓微調(diào)上演「速度與激情」。現(xiàn)在只需十分鐘、三至五行代碼就能實(shí)現(xiàn)微調(diào),更重要的是 0 費(fèi)用。

目前,4 億參數(shù)以內(nèi)的 LLM 微調(diào)完全免費(fèi)。這只是一個(gè)開始。

圖片圖片

項(xiàng)目地址:https://github.com/lamini-ai/lamini

Lamini 的優(yōu)勢(shì)

先來一起看看 Lamini 有哪些優(yōu)勢(shì)。

圖片圖片

  • 免費(fèi),適用于小型 LLM;
  • 迅速,10-15 分鐘;
  • 很大,無限大小的 prompt,比最大的 prompt 多 1000 倍以上的空間;
  • 學(xué)習(xí),檢索增強(qiáng)生成,它不僅是在已知的基礎(chǔ)上試圖理解內(nèi)容,還在學(xué)習(xí)新東西。

并且,在 Lamini 的項(xiàng)目地址中有著

  • 1400 個(gè)問答數(shù)據(jù)集(這是關(guān)于 Lamini 的內(nèi)部工程文檔,你也可以將其自定義);
  • 在此數(shù)據(jù)集上運(yùn)行 LLM 微調(diào)的代碼;
  • 回答問題的開源微調(diào) LLM(例如關(guān)于 Lamini,或其他你想問的)。

Lamini 使用教程

使用示例

Lamini 真的有這么神嗎?這里由一份示例請(qǐng)你查收。

首先,有一個(gè)需要微調(diào)的 LLM。示例中是一個(gè)關(guān)于 Lamini 內(nèi)部工程文檔的問答式 LLM。

圖片圖片

該模型提供了一個(gè)聊天界面,它使用了一個(gè) 410M 參數(shù)的 Pythia 模型作為基礎(chǔ)。

這個(gè) 410M 參數(shù) LLM 的性能看起來并不令人滿意。當(dāng)詢問:「我如何向 Lamini 添加數(shù)據(jù)?」時(shí),它給出的答案并不靠譜。

圖片圖片

你還可以給它輸入數(shù)據(jù)。對(duì)于本例,你有一個(gè)關(guān)于 Lamini 的 1400 個(gè)問題和答案的數(shù)據(jù)集。雖然它看起來很小,但它比目前最大的 Prompt 大小要大得多 (約 120K)。

以下是準(zhǔn)備數(shù)據(jù)的專業(yè)建議:質(zhì)量非常重要。只要 100 個(gè)高質(zhì)量的例子就能讓你走上正確的道路。那么什么是高質(zhì)量?


  • 高質(zhì)量:連貫、清晰、準(zhǔn)確的示例。
  • 多樣化:涵蓋廣泛的主題和數(shù)據(jù)范圍,應(yīng)避免虛假關(guān)聯(lián)和數(shù)據(jù)偏差。
  • 真實(shí):實(shí)際的用戶數(shù)據(jù)或人為創(chuàng)建的示例,而不是 LLM 生成的虛假示例,以捕捉人機(jī)交互的細(xì)微差別,并改進(jìn)模型,使其超越現(xiàn)有的生成能力。

然后,只需將這些數(shù)據(jù)加載到模型中,并告訴它進(jìn)行訓(xùn)練:

圖片圖片

只需要 10-15 分鐘,你就可以運(yùn)行這個(gè) LLM 了。

圖片 

讓我們?cè)俅螁柾瑯拥膯栴},「我如何向 Lamini 添加數(shù)據(jù)?」,內(nèi)容如下:

圖片

這次的答案是正確的了,看來微調(diào)發(fā)揮了顯著的效果。

如何使用 Lamini 訓(xùn)練 LLM

1、使用 Lamini Types 定義 LLM 接口。你想讓它成為一個(gè)聊天機(jī)器人?接口就是問進(jìn)答出。你想讓它成為代碼 copilot?接口就是程序輸入,更多程序輸出。使用你的類型運(yùn)行一般的 LLM(基本模型或基礎(chǔ)模型)。

2、查找相關(guān)數(shù)據(jù)并創(chuàng)建 Lamini Types。哪些數(shù)據(jù)對(duì)執(zhí)行任務(wù)的人類專家有用?獲取該數(shù)據(jù)并創(chuàng)建與其模式相匹配的(附加)Lamini Types。它可以是支持性文檔,如你的文檔中的函數(shù),用于你的代碼聊天機(jī)器人,也可以是向你的機(jī)器人提出的示例問題。

3、使用 Lamini 將數(shù)據(jù)加載到 Types 中,并將 Types 加載到 LLM 中。這將你的數(shù)據(jù)轉(zhuǎn)換為 Types 格式,以便 LLM 能夠最好地從中學(xué)習(xí)。

4、獲取與你的 LLM 接口相匹配的數(shù)據(jù)。如果沒有?也沒問題。這就是數(shù)據(jù)生成的目的,其中利用 LLM 管道。首先,使用 Lamini LLM Engine 運(yùn)行數(shù)據(jù)生成,以獲得更多正確的 Lamini Types(任何一種)數(shù)據(jù)。然后使用 Lamini 過濾器或你自己的腳本過濾數(shù)據(jù),以獲得高質(zhì)量數(shù)據(jù)。

5. 通過優(yōu)化訓(xùn)練使通用 LLM 專業(yè)化。使用 Lamini 庫,針對(duì)所有數(shù)據(jù)訓(xùn)練你自己的 LLM。

圖片

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2011-10-28 13:41:31

萬網(wǎng)

2025-03-27 08:00:23

2022-09-01 09:35:13

java應(yīng)用工具

2017-04-25 09:38:19

戴爾

2025-01-26 12:08:03

2011-07-08 14:18:44

云特區(qū)云計(jì)算

2017-04-20 08:47:30

2024-06-06 08:25:30

2013-06-13 10:02:36

JavaScriptJavaScript編

2015-04-14 11:01:08

大數(shù)據(jù)速度與激情用車法則

2017-05-24 13:14:52

RCTFmotesolo安全

2024-05-07 09:04:27

Tailwind前端開發(fā)Rust

2015-04-22 09:35:05

廣域網(wǎng)優(yōu)化產(chǎn)品深信服

2015-04-14 09:53:07

AWS企業(yè)云AWS技術(shù)大會(huì)

2015-05-07 13:11:22

透視寶云智慧

2014-01-30 12:38:17

微米移動(dòng)社交

2025-02-14 08:18:33

2024-11-11 13:33:28

2024-11-21 08:22:45

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)