一文帶你了解【SFT微調】與【Unsloth】
社區(qū)頭條 在當下流行的幾種大模型微調方法中,大家經(jīng)常會看到談論SFP與Unsloth的文章,那我們應該如何了解它們?它們的技術特點又有哪些?各自應用在哪些模型微調的場景呢?本篇我們帶著這些問題,一起來了解一下。一、SFT微調技術介紹監(jiān)督微調(SupervisedFinetuning,SFT)是一種遷移學習(TransferLearning)技術,指的是在已經(jīng)預訓練好的模型(例如大語言模型中的GPT、BERT等)基礎上,使用帶有人工標注標簽的監(jiān)督數(shù)據(jù),對模型進行進...