大模型 SFT 有監(jiān)督微調(diào)教程
開源地址:???https:github.comJieShenAIcsdntreemain2502SFT?????train.ipynb???:模型有監(jiān)督微調(diào)的代碼??infer.ipynb??:模型訓(xùn)練完成后,進(jìn)行推理的代碼\\{'instruct':'請你給敖丙寫一首詩:','input':'碧海生龍子,云中舞雪霜。','label':'恩仇難兩忘,何處是家鄉(xiāng)?'}預(yù)訓(xùn)練與有監(jiān)督微調(diào)對比兩者的訓(xùn)練數(shù)據(jù),大部分都一模一樣,維度在label部分,SFT需要把指令部分的label設(shè)置為100。importjsonfromtypingimp...