GLM-4-Flash宣布免費(fèi),Agentic RAG體驗(yàn),讓我覺著,真香! 精華
?一、RAG問答
將RAG過程應(yīng)用于問答的一個代表性實(shí)例。主要由3個步驟組成。
- 索引,文檔被分割成塊,編碼成向量,并存儲在向量數(shù)據(jù)庫中。
- 檢索,根據(jù)語義相似性檢索與問題最相關(guān)的前k個塊。
- 生成,將原始問題和檢索到的塊一起輸入到大型語言模型(GLM-4-Flash)中,生成最終答案。
原生RAG問答流程(GLM-4-Flash)
從RAG問答常見的三種問答類型為例:
- 事實(shí)類
- 總結(jié)類
- 拒絕回答
【案例說明】
多問題事實(shí)類型Query: 藥明康德2022-2024年歸母凈利潤預(yù)測分別是多少?
GLM-4-Flash回答:答案正確、溯源正確(來源于參考資料5)
根據(jù)已知信息,藥明康德(603259)2022-2024年的凈利潤預(yù)測分別為:
- 2022年:80.29億元
- 2023年:99.05億元
- 2024年:127.56億元
這些預(yù)測來源于參考材料[5]。
輸入:
歸納總結(jié)類型Query: 三七互娛未來公司在海外市場的發(fā)展戰(zhàn)略是什么?
GLM-4-Flash回答:回答全面且具有概括性
三七互娛未來公司在海外市場的發(fā)展戰(zhàn)略包括以下幾點(diǎn):
1. **持續(xù)發(fā)行優(yōu)質(zhì)游戲**:三七互娛將繼續(xù)推出更多自研和代理游戲,如《云上城之歌》、《斗羅大陸:魂師對決》、《叫我大掌柜》等,以提升海外市場的知名度和收入。
2. **突破增長**:公司致力于在MMO、SLG、卡牌以及模擬經(jīng)營四大賽道中深耕,以實(shí)現(xiàn)品類創(chuàng)新和迭代。
3. **儲備更多游戲**:三七互娛海外發(fā)行儲備了16款游戲,包括自研和代理產(chǎn)品,預(yù)計(jì)這些產(chǎn)品將助力公司未來在海外市場的持續(xù)增長。
4. **元宇宙布局**:公司正積極布局元宇宙,通過投資元宇宙上下游優(yōu)質(zhì)標(biāo)的,與相關(guān)企業(yè)合作,并上線全國首個元宇宙游戲藝術(shù)館,探索數(shù)字藏品與元宇宙社交領(lǐng)域的創(chuàng)新玩法。
5. **區(qū)域拓展**:未來,三七互娛將繼續(xù)在日本、韓國等地發(fā)行游戲,擴(kuò)大其海外市場覆蓋范圍。
6. **技術(shù)創(chuàng)新**:在流量經(jīng)營核心優(yōu)勢上加碼自研,進(jìn)行品類創(chuàng)新迭代,以適應(yīng)海外市場變化。
總體來看,三七互娛在海外市場的發(fā)展戰(zhàn)略是多元化游戲發(fā)行、深耕特定游戲品類、布局元宇宙、持續(xù)技術(shù)創(chuàng)新以及區(qū)域市場拓展。
輸入:
歸納總結(jié)類型Query: 興齊眼藥在眼科醫(yī)療領(lǐng)域的競爭對手有哪些?
GLM-4-Flash回答:參考資料無答案,按著指令要求回答了“未知”
未知
輸入:
GLM-4-Flash使用指南
pip install --upgrade zhipuai
from zhipuai import ZhipuAI
client = ZhipuAI(api_key="") # 填寫您自己的APIKey
response = client.chat.completions.create(
model="glm-4-flash", # 填寫需要調(diào)用的模型編碼
messages=[
{"role": "user", "content": "作為一名營銷專家,請為智譜開放平臺創(chuàng)作一個吸引人的slogan"},
{"role": "assistant", "content": "當(dāng)然,為了創(chuàng)作一個吸引人的slogan,請告訴我一些關(guān)于您產(chǎn)品的信息"}
],
)
print(response.choices[0].message)
二、Agentic RAG
RAG問答還常常遇到一些多跳推理問題,例如Query=“與第五交響曲創(chuàng)作于同一世紀(jì)的交通工具是什么?”,大模型(GLM-4-Flash)需要分兩個子問題來解決:
- 第五交響曲是在哪個世紀(jì)創(chuàng)作的?
- 19世紀(jì)發(fā)明的交通工具
?
【案例說明】
多跳推理Query: 與第五交響曲創(chuàng)作于同一世紀(jì)的交通工具是什么?
GLM-4-Flash回答:工具識別正確、且參數(shù)提取正確
第一輪回答:
Function(arguments='{"search_term": "第五交響曲創(chuàng)作年份"}', name='get_timeline_explorer')
tool_answer: 第五交響曲是由德國作曲家路德維?!し丁へ惗喾覄?chuàng)作的,完成于1808年。
第二輪回答:
Function(arguments='{"time_period": "1808"}', name='transportation_evolution_archive')
tool_answer:
19世紀(jì)初,以下是一些重要的交通工具發(fā)展:
1. 馬車:雖然馬車在19世紀(jì)初仍然普遍使用,但這一時期也見證了馬車技術(shù)的改進(jìn),例如蒸汽動力馬車的出現(xiàn)。
2. 蒸汽機(jī)車(蒸汽火車):1825年,喬治·斯蒂芬森設(shè)計(jì)的“旅行者號”蒸汽機(jī)車在斯托克頓和達(dá)靈頓鐵路上進(jìn)行了首次商業(yè)運(yùn)行,標(biāo)志著鐵路運(yùn)輸時代的開始。
3. 蒸汽船:19世紀(jì)初,蒸汽船開始取代帆船,成為更高效的水上交通工具。例如,克萊門特·阿特金斯設(shè)計(jì)的“薩凡納號”蒸汽船在1830年完成了從紐約到英國的航行。
輸入:
tools = [
{
"type": "function",
"function": {
"name": "get_timeline_explorer",
"description": "通過輸入年份或世紀(jì),用戶可以獲取該時期內(nèi)的重大歷史發(fā)展,包括科學(xué)、技術(shù)、藝術(shù)和社會變革等方面的信息",
"parameters": {
"type": "object",
"properties": {
"search_term": {
"description": "用戶輸入的關(guān)鍵詞,用于在歷史時間線中搜索相關(guān)事件",
"type": "string"
}
},
"required": [ "search_term"]
},
}
},
{
"type": "function",
"function": {
"name": "transportation_evolution_archive",
"description": "交通工具發(fā)展數(shù)據(jù)庫",
"parameters": {
"type": "object",
"properties": {
"time_period": {
"description": "用戶可以指定一個年份,以查找該時間內(nèi)發(fā)展的交通工具",
"type": "string"
}
},
"required": [ "time_period"]
},
}
},
]
messages = []
messages.append({"role": "user", "content": "以下對話優(yōu)先使用工具"})
messages.append({"role": "user", "content": "與第五交響曲創(chuàng)作于同一世紀(jì)的交通工具是什么?"})
response = client.chat.completions.create(
model="glm-4-flash", # 填寫需要調(diào)用的模型名稱
messages=messages,
tools=tools,
)
print(response.choices[0].message)
三、問答生成微調(diào)
在大模型企業(yè)落地的時候經(jīng)常會遇到有客戶用RAG對一些客服場景的FAQ數(shù)據(jù)集進(jìn)行問答,這里一個更好的選擇是用大模型微調(diào)固定的QA對,剛好GLM-4-Flash也支持私域數(shù)據(jù)微調(diào)。?
GLM-4-Flash微調(diào)的4個主要步驟:
GLM-4-Flash訓(xùn)練完成:
GLM-4-Flash部署完成:
【案例說明】
微調(diào)后,GLM-4-Flash可以正確回答。
藥明康德2022-2024年歸母凈利潤預(yù)測分別是86.21億元、94.29億元、116.27億元。
微調(diào)前,GLM-4-Flash因?yàn)橛?xùn)練數(shù)據(jù)時效性,是無法回答該問題的。?
本文轉(zhuǎn)載自??PaperAgent??,作者: PaperAgent ????
