五分鐘,構(gòu)建國產(chǎn)數(shù)據(jù)庫智能體
原創(chuàng)近期,圈里很多朋友,都嘗試?yán)?DeepSeek 構(gòu)建自己的智能體。我也利用騰訊元器,將個(gè)人公眾號內(nèi)容做了個(gè)智能體,可以實(shí)現(xiàn)簡單的問答。那么延展來看,智能體除了可利用公眾號內(nèi)容,也可使用離線文件等方式來構(gòu)建。這不禁讓我考慮,是否可用這樣方式構(gòu)造一個(gè)數(shù)據(jù)庫智能體。說干就干,花了一個(gè)小時(shí),構(gòu)建一個(gè)國產(chǎn)庫的智能體,玩玩還不錯(cuò)。這里也希望,我們國產(chǎn)數(shù)據(jù)庫的廠商,能更多專注這種新的內(nèi)容分享方式,加快推進(jìn)國產(chǎn)數(shù)據(jù)庫的普及。下面我就將構(gòu)建步驟,分四步來說明下。
1. 什么是“騰訊元器”
在開始之前,我們先了解下什么是“騰訊元器”。騰訊元器(https://yuanqi.tencent.com),是騰訊混元大模型團(tuán)隊(duì)推出的智能體創(chuàng)作工具,方便您通過添加提示詞設(shè)定、插件、知識庫等功能捏出自己喜歡的智能體。
你自己創(chuàng)建的智能體,可以發(fā)布出來供大家使用,也可以私有來使用。目前已經(jīng)有大量定義好的智能體,方便大家來使用。我自己也定義了幾個(gè)智能體,大家也可以搜索使用。
2. 專有智能體構(gòu)建
智能體的創(chuàng)建,可分為幾個(gè)步驟,全程可通過簡單填寫表單即可完成。后面大致說明下我的操作步驟。
(1)準(zhǔn)備知識庫材料
目前元器創(chuàng)建智能體,支持多種構(gòu)建知識庫的方式。如果是公眾號文章就比較簡單,開通授權(quán)即可;如果是問答對類型,則需要構(gòu)建一個(gè)表格實(shí)現(xiàn)問答描述;最為通用則是文本類型,這里就需要準(zhǔn)備一系列文檔。
目前支持的文本類型,包括PDF、WORD、TXT等,這里就需要將構(gòu)建下這些文件。目前國內(nèi)數(shù)據(jù)庫廠商大多提供了在線文檔的功能,這里通過自己寫的一個(gè)小爬蟲將文檔下載并轉(zhuǎn)儲(chǔ)成PDF。在實(shí)現(xiàn)上完全可以利用 DeepSeek 直接生成代碼,微調(diào)后即可使用。以達(dá)夢數(shù)據(jù)庫為例,官方文檔位于 https://eco.dameng.com/document/dm/zh-cn/pm,以此為基礎(chǔ)將其文檔都下載下來。
(2)創(chuàng)建知識庫
創(chuàng)建知識庫比較簡單,只需要將文件上傳即可。這里要注意,文檔上傳后需要有個(gè)處理過程,根據(jù)文檔數(shù)量及大小有關(guān)系,可耐心等待一會(huì)。其具體的進(jìn)度,可以在知識庫列表頁面中查看到。
(3)創(chuàng)建智能體
有了知識庫后,就可以創(chuàng)建智能體。分為兩個(gè)部分,一是基礎(chǔ)是設(shè)定部分,這里主要是提示詞的部分,比較方便的是,元器提供了提示器的自動(dòng)生成,稍加修改即可。
在高級設(shè)定部分,主要完成模型設(shè)置和知識庫配置即可。這里需注意選擇模型,可以有騰訊混元模型或DeepSeek的選擇,知識庫部分關(guān)聯(lián)到剛才創(chuàng)建的知識庫即可。
當(dāng)然還有些更為復(fù)雜的配置,如可以調(diào)用插件和工作流。系統(tǒng)已內(nèi)置了不少插件,可供使用;也預(yù)制了部分工作流的示例,可直接復(fù)制參考使用。
(4)發(fā)布智能體
最后一步,發(fā)布智能體即可。發(fā)布后,就可以通過多種方式使用。
3. 效果體驗(yàn)及展望
針對構(gòu)造的智能體,我們簡單體驗(yàn)下效果:
從上面效果可見,智能體已經(jīng)可以承擔(dān)一些簡單的問答類工作??梢苑奖阌脩?,快速去了解一個(gè)產(chǎn)品;也能彌補(bǔ)只有官方文檔造成的入手慢、門檻高的問題。國產(chǎn)數(shù)據(jù)庫之前常常被人詬病的問題,就是文檔差、內(nèi)容舊,問答智能體的出現(xiàn)可以在一定程度上解決這些問題。當(dāng)然功能遠(yuǎn)不限于此,如未來提供更為豐富的插件和工作流定義,完全可以開發(fā)更為復(fù)雜的功能。未來隨著智能體的發(fā)展,相信會(huì)有更多、更垂直的智能體出現(xiàn),場景也不僅僅限于知識問答類的,例如針對信創(chuàng)場景下創(chuàng)建個(gè)“信創(chuàng)智能體”,依托于構(gòu)建自各廠商產(chǎn)品的知識體,通過工作流分辨用戶需求,可實(shí)現(xiàn)包括產(chǎn)品選型、架構(gòu)對比、設(shè)計(jì)開發(fā)、語句優(yōu)化等常見問題的解決。