神了!最大化 DeepSeek 潛能 :知識(shí)圖譜激活
deepseek原理+應(yīng)用+實(shí)踐,和大家分享:
- 小眾的,deepseek核心技術(shù)原理;
- 大眾的,提示詞要怎么寫;
畫外音:文末有大彩蛋。
今天和大家聊聊,deepseek的核心技術(shù)之一的知識(shí)圖譜激活。
什么是知識(shí)圖譜(Knowledge Graph)?
互聯(lián)網(wǎng)上有很多孤立的信息,知識(shí)圖譜以一種圖的形式,通過(guò)實(shí)體(Entity),關(guān)系(Relation)和屬性(Atrribute)這個(gè)三維組將這些信息組織起來(lái),形成知識(shí),來(lái)描述這個(gè)世界,這就是知識(shí)圖譜。
知識(shí)圖譜簡(jiǎn)直就是為AI量身定做的:
(1) 信息檢索效率極大提升
- 傳統(tǒng):關(guān)鍵詞匹配
- 知識(shí)圖譜:語(yǔ)義關(guān)聯(lián)
(2) 推理速度極大替身
- 傳統(tǒng):海量數(shù)據(jù)分析(秒,十秒級(jí))
- 知識(shí)圖譜:節(jié)點(diǎn)跳轉(zhuǎn)(毫秒級(jí))
(3) 可解釋性強(qiáng)
- 傳統(tǒng):難以解釋
- 知識(shí)圖譜:按照路徑推理
結(jié)合前幾天兩處核心知識(shí)的鋪墊:
- 多跳推理:將信息關(guān)聯(lián),整合與推理;
- MOE:模型不再追求大而全,而是追求多個(gè)專而精的專家;
知識(shí)圖譜能夠以MOE訓(xùn)練出的多個(gè)專家為核心,將知識(shí)快速組織與關(guān)聯(lián)起來(lái)。
那什么是知識(shí)圖譜激活?
Knowledge Graph Activation,AI通過(guò)MOE預(yù)訓(xùn)練,得到了非常多專家核心節(jié)點(diǎn)。在回答用戶問(wèn)題的時(shí)候,需要:
- 快速定位專家類型;
- 快速加載專家子圖譜;
這個(gè)過(guò)程,就是知識(shí)圖譜激活。
知識(shí)圖譜激活對(duì)我們寫提示詞,獲取更佳的回答質(zhì)量有什么啟示呢?
為了提高效率與質(zhì)量,可以在提示詞中:
- 實(shí)體(Entity)或者屬性(Atrribute)明確化:包含能夠快速定位專家身份的關(guān)鍵詞;
- 關(guān)系(Relation)顯式化:包含能夠快速定位專家身份的關(guān)鍵詞;
- 領(lǐng)域或者身份顯式化:明確告知領(lǐng)域,或者明確定義專家(專家團(tuán))身份;
畫外音:MOE機(jī)制支持定義多專家身份,并且多個(gè)身份交叉驗(yàn)證能夠提升回復(fù)質(zhì)量。
如果我們不顯式告訴AI希望他扮演什么專家:
- AI需要通過(guò)提示詞推理出MOE專家角色,占用深度思考時(shí)間,效率會(huì)降低;
- 有概率推理出錯(cuò)誤的專家,回復(fù)質(zhì)量會(huì)下降;
案例一:屬性明確化。
bad case:請(qǐng)介紹“架構(gòu)師之路”。
這樣的提示詞,完全不符合預(yù)期。
畫外音:Kimi居然還需要搜索,說(shuō)明無(wú)法解答相關(guān)知識(shí)。
better case:請(qǐng)介紹帥氣的“架構(gòu)師之路”?
加入明確的屬性,AI立刻能識(shí)別,載入并激活正確的知識(shí)子圖譜,快速輸出高質(zhì)量?jī)?nèi)容。
畫外音:Kimi不需要搜索,說(shuō)明學(xué)習(xí)并固化了相關(guān)知識(shí),形成了“真理”。
案例二:關(guān)系顯示化。
bad case:請(qǐng)介紹幾種降低通訊延時(shí)的方法。
軟件?硬件?哪個(gè)領(lǐng)域?這樣的提示詞,未必能夠找到正確的專家子節(jié)點(diǎn)。
better case:請(qǐng)介紹幾種互聯(lián)網(wǎng)架構(gòu)中,降低服務(wù)與數(shù)據(jù)庫(kù)通訊延時(shí)的方法。
通過(guò)提示詞告之顯示的關(guān)系:
互聯(lián)網(wǎng)架構(gòu) -> 服務(wù)與數(shù)據(jù)庫(kù) -> 通訊延時(shí)
提升定位專家節(jié)點(diǎn)的效率,快速輸出相關(guān)的知識(shí)。
案例三:領(lǐng)域或者身份顯示化。
上面的case,還可以這么優(yōu)化。
best case:假設(shè)你是由以下專家組成的團(tuán)隊(duì):
- 分布式領(lǐng)域系統(tǒng)架構(gòu)師
- 互聯(lián)網(wǎng)資深網(wǎng)絡(luò)工程師
- 資深DBA
請(qǐng)分別從各自領(lǐng)域提出3種降低服務(wù)與數(shù)據(jù)庫(kù)通訊延時(shí)的方法。
直接定位專家節(jié)點(diǎn),縮短回復(fù)時(shí)間,提升回答質(zhì)量,多個(gè)專家還能夠交叉驗(yàn)證(大而全模型可能過(guò)擬合)。
總結(jié)
- 知識(shí)圖譜是AI的核心技術(shù)(之一),通過(guò)實(shí)體,關(guān)系,屬性組織與描述現(xiàn)實(shí)世界的信息,形成知識(shí);
- 知識(shí)圖譜激活能極大提升AI輸出效率與輸出質(zhì)量;
- 提示詞通過(guò)屬性明確化,關(guān)系顯示化,領(lǐng)域與身份顯示化,能夠最大化發(fā)揮AI的潛力;
一切的一切,提示詞只有適配了AI的認(rèn)知模式,才能最高效的發(fā)揮最大的作用。
知其然,知其所以然。
思路比結(jié)論更重要。
補(bǔ)充閱讀材料:
《知識(shí)圖譜激活》:https://www.clouddatainsights.com/activating-an-active-metadata-knowledge-graph-for-data-management-applications/