自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

電商知識(shí)圖譜建設(shè)及大模型應(yīng)用探索

人工智能 知識(shí)圖譜
本文將分享 Shopee 在電商知識(shí)圖譜構(gòu)建,以及與大模型結(jié)合方面的探索。對(duì)于電商平臺(tái)本身而言,通過電商知識(shí)圖譜可以降低運(yùn)營(yíng)成本。

一、電商知識(shí)圖譜概覽

圖片

對(duì)于任何電商平臺(tái)而言,商品都是至關(guān)重要的元素,它連接著買家和賣家。針對(duì)買家、賣家和電商平臺(tái)這三個(gè)角色,我們需要解決以下問題:

  • 首先,買家和賣家的表達(dá)習(xí)慣不同,如何高效地匹配買家的購買意圖與賣家的商品信息,促成交易轉(zhuǎn)化?
  • 其次,不同賣家間存在語言表達(dá)習(xí)慣差異,例如新手和成熟賣家的區(qū)別,本地賣家和跨境賣家的區(qū)別等,如何統(tǒng)一管理平臺(tái)上的商品,消除差異化?
  • 另外,對(duì)于跨境電商平臺(tái),比如 Shopee,面臨著跨越不同市場(chǎng)和語言的挑戰(zhàn),如何對(duì)齊不同市場(chǎng)的商品,實(shí)現(xiàn)高效管理?

圖片

解決這些問題,我們可以采用多種方法,其中深度學(xué)習(xí)和大模型是其中的佼佼者,具有明顯優(yōu)勢(shì),能在許多任務(wù)上取得顯著效果,并具有較強(qiáng)的泛化能力。然而,深度學(xué)習(xí)和大模型的缺點(diǎn)也顯而易見,缺乏直觀的可解釋性,需要大量標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,并且需要強(qiáng)大的計(jì)算資源支持,同時(shí)大模型還存在幻覺問題。

相比之下,知識(shí)圖譜的優(yōu)點(diǎn)也很清晰,它可以將異構(gòu)數(shù)據(jù)源轉(zhuǎn)化為結(jié)構(gòu)化知識(shí),易于處理。通常,知識(shí)圖譜由三個(gè)元素構(gòu)成:實(shí)體、關(guān)系和屬性,并通過實(shí)體-關(guān)系-實(shí)體的方式表達(dá)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系。得益于這種清晰的數(shù)據(jù)表達(dá)方式,知識(shí)圖譜的可解釋性更強(qiáng)。但知識(shí)圖譜也存在一些缺點(diǎn),比如構(gòu)建難度較大,且泛化能力相對(duì)有限,需要強(qiáng)大的推理能力或人工輸入才能構(gòu)建企業(yè)所需的泛化能力。

圖片

目前而言,知識(shí)圖譜尚無法完全被深度學(xué)習(xí)或大型模型所替代。因?yàn)樗鶐淼膬?yōu)勢(shì)能為買家、賣家和電商平臺(tái)帶來諸多好處。統(tǒng)一的商品知識(shí)圖譜,能夠高效提升用戶體驗(yàn),例如進(jìn)行同款商品的橫向比較,進(jìn)行不同商品在相同維度上的對(duì)比,以及挖掘多種維度的商品信息等等。

對(duì)于賣家而言,可以通過知識(shí)圖譜優(yōu)化其管理邏輯,比如對(duì)于同一店鋪內(nèi)商品進(jìn)行去重和質(zhì)量?jī)?yōu)化等。同時(shí),對(duì)于同市場(chǎng)內(nèi)的同款商品,可以為賣家提供優(yōu)化建議,提升其商品競(jìng)爭(zhēng)力。還可以為同市場(chǎng)內(nèi)不同商品補(bǔ)足提供及時(shí)的提醒。對(duì)于跨境電商平臺(tái),可以幫助賣家及時(shí)輸出跨市場(chǎng)的爆品商品。

對(duì)于電商平臺(tái)本身而言,通過電商知識(shí)圖譜可以降低運(yùn)營(yíng)成本。例如,通過商品聚合管理可以大大降低管理維度,進(jìn)行跨市場(chǎng)商品對(duì)比和輸出,以及進(jìn)行同類或跨類別商品的效率分析,從而幫助平臺(tái)進(jìn)行品類上新和招商等活動(dòng)。

圖片

上圖展示了電商知識(shí)圖譜的基本形態(tài),我們可以觀察到,其中的信息是有很多維度、多層級(jí),并且是跨多個(gè)信息源的。舉例來說,賣家信息會(huì)補(bǔ)充商品基礎(chǔ)內(nèi)容以外的信息,比如優(yōu)惠券、付款方式以及發(fā)貨地等等。這些因素都在一定程度上影響著買家是否能夠完成購買轉(zhuǎn)化。通過這些圖譜,我們能夠有效地進(jìn)行連接和關(guān)系推理。

接下來,將介紹知識(shí)圖譜構(gòu)建的基本方法。

二、電商知識(shí)圖譜構(gòu)建

1. 電商知識(shí)圖譜構(gòu)建難點(diǎn)

圖片

電商領(lǐng)域構(gòu)建知識(shí)圖譜面臨的主要挑戰(zhàn)包括:

  • 首先是信息多元。信息來自多個(gè)來源,包括買家和賣家等。在某些情況下,商品本身的信息可能不完整,但我們可以從買家的評(píng)論中提取出有效的補(bǔ)充信息,以彌補(bǔ)這些缺失。另外,信息的表達(dá)方式也是多樣的。例如,在上圖的例子中,“ready stock”這個(gè)詞是東南亞市場(chǎng)經(jīng)常使用的表達(dá)方式,但在其他市場(chǎng)可能并不適用,比如拉美市場(chǎng)。
  • 第二是質(zhì)量參差不齊。比如,在這個(gè)例子中,賣家在標(biāo)題中輸入的品牌信息“Sumsung”實(shí)際上是錯(cuò)誤的。這種拼寫錯(cuò)誤、信息錯(cuò)誤、冗余或缺失在電商平臺(tái)上非常常見。
  • 第三是依賴領(lǐng)域知識(shí)。對(duì)于某些品類的商品,需要依賴領(lǐng)域知識(shí)來判斷其準(zhǔn)確性。例如,在摩托車這個(gè)品類中,“50CC”對(duì)于不太了解該領(lǐng)域的人來說并不明確,他們可能無法確定它指的是某個(gè)型號(hào)還是排量。因此,需要領(lǐng)域信息來幫助我們進(jìn)行驗(yàn)證。
  • 最后是數(shù)據(jù)量大。以 Shopee 為例,我們擁有數(shù)十億種商品,涵蓋了 8 個(gè)市場(chǎng),使用了 6 種語言。如何將如此龐大的信息融合構(gòu)建成一個(gè)統(tǒng)一的知識(shí)圖譜,是一個(gè)巨大的挑戰(zhàn)。

2. 電商知識(shí)圖譜基本框架

圖片

電商領(lǐng)域構(gòu)建知識(shí)圖譜的基本框架都是從數(shù)據(jù)源出發(fā),可能是同構(gòu)信息,也可能是異構(gòu)信息。第一步是進(jìn)行信息抽取,然后進(jìn)行知識(shí)的融合,最后進(jìn)行知識(shí)的加工。在此不詳細(xì)展開每一步驟的各個(gè)環(huán)節(jié),僅針對(duì)其中的一些難點(diǎn)介紹我們對(duì)應(yīng)的解決方案。

3. 電商知識(shí)圖譜構(gòu)建方法

(1)數(shù)據(jù)源

圖片

首先,讓我們對(duì)齊一下信息源的名稱。上圖展示的是一個(gè)商品的詳情頁,其中包含了標(biāo)題、圖片、variation(也就是可以選擇每個(gè)具體的 SKU 的部分)、結(jié)構(gòu)化的商品詳情,free-text 的商品描述,以及買家填寫的評(píng)論信息。

(2)信息抽取

圖片

在進(jìn)行信息抽取之前,我們想強(qiáng)調(diào)一點(diǎn),對(duì)于電商平臺(tái)來說,一個(gè)重要的基石就是進(jìn)行 Ontology 的定義和結(jié)構(gòu)化。為什么這么重要呢?因?yàn)樯唐沸畔⒎浅XS富,我們并不需要抽取所有的信息內(nèi)容,很多時(shí)候只需要抽取對(duì)我們的實(shí)際應(yīng)用和業(yè)務(wù)訴求有影響的關(guān)鍵信息就足夠了。

構(gòu)建方法基本上可以分為兩大類:一是通過領(lǐng)域?qū)<抑R(shí)進(jìn)行構(gòu)建,二是通過數(shù)據(jù)進(jìn)行主動(dòng)挖掘。第一種方法需要大量人力,我們最近也在研究如何通過數(shù)據(jù)主動(dòng)挖掘,發(fā)現(xiàn)一些未知的本體形式和結(jié)構(gòu)。

以 Shopee 為例,我們的 Ontology 結(jié)構(gòu)主要分為兩層:

  • 第一層是基礎(chǔ)定義層,包括一些基礎(chǔ)的元素,如類別和屬性。類別又分為多個(gè)層級(jí),從 L1 到 L5,屬性也包括關(guān)鍵屬性和銷售屬性,這些都與實(shí)際業(yè)務(wù)場(chǎng)景密切相關(guān)。
  • 在基礎(chǔ)定義層的基礎(chǔ)上,我們可以根據(jù)這些基礎(chǔ)元素進(jìn)行排列組合,形成組合定義層,例如場(chǎng)景、標(biāo)簽、標(biāo)品等。對(duì)于像春日露營(yíng)這樣的場(chǎng)景,通常我們會(huì)跨越多個(gè)類目進(jìn)行組合。對(duì)于“戶外防水裝備”這個(gè)標(biāo)簽,則戶外運(yùn)動(dòng)類別商品具備防水屬性才符合要求。對(duì)于標(biāo)品,定義會(huì)相對(duì)嚴(yán)格,需要完全符合一些類目或?qū)傩缘亩x,才能稱之為同一個(gè)標(biāo)品。

圖片

下面介紹信息抽取中的難點(diǎn)以及相應(yīng)的解決方案。

以類目信息提取為例,我們的輸入信息基本上就是商品,包含圖片和標(biāo)題。了解了這個(gè)信息源之后,我們就可以清楚地了解到,信息質(zhì)量參差不齊。例如,在第一個(gè)商品例子中,從圖片很難分辨出要銷售的商品主體,因?yàn)楸尘班须s。但是通過商品的其它圖片,通過一些質(zhì)量較高的、能夠突出反映要銷售的商品主體的圖片,可以發(fā)現(xiàn)要賣的商品是鼠標(biāo)墊。針對(duì)這種情況,我們可以在多個(gè)信息輸入源中篩選出更高質(zhì)量的信息,再作為模型的輸入,效果會(huì)更好。

其次,信息還可能模糊或不完整。例如,右邊的例子中,單看圖片可能會(huì)認(rèn)為是一個(gè)樂器架子鼓,但實(shí)際上在標(biāo)題中會(huì)發(fā)現(xiàn)它是兒童樂器玩具,應(yīng)屬于兒童玩具類目,而不是樂器類目,這是一個(gè)較大的差異。

同時(shí),對(duì)于跨境電商平臺(tái)來說,多語言適配也是非常重要的。像 code switch 在我們的場(chǎng)景下是非常常見的。

圖片

針對(duì)信息參差不齊的情況,我們有針對(duì)性地對(duì)文本和圖片信息分別進(jìn)行了質(zhì)量評(píng)估。例如,對(duì)于文本,我們采用了多種方法。首先是一些簡(jiǎn)單的基于規(guī)則的方法,憑借先驗(yàn)知識(shí)來判斷,比如標(biāo)題過短或過長(zhǎng)的商品信息質(zhì)量通常不會(huì)很高。除此之外,我們還訓(xùn)練了許多模型來判斷文本的質(zhì)量,比如一些多任務(wù)模型,輸入是商品標(biāo)題,一方面可以對(duì)文本進(jìn)行分類,另一方面可以抽取標(biāo)題中的關(guān)鍵詞。一個(gè)重要的假設(shè)是,高質(zhì)量的關(guān)鍵詞(通常是一些品類詞)或標(biāo)題,它們所對(duì)應(yīng)的類別輸出應(yīng)該是一致的。基于這一假設(shè),我們構(gòu)建了一個(gè)多任務(wù)模型進(jìn)行學(xué)習(xí)。整合文本各維度評(píng)估,從而得到文本質(zhì)量評(píng)分。

另一方面,我們也對(duì)圖片質(zhì)量進(jìn)行評(píng)估,考慮因素包括像素、是否包含多個(gè)實(shí)體、是否包含文字信息、背景是否嘈雜等等。結(jié)合這些信息,可以得到綜合的圖片質(zhì)量評(píng)分。

通過文本和圖片質(zhì)量評(píng)分,我們可以在眾多輸入信息源中篩選出更高質(zhì)量的信息,從而為后續(xù)模型的最終預(yù)測(cè)提供數(shù)據(jù)源的質(zhì)量保障。

圖片

針對(duì)信息模糊或不完整的情況,我們采取的方案是根據(jù)文本和圖片進(jìn)行交叉驗(yàn)證。提到文本和圖片的交叉驗(yàn)證,大家可能會(huì)首先想到多模態(tài)模型,我們也進(jìn)行了許多相關(guān)嘗試。我們微調(diào)了 ALBEF 模型,通過圖像和文本的對(duì)比學(xué)習(xí)結(jié)構(gòu),直接預(yù)測(cè)對(duì)應(yīng)的品類。

我們還重點(diǎn)優(yōu)化了圖像和文本的表示學(xué)習(xí),融入了多語言商品信息,建立了 Labse-DinoV2-Vit 等模型,在一些難以區(qū)分的類目中,效果得到了顯著提升。

圖片

多語言適配方面,我們嘗試了許多語言模型,例如 Labse 結(jié)構(gòu)模型,用來多語言之間信息對(duì)齊,還對(duì)比了編碼器解碼器結(jié)構(gòu)模型,例如 Flan-T5,以及解碼器模型 Llama 系列等,分別在多語言電商商品信息上進(jìn)行微調(diào)。由于這些模型結(jié)構(gòu)本身較大,在實(shí)際的推理過程中需要較快的速度,因此我們也嘗試通過 MiniLM 等方式對(duì)模型進(jìn)行壓縮。

(3)知識(shí)融合

圖片

信息抽取后,下一步是知識(shí)融合,這里的難點(diǎn)是實(shí)體消歧。下面將結(jié)合類目和屬性具體問題來介紹我們的解決方案。

首先,對(duì)于類目而言,輸入是文本和對(duì)應(yīng)的圖片,消歧問題體現(xiàn)在文本和圖片信息之間的一些沖突。以上圖右邊的例子為例,商品圖片質(zhì)量是相對(duì)較高的,然而僅憑圖片難以確定是在賣上衣、短褲還是整套服裝,通過標(biāo)題我們可以明確推斷出是在售賣上衣。因此,我們結(jié)合文本和圖像對(duì)齊的任務(wù),訓(xùn)練了一些模型,其中一個(gè)典型的框架 Blip。我們借助這個(gè)框架,做了一些改進(jìn)。

然而,文本和圖像對(duì)齊任務(wù)需要文本和圖片的語義表達(dá)盡可能匹配,但在電商平臺(tái)應(yīng)用場(chǎng)景中并非總是如此。例如,在上一例子中,圖片中只有上衣部分能與標(biāo)題對(duì)齊,另一方面,標(biāo)題中也會(huì)包含圖片中未顯示的信息,賣家通常會(huì)添加一些圖片中無法表現(xiàn)的屬性信息。因此,這些信息并不是完全對(duì)齊的。

針對(duì)這一領(lǐng)域特定的問題,我們調(diào)整了模型,例如進(jìn)行了文本引導(dǎo)的圖像生成分類,以及圖像引導(dǎo)的文本分類,因?yàn)樗鼈儾⒉皇且粋€(gè)對(duì)稱的關(guān)系。同時(shí)我們還加了對(duì)齊信息的約束,例如不希望發(fā)生顏色匹配但商品卻不匹配的情況,因此限定了圖片中的實(shí)體對(duì)象和文本中的關(guān)鍵商品詞進(jìn)行對(duì)齊匹配。

圖片

此外,在屬性識(shí)別任務(wù)中,實(shí)體消歧也有一些難點(diǎn)。例如,一個(gè)屬性可能存在多個(gè)屬性值,比如顏色屬性在標(biāo)題中抽取到的顏色是紅色,但在描述中抽取出的顏色是黑色,哪一個(gè)是正確的呢,還是它們需要結(jié)合起來使用?另一個(gè)例子是,多個(gè)屬性抽取到相同的屬性值,例如顏色和材質(zhì)同時(shí)抽取到了“gold”,那么兩者都正確嗎,還是只適用于其中一個(gè)?還有某些屬性值可能跨越不同屬性,例如在標(biāo)題中抽取到的顏色是“red”,但在品牌中又抽取到了“red mi”,這時(shí)“red”既涉及到顏色屬性,又涉及到品牌屬性。

針對(duì)這些問題,我們嘗試了一些解決方案。首先,我們搭建了常用 NER 模型,例如 BERT NER,用于屬性提取。隨著大型模型的發(fā)展,我們也利用了生成式模型的能力,嘗試主動(dòng)生成屬性值,以期提高效果。我們?cè)?T5 模型基礎(chǔ)上,結(jié)合電商領(lǐng)域?qū)傩猿槿〉娜蝿?wù)特性,用 prompt tuning 的方法訓(xùn)練了模型。我們驚喜地發(fā)現(xiàn),在一些難以處理的、容易產(chǎn)生歧義的案例中,準(zhǔn)確率有了顯著提升。

圖片

知識(shí)融合的另一個(gè)難題是實(shí)體對(duì)齊。以屬性為例,在實(shí)體對(duì)齊中涉及多種類型。我們的目標(biāo)是對(duì)齊同一屬性值的不同表達(dá)方式。對(duì)于拼寫錯(cuò)誤的問題,可以通過編輯距離、語義相似度、常見錯(cuò)誤集合等方法處理。對(duì)于不同語言的問題,可以使用多語言嵌入相似度和模型翻譯等方法解決。同義詞和近義詞的區(qū)分可能會(huì)有一些困難,因此我們借鑒了 Labse 模型框架,訓(xùn)練了一個(gè)同義詞模型。重點(diǎn)區(qū)分詞形相似但語義差別很大,以及不同詞形但語義相近的情況。還有不同單位的情況。例如,一個(gè)人可能用"50cm",另一個(gè)人用"0.5m",我們針對(duì)這種情況進(jìn)行了單位轉(zhuǎn)換計(jì)算等處理。

當(dāng)對(duì)齊這些詞后會(huì)發(fā)現(xiàn)同一屬性詞可能有很多選項(xiàng)。在眾多選項(xiàng)中,我們需要選擇一個(gè)標(biāo)準(zhǔn)詞來代表相同的含義。選擇標(biāo)準(zhǔn)詞的標(biāo)準(zhǔn)有很多,比如流行度,即哪些詞的使用頻率最高。然而,流行度并不適用于所有場(chǎng)景。舉例來說,在印尼市場(chǎng)中,錯(cuò)誤拼寫的使用最多,但錯(cuò)誤拼寫并不能在許多情況下準(zhǔn)確表達(dá)商品的含義,因此我們還考慮了其他因素,如困惑度和標(biāo)準(zhǔn)表達(dá)能力,用來更準(zhǔn)確的代表屬性值集合。綜合考慮這些因素,我們訓(xùn)練了一個(gè)模型,選擇相應(yīng)的標(biāo)準(zhǔn)值。

(4)知識(shí)加工

圖片

在知識(shí)加工這一步中,將著重討論信息推理和不一致檢測(cè)。這兩個(gè)任務(wù)之所以被放在一起討論,是因?yàn)樗鼈兤鋵?shí)是相互關(guān)聯(lián)的。通過一些信息,我們可以進(jìn)行推理,同時(shí)我們也可以反向利用推理結(jié)果來校驗(yàn)提取信息的準(zhǔn)確性。如果存在沖突,那么很可能其中一個(gè)任務(wù)出現(xiàn)了錯(cuò)誤,因此這兩個(gè)任務(wù)可以進(jìn)行雙向校驗(yàn)。

在這個(gè)任務(wù)中,仍以屬性為例來介紹相應(yīng)的方法。傳統(tǒng)方法通常使用關(guān)聯(lián)規(guī)則挖掘。例如,在左圖例子中,我們看品牌和型號(hào)之間的關(guān)系,如果提取到一個(gè)商品型號(hào)是 iPhone 15,那我們可以反向推理出對(duì)應(yīng)的品牌一定是蘋果(Apple),這是一種單向推理。但如果我們已經(jīng)知道一個(gè)商品的品牌是小米,而型號(hào)卻是 iPhone 15,那顯然這個(gè)關(guān)系是錯(cuò)誤的,提取結(jié)果是錯(cuò)誤的。

除了傳統(tǒng)方法外,我們還結(jié)合了知識(shí)圖譜嵌入推理的方法。例如,通過歸納推理,可以給定一些頭實(shí)體和它們的描述文本信息,然后預(yù)測(cè)它們與其他實(shí)體之間是否存在某種關(guān)系。通過這種方式可以進(jìn)行信息的補(bǔ)全。

最近,我們還發(fā)現(xiàn)了一些研究是類比推理,即進(jìn)行平行關(guān)系的推演。類比推理可以基于已有節(jié)點(diǎn)之間關(guān)系形態(tài),類比擴(kuò)展到其他節(jié)點(diǎn)之間的相似關(guān)系結(jié)構(gòu)。

歸納推理和類比推理,都可以用于知識(shí)圖譜補(bǔ)全。其中,歸納推理相當(dāng)于從一個(gè)點(diǎn)出發(fā),推理出不同方向的關(guān)系或連接的實(shí)體,可能存在于圖中,也可能不存在。而類比推理則是進(jìn)行平行關(guān)系的推演。它們適用于不同場(chǎng)景下的知識(shí)圖譜補(bǔ)全。在電商領(lǐng)域中,我們經(jīng)常面臨信息不完整的情況,因此進(jìn)行知識(shí)推理和補(bǔ)全尤為重要。

三、電商知識(shí)圖譜應(yīng)用

接下來,介紹知識(shí)圖譜在電商領(lǐng)域中的一些具體應(yīng)用案例。

圖片

首先,知識(shí)圖譜可以有效地與流量側(cè)進(jìn)行結(jié)合。在搜索場(chǎng)景中,以 VLP 場(chǎng)景為例,可以幫助處理查詢,包括識(shí)別商品的特定屬性和標(biāo)簽,然后將這些屬性和標(biāo)簽直接注入到相應(yīng)的索引系統(tǒng)中。當(dāng)出現(xiàn)相關(guān)查詢并解析出對(duì)應(yīng)的屬性和標(biāo)簽時(shí),就可以進(jìn)行高效的屬性和標(biāo)簽對(duì)齊。通過這種方式,幫助搜索系統(tǒng)補(bǔ)充召回了大量相關(guān)數(shù)據(jù),同時(shí)也提升了排序過程中的相關(guān)性。最終,轉(zhuǎn)化效率也得到了顯著提升。

在推薦場(chǎng)景下,也有多種應(yīng)用。以每日發(fā)現(xiàn)場(chǎng)景為例,在類別基礎(chǔ)之上,我們提供了更細(xì)粒度的品類信息??梢栽谡倩剡^程中補(bǔ)充細(xì)粒度品類召回,同時(shí),在向用戶展示商品時(shí),將相鄰商品的同品類信息進(jìn)行打散,從而增加了用戶看到信息的豐富度。我們發(fā)現(xiàn)用戶的興趣度明顯提升,例如在 impression、點(diǎn)擊率等指標(biāo)中都有明顯的改善。

圖片

除了與流量側(cè)的結(jié)合,我們?cè)谶\(yùn)營(yíng)側(cè)也有許多應(yīng)用案例。例如,與商家系統(tǒng)結(jié)合,通過對(duì)數(shù)據(jù)的分析,針對(duì)類目填寫不正確、屬性填寫不標(biāo)準(zhǔn)等問題,為商家提供優(yōu)化建議和方案。

此外,還與選品系統(tǒng)結(jié)合,為商品打上不同類別、屬性和標(biāo)簽等標(biāo)識(shí)。運(yùn)營(yíng)團(tuán)隊(duì)可以根據(jù)每個(gè)賣場(chǎng)想要表達(dá)的主題,靈活組合他們想要推薦的商品。這樣,選品篩選更加高效,選出的商品也更相關(guān)。

四、知識(shí)圖譜與大模型探索

圖片

最后,來探討一下知識(shí)圖譜與大模型的結(jié)合。

目前有三種主要的結(jié)合方式:第一種是將知識(shí)圖譜作為大模型的輸入;第二種是將大模型作為知識(shí)圖譜的輸入;第三種是雙方進(jìn)行協(xié)同訓(xùn)練。

上圖中展示的結(jié)構(gòu)圖來自一篇整理得非常清晰的調(diào)查報(bào)告,推薦大家閱讀,這里不做贅述。僅分享一個(gè)有趣的發(fā)現(xiàn),在整個(gè)知識(shí)梳理中,我們發(fā)現(xiàn)了一個(gè)比較薄弱的環(huán)節(jié),即知識(shí)圖譜的補(bǔ)全。盡管知識(shí)圖譜補(bǔ)全的機(jī)制在理論上比較容易理解,例如歸納推理和類比推理,但在真實(shí)應(yīng)用中相關(guān)工作和成功案例仍然比較少。

在知識(shí)圖譜構(gòu)建中,一個(gè)重要問題是如何更全面地覆蓋知識(shí)。如何借助大型模型根據(jù)不斷更新的自然知識(shí)來補(bǔ)充知識(shí)圖譜仍然是一個(gè)難題。此外,由于大型模型天然存在一些知識(shí)幻覺的問題,如何自動(dòng)驗(yàn)證補(bǔ)充信息的準(zhǔn)確性也是亟待研究的一個(gè)問題。

圖片

讓我們進(jìn)一步聚焦于電商領(lǐng)域中知識(shí)圖譜與大型模型的結(jié)合方式。之前提到的三種結(jié)合方式在這里都是適用的。除此之外,在電商領(lǐng)域,信息的更新速度非???,每天我們都會(huì)有數(shù)十萬甚至上百萬個(gè)新商品的注入和更新。在這種情況下,如何利用現(xiàn)有技術(shù),例如 RAG,來幫助大型模型和知識(shí)圖譜實(shí)現(xiàn)及時(shí)更新,同時(shí)及時(shí)響應(yīng)實(shí)際應(yīng)用場(chǎng)景,這也是值得研究的一個(gè)重點(diǎn)方向。

在及時(shí)更新的過程中,我們又如何將實(shí)時(shí)發(fā)現(xiàn)的知識(shí)與已有的知識(shí)圖譜進(jìn)行融合和去重,并將其沉淀下來,作為未來的基礎(chǔ)使用,這其中也有很多細(xì)節(jié)值得探討。

此外,推理速度的優(yōu)化,也是一個(gè)老生常談的問題,特別是在實(shí)際應(yīng)用場(chǎng)景中,包括電商平臺(tái)等,大型模型的推理速度往往會(huì)是一個(gè)很大的瓶頸。目前已經(jīng)有很多加速的方式,例如量化、模型壓縮等,在這不做過多展開。

這里分享一篇有趣的研究。該研究并不是關(guān)注于使用什么技術(shù)來壓縮模型或量化推理,而是通過應(yīng)用層面的觀察發(fā)現(xiàn),針對(duì)不同任務(wù),并不一定需要運(yùn)行大型模型的所有層級(jí),對(duì)于一些簡(jiǎn)單任務(wù),可能只需跑完淺層的信息推理即可得出最終結(jié)論,而對(duì)于較難的任務(wù)再適配更多層模型信息。這為我們提供了一個(gè)新思路,在優(yōu)化時(shí)可以考慮結(jié)合不同的應(yīng)用場(chǎng)景進(jìn)行選擇性的適配。

另外,多模態(tài)知識(shí)圖譜也是一個(gè)方向。對(duì)于電商平臺(tái)來說,所有信息源天然都是多模態(tài)的,包括文本、圖片和視頻等。我們可以嘗試高效地將這些不同模態(tài)的信息源融合到知識(shí)圖譜中,并將其整合到更多下游應(yīng)用中。

圖片

從整個(gè)電商平臺(tái)的視角來看,也有很多與大型模型結(jié)合的成功應(yīng)用案例。例如,最近許多平臺(tái)都在嘗試 AI 助手,最初是受搜索平臺(tái)結(jié)合 AI 助手啟發(fā)而來的,通過強(qiáng)大的搜索引擎和建模系統(tǒng)來改變平臺(tái)和賣家之間的互動(dòng)方式。當(dāng)然,這需要經(jīng)過一些實(shí)踐驗(yàn)證,以確保符合用戶的購物習(xí)慣,并根據(jù)反饋進(jìn)行迭代更新。

除此之外,還可以幫助賣家生成 AI 模特圖,從而節(jié)省運(yùn)營(yíng)成本和時(shí)間。還可以通過二維圖像,甚至文字描述,升級(jí)到三維視頻展示,結(jié)合實(shí)際商品的應(yīng)用場(chǎng)景,為賣家創(chuàng)造更直觀的展示效果。

近期,多模態(tài)大語言模型出現(xiàn)了爆發(fā)式增長(zhǎng),如 ChatGPT-4、Gemini、Sora、Claude 3 等,它們提供了強(qiáng)大的多模態(tài)大語言模型能力。這些模型的出現(xiàn)引發(fā)了對(duì)于未來是否能夠?qū)崿F(xiàn)一鍵式商品生成的討論。盡管有許多聲稱是一鍵式商品生成,但實(shí)際上需要賣家進(jìn)行大量手動(dòng)輸入。然而,如果這些模型能夠應(yīng)用到實(shí)際場(chǎng)景中,也許真的只需要賣家上傳一張商品圖片,就可以自動(dòng)生成商品標(biāo)題、描述、高質(zhì)量圖片,甚至視頻等等。這些應(yīng)用場(chǎng)景都具有很大的潛力。

圖片

最后對(duì)本次分享進(jìn)行一下總結(jié)。首先,我們通過電商知識(shí)圖譜概覽,分析了為什么電商平臺(tái)需要知識(shí)圖譜,它可以為賣家、買家和平臺(tái)帶來哪些幫助。接著,依照電商知識(shí)圖譜構(gòu)建的基本流程,針對(duì)其中的難點(diǎn)分享了我們的解決方案。第三部分介紹了實(shí)際的應(yīng)用場(chǎng)景和效果。最后探討了知識(shí)圖譜以及電商平臺(tái)與大模型的結(jié)合。在未來,知識(shí)圖譜加大模型將會(huì)有更廣泛的應(yīng)用場(chǎng)景。

五、問答環(huán)節(jié)

Q1:質(zhì)量分的判斷是用垂直模型嗎?是不是能夠用語言模型呢?

A1:質(zhì)量分的部分可以使用語言模型進(jìn)行判斷。然而,最重要的是明確定義質(zhì)量分所要識(shí)別的內(nèi)容。通過具體任務(wù)定義,語言模型是一種解決方案。

Q2:實(shí)體語義消歧或?qū)嶓w合并有哪些好的方法或建議?比如兩個(gè)不同的地址如何識(shí)別為同一個(gè)地址?

A2:實(shí)體消歧涉及到諸如地址等的關(guān)聯(lián)。建議首先獲取領(lǐng)域知識(shí),并結(jié)合輔助信息進(jìn)行判斷,如物流路徑是否一致、收件人是否集中等。此外,可以通過上下文信息輔助判斷,但準(zhǔn)確性可能受限。

Q3:當(dāng)訓(xùn)練數(shù)據(jù)很少時(shí),大模型在知識(shí)抽取上如何更好地應(yīng)用?

A3:在訓(xùn)練數(shù)據(jù)有限時(shí),可以借助大模型的 prompt 功能,并結(jié)合技術(shù)如 COT,利用少量輸入信息進(jìn)行推理和泛化。

Q4:知識(shí)圖譜給大模型白名單,大模型給知識(shí)圖譜構(gòu)建,有推薦的工具或算法嗎?

A4:目前尚未有統(tǒng)一的工具或算法。研究領(lǐng)域涉及眾多算法和應(yīng)用方式,建議深入研究相關(guān)文獻(xiàn)以獲取更多信息。

Q5:知識(shí)圖譜和電商品分類、商品庫有重復(fù)性,可以直接用商品庫關(guān)聯(lián)大模型嗎?

A5:直接使用商品庫關(guān)聯(lián)大模型可能存在問題,因?yàn)樯唐穾鞌?shù)量龐大,且大模型輸入信息量也較大。需根據(jù)具體場(chǎng)景考慮是否需要全部信息關(guān)聯(lián),可能只需少量輸入即可實(shí)現(xiàn)目的。

以上就是本次分享的內(nèi)容,謝謝大家。

責(zé)任編輯:姜華 來源: DataFunTalk
相關(guān)推薦

2024-02-26 00:00:00

RAG系統(tǒng)圖譜

2018-09-10 15:03:52

電商知識(shí)圖譜

2023-09-27 09:00:00

大型語言模型自然語言處理

2024-02-20 08:17:55

2024-01-29 00:25:59

人工智能結(jié)構(gòu)化編碼

2024-05-16 08:23:26

大語言模型知識(shí)圖譜人工智能

2021-01-18 10:50:29

知識(shí)圖譜人工智能深度學(xué)習(xí)

2021-10-18 11:54:46

2017-03-06 16:48:56

知識(shí)圖譜構(gòu)建存儲(chǔ)

2021-01-19 10:52:15

知識(shí)圖譜

2025-04-27 00:10:00

AI人工智能知識(shí)圖譜

2024-01-02 07:15:59

大模型數(shù)據(jù)庫企業(yè)知識(shí)管家

2012-05-30 09:54:16

產(chǎn)品經(jīng)理

2024-01-09 14:05:15

大型語言模型RAG向量數(shù)據(jù)庫

2023-08-22 15:34:01

Python開發(fā)

2021-01-25 10:36:32

知識(shí)圖譜人工智能

2023-08-17 08:29:22

2024-06-03 07:28:43

2024-09-10 08:42:37

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)