自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

1688 AI導(dǎo)購(gòu)探索:智能體驅(qū)動(dòng)的場(chǎng)景化導(dǎo)購(gòu)實(shí)踐分享

人工智能
本文將分享淘天集團(tuán) 1688 事業(yè)部團(tuán)隊(duì)過(guò)去一年多在 AI+ 導(dǎo)購(gòu)領(lǐng)域的一些探索和實(shí)踐,即智能體驅(qū)動(dòng)的場(chǎng)景化導(dǎo)購(gòu)。

一、場(chǎng)景化導(dǎo)購(gòu)背景

1. 為什么要做場(chǎng)景化導(dǎo)購(gòu)

為什么要做場(chǎng)景化導(dǎo)購(gòu)?通常,用戶訪問(wèn)電商平臺(tái)時(shí)帶有明確的需求。他們會(huì)通過(guò)搜索、瀏覽推薦等方式尋找相關(guān)商品,隨后進(jìn)行篩選決策,最終完成交易和履約。在這一過(guò)程中,尋找和篩選階段構(gòu)成了導(dǎo)購(gòu)環(huán)節(jié)。

當(dāng)前電商平臺(tái)存在幾個(gè)問(wèn)題:

  • 消費(fèi)群體差異化需求未得到充分識(shí)別。不同消費(fèi)群體在訪問(wèn)電商平臺(tái)時(shí),其關(guān)注點(diǎn)存在顯著差異,但平臺(tái)未能有效區(qū)分。例如,育兒群體可能對(duì)促銷和價(jià)格優(yōu)惠特別敏感,平臺(tái)應(yīng)針對(duì)性地提供更有效的展示和提醒。
  • 商品篩選階段信息繁雜、效率低下?,F(xiàn)有電商平臺(tái)上信息種類繁多,包括各種優(yōu)惠政策、服務(wù)條款以及用戶評(píng)價(jià)等。然而,這些信息往往散落在圖片、文字等不同載體中,導(dǎo)致用戶難以快速獲取對(duì)自身有價(jià)值的信息。
  • 難以滿足非標(biāo)準(zhǔn)化購(gòu)物行為。例如,當(dāng)用戶搜索服裝后希望進(jìn)行更多個(gè)性化篩選時(shí),平臺(tái)往往只能提供標(biāo)準(zhǔn)化、被動(dòng)式的導(dǎo)購(gòu)流程,如選擇配送地址、篩選包郵商品或選擇尺碼等。這種扁平化的體驗(yàn)難以滿足用戶的多樣化需求。我們希望中心貨架平臺(tái)能從扁平化體驗(yàn)走向垂直化、主動(dòng)式的體驗(yàn),這是我們做智能體驅(qū)動(dòng)場(chǎng)景化導(dǎo)購(gòu)的出發(fā)點(diǎn)和初衷。

2. 什么是場(chǎng)景化導(dǎo)購(gòu)

場(chǎng)景化導(dǎo)購(gòu)可以通過(guò)三個(gè)關(guān)鍵詞來(lái)概括:貼切、沉浸和信任。

  • 貼切:針對(duì)特定人群的差異化需求,提供更具針對(duì)性的服務(wù)"界面",即定制化的交互過(guò)程。例如,對(duì)于寶媽群體,平臺(tái)應(yīng)該提供與其相關(guān)的采購(gòu)知識(shí),并根據(jù)不同孕齡階段調(diào)整信息內(nèi)容。此外,平臺(tái)還需要提供豐富的商品輔助信息。
  • 沉浸:提升消費(fèi)者購(gòu)物過(guò)程的便捷性和連貫性,改善當(dāng)前割裂的消費(fèi)體驗(yàn)。目前,消費(fèi)者在瀏覽平臺(tái)上的商品后,往往需要在小紅書(shū)、B站等不同平臺(tái)間切換,以獲取博主評(píng)價(jià)、產(chǎn)品評(píng)測(cè)或優(yōu)惠信息。場(chǎng)景化導(dǎo)購(gòu)旨在整合這些信息,提供一站式的購(gòu)物體驗(yàn)。
  • 信任:幫助消費(fèi)者全面了解商品,增強(qiáng)其決策信心。例如,根據(jù)消費(fèi)者的關(guān)注點(diǎn)(如售后服務(wù)),突出顯示相關(guān)的用戶反饋,如"多位用戶反饋該商家的售后服務(wù)非??煽?。

從人群定制化服務(wù)出發(fā),通過(guò)主動(dòng)引導(dǎo)和互動(dòng)式導(dǎo)購(gòu),為消費(fèi)者提供一個(gè)全面、連貫且值得信賴的購(gòu)物體驗(yàn)。

3. 場(chǎng)景化導(dǎo)購(gòu)智能體框架

產(chǎn)品和技術(shù)層面的場(chǎng)景化導(dǎo)購(gòu)智能體框架主要包含以下幾個(gè)方面:

  • 工具:1688 平臺(tái)擁有豐富的服務(wù)資源,包括商品搜索、圖像搜索、比價(jià)雷達(dá),以及平臺(tái)商品價(jià)格走勢(shì)、物流服務(wù)等一系列原生服務(wù)工具。
  • 買(mǎi)家畫(huà)像:平臺(tái)在用戶采購(gòu)過(guò)程中,會(huì)關(guān)注并分析用戶信息和行為特征,構(gòu)建更細(xì)粒度的畫(huà)像。
  • 意圖理解與過(guò)程把控:系統(tǒng)能夠追蹤并理解用戶的需求意圖。比如,當(dāng)用戶表達(dá)“想要為參加聚會(huì)購(gòu)買(mǎi)合適的衣服搭配”這樣較為復(fù)雜的需求時(shí),系統(tǒng)能夠基于用戶的上下文,將導(dǎo)購(gòu)任務(wù)進(jìn)行合理拆解。
  • AI 場(chǎng)景化導(dǎo)購(gòu)應(yīng)用:包括但不限于 AI 穿搭推薦、AI 商品搜尋、AI 商品分析建議等場(chǎng)景化導(dǎo)購(gòu)智能體。

4. 場(chǎng)景化導(dǎo)購(gòu)智能體的挑戰(zhàn)

場(chǎng)景化導(dǎo)購(gòu)智能體有幾個(gè)挑戰(zhàn)需要去解決:

  • 復(fù)雜意圖理解:在實(shí)際場(chǎng)景中,用戶需求的表達(dá)往往更為復(fù)雜。例如,購(gòu)買(mǎi)連衣裙時(shí),用戶可能會(huì)描述“想買(mǎi)一件適合特定場(chǎng)合穿著的小碎花連衣裙”。這種復(fù)雜的需求描述可能需要通過(guò)與智能體多輪交互對(duì)話來(lái)逐步獲取信息。在此情況下,需要構(gòu)建一個(gè)能夠組織和記憶買(mǎi)家在平臺(tái)上整個(gè)行為的結(jié)構(gòu)化系統(tǒng)。
  • 平臺(tái)原生應(yīng)用的集成與調(diào)用:這包括原生工具與智能體之間的交互和調(diào)用適配,與搜索工具的聯(lián)動(dòng),以及潛在的數(shù)據(jù)分析聯(lián)動(dòng)等。
  • 場(chǎng)景化知識(shí)構(gòu)建與分析:智能體的關(guān)鍵在于數(shù)據(jù)的差異性。1688 導(dǎo)購(gòu)智能體與其他導(dǎo)購(gòu)智能體的區(qū)別并不在于所使用的模型或鏈路,而在于我們擁有獨(dú)特的數(shù)據(jù)資源。這是平臺(tái)沉淀垂直領(lǐng)域智能體的核心價(jià)值。我們已構(gòu)建了自己的知識(shí)體系,包括知識(shí)鏈路以及圖片類多模態(tài)數(shù)據(jù)的處理方法。

二、場(chǎng)景化導(dǎo)購(gòu)智能體實(shí)踐

1. 買(mǎi)家對(duì)話意圖和行為動(dòng)線意圖識(shí)別

對(duì)話消息意圖的識(shí)別,最簡(jiǎn)單的情形是單人消息,例如描述一個(gè)較為復(fù)雜的需求,如為全家聚會(huì)購(gòu)買(mǎi)衣物的要求。在使用大型語(yǔ)言模型進(jìn)行識(shí)別時(shí),通常會(huì)采用結(jié)構(gòu)化的思維鏈(Format Chain of Thought)。這種方法使得模型不必立即輸出結(jié)果,而是先進(jìn)行一段分析以理解用戶意圖,隨后再執(zhí)行相應(yīng)的操作。然而,在很多情況下,與用戶的交互會(huì)涉及多輪對(duì)話。我們需要判斷何時(shí)應(yīng)對(duì)多輪對(duì)話的上下文進(jìn)行壓縮或重寫(xiě),何時(shí)可以保留全部信息。此外,提示詞(Prompt)的描述應(yīng)當(dāng)結(jié)構(gòu)化,一方面是因?yàn)榻Y(jié)構(gòu)化語(yǔ)言在底層描述上具有普遍適用性,另一方面則是由于預(yù)訓(xùn)練階段大量的代碼語(yǔ)料使得大型語(yǔ)言模型能夠更好地理解和處理這種結(jié)構(gòu)性。

在線上環(huán)境中,意圖分析經(jīng)常會(huì)出現(xiàn)錯(cuò)誤。例如,用戶詢問(wèn)關(guān)于尺碼的問(wèn)題,但系統(tǒng)卻將其解讀為關(guān)于材質(zhì)的問(wèn)題。對(duì)于這種情況,需要建立相應(yīng)的反饋機(jī)制。目前的處理方式是將這類案例存儲(chǔ)在錯(cuò)誤庫(kù)中。有了錯(cuò)誤庫(kù)之后,整個(gè)流程就遵循檢索增強(qiáng)生成(Retrieval-Augmented Generation)的邏輯,即在接收到問(wèn)題后,需要補(bǔ)充知識(shí)內(nèi)容以構(gòu)建一個(gè)信息量更豐富的上下文。

除了消息類的意圖識(shí)別,我們還在探索在客戶端上分析用戶行為軌跡意圖的可行性,并進(jìn)一步引導(dǎo)輔助決策。這就需要將一個(gè)相對(duì)小型的模型集成到客戶端上。我們嘗試了從幾十兆字節(jié)到幾百兆字節(jié)不等的模型,盡管仍面臨不少挑戰(zhàn),但這種邊緣智能的解決方案不僅能適應(yīng)實(shí)時(shí)反饋的場(chǎng)景,還能充分利用邊緣計(jì)算能力來(lái)優(yōu)化產(chǎn)品體驗(yàn),同時(shí)對(duì)用戶數(shù)據(jù)的隱私保護(hù)更為友好。

圖片

2. 計(jì)劃式學(xué)習(xí)-用小模型追蹤對(duì)齊任務(wù)狀態(tài)

當(dāng)大型語(yǔ)言模型剛剛問(wèn)世時(shí),業(yè)界鮮有團(tuán)隊(duì)著手研究計(jì)劃式學(xué)習(xí),即利用小型模型在 Agent 架構(gòu)中承擔(dān)規(guī)劃任務(wù)。所謂計(jì)劃式學(xué)習(xí),可以以購(gòu)買(mǎi)手機(jī)支架為例進(jìn)行闡釋:模型應(yīng)具備任務(wù)識(shí)別能力,為完成購(gòu)買(mǎi)手機(jī)支架的目標(biāo),需制定商品搜索計(jì)劃。該計(jì)劃的主題是手機(jī)這一商品類別,對(duì)此需要收集相關(guān)信息(如預(yù)算和品牌等)。為了完成這一計(jì)劃,模型需要向用戶提問(wèn),例如詢問(wèn)預(yù)算。若用戶回答"100 元左右",部分信息便得到更新。隨后,模型繼續(xù)詢問(wèn)品牌偏好等問(wèn)題。信息收集完畢后,模型將生成一個(gè)查詢語(yǔ)句,如"100 元左右的任意品牌手機(jī)支架",然后執(zhí)行商品搜索操作并返回結(jié)果。

在計(jì)劃式學(xué)習(xí)的指令微調(diào)(SFT)階段,我們采用了對(duì)話式訓(xùn)練模式,即構(gòu)造多輪交互式指令以激發(fā)基礎(chǔ)模型對(duì)任務(wù)形態(tài)的理解。SFT 完成后,還可通過(guò)進(jìn)一步對(duì)齊來(lái)提高模型的追蹤準(zhǔn)確性。追蹤準(zhǔn)確性指的是模型在詢問(wèn)完預(yù)算后是否會(huì)繼續(xù)詢問(wèn)品牌,而非生成無(wú)關(guān)內(nèi)容。這種能力難以僅通過(guò) SFT 培養(yǎng),需要通過(guò)對(duì)齊訓(xùn)練來(lái)強(qiáng)化模型的內(nèi)在結(jié)構(gòu)性約束。

我們進(jìn)行了對(duì)比實(shí)驗(yàn),在 Bloom 1.5B 基礎(chǔ)模型上,經(jīng)過(guò)強(qiáng)化學(xué)習(xí)對(duì)齊后,其信息追蹤準(zhǔn)確性提高了 5 個(gè)百分點(diǎn)。許多普遍的對(duì)齊實(shí)現(xiàn),通常不是對(duì)整個(gè)序列進(jìn)行評(píng)分和約束,而是僅對(duì)最后一個(gè) token 進(jìn)行約束。在我們的場(chǎng)景中,除了最后一個(gè) token 外,我們還利用第一個(gè) token 來(lái)提高意圖識(shí)別的準(zhǔn)確性。

圖片

3. 場(chǎng)景離線知識(shí)和實(shí)時(shí)知識(shí)

知識(shí)是智能體系的核心,主要包含兩個(gè)部分:其一為離線知識(shí)庫(kù),涵蓋商品信息等百科知識(shí)以及外部知識(shí)的綜合;其二為實(shí)時(shí)場(chǎng)景化知識(shí)。由于諸多商品信息具有實(shí)時(shí)性,如價(jià)格波動(dòng)和優(yōu)惠變化等,因此部分信息需支持在線調(diào)用。同理,我們通過(guò)結(jié)構(gòu)化的思維鏈(Format COT)來(lái)控制檢索增強(qiáng)生成(RAG)的過(guò)程,以提高準(zhǔn)確性。輸出流程包括四個(gè)步驟:首先生成分析結(jié)果(Thought),其次得出結(jié)論(Conclusion),再進(jìn)行校驗(yàn)(Rethink),最后實(shí)施風(fēng)格控制輸出。

圖片

4. Format-COT 的 RAG 生成控制

什么是 Format-COT 的 RAG 生成控制?從結(jié)構(gòu)化角度而言,通常建議采用 XML 格式,因?yàn)?XML 具有較強(qiáng)的通用性,有利于模型的識(shí)別和處理。例如,在商品信息(offer info)中,需要找出支持問(wèn)題(question)部分的相關(guān)信息,進(jìn)行分析,然后按照指定的輸出格式(output format)來(lái)生成回答。

商品信息 RAG 召回的內(nèi)容包括商品標(biāo)題以及通過(guò)多模態(tài)處理得到的圖像到文本的離線數(shù)據(jù)。將這些信息整合后,首先進(jìn)行初步分析(thought),然后得出結(jié)論(conclusion)。但是,結(jié)論不能直接輸出,還需要進(jìn)行重新思考(rethink)。在提示詞(prompt)層面也可以控制幻覺(jué)現(xiàn)象,這里需要生成一些額外內(nèi)容來(lái)進(jìn)行控制,評(píng)估置信度的高低,最后再通過(guò)一些風(fēng)格控制來(lái)形成最終輸出。

例如,在用戶詢問(wèn)商品尺寸的場(chǎng)景下,結(jié)論部分不應(yīng)直接輸出所有規(guī)格尺寸的描述給用戶,因?yàn)樵诒磉_(dá)規(guī)則(express rule)部分會(huì)有相應(yīng)的約束。當(dāng)尺碼類信息較多時(shí),最好再添加一些風(fēng)格和格式約束,以進(jìn)一步控制其表達(dá)方式,確保輸出給用戶的信息簡(jiǎn)潔明了。

圖片

5. 復(fù)雜需求描述 & 商品搜索

在探討如何實(shí)現(xiàn) AI 原生聯(lián)動(dòng)搜索時(shí),不妨以一個(gè)具體場(chǎng)景為例:假設(shè)用戶需要尋找一件適合周末聚會(huì)穿著的連衣裙,且預(yù)算控制在 200 元以內(nèi)。這類復(fù)雜需求在當(dāng)前電商搜索系統(tǒng)中往往難以精準(zhǔn)匹配理想商品。然而,借助大型語(yǔ)言模型(LLM)的能力,我們可以構(gòu)建更智能的搜索流程。首先,LLM 會(huì)對(duì)用戶需求進(jìn)行深入分析,識(shí)別出關(guān)鍵要素,如“周末連衣裙”或“晚宴連衣裙”等類別,并提取隱含的需求參數(shù)。隨后,模型將生成相應(yīng)的商品 Query,用于進(jìn)行初步召回。在得到相關(guān)商品列表后,系統(tǒng)會(huì)進(jìn)行匹配過(guò)濾,剔除不符合要求的商品。最后,LLM 會(huì)對(duì)篩選后的結(jié)果進(jìn)行整合,生成一體化的輸出。

圖片

(1)需求解析和語(yǔ)義商品召回

需求解析是指用戶提出需求后,如何調(diào)用相應(yīng)工具的過(guò)程;而商品召回則是指根據(jù)給定的商品 Query 召回相關(guān)商品的過(guò)程。當(dāng)一個(gè)需求到來(lái)時(shí),大型語(yǔ)言模型會(huì)通過(guò) COT 引導(dǎo),生成潛在的搜索引擎習(xí)慣的商品 Query(通常電商搜索引擎對(duì)形容詞加名詞品類描述的查詢支持較好)。接下來(lái)是 RAG 的借鑒。由于不同搜索引擎支持的參數(shù)各異,需要根據(jù)配置文檔,讓模型借鑒知識(shí),從需求中提取適當(dāng)?shù)膮?shù)。比如“200 元以下”的價(jià)格限制,以及默認(rèn)的“包郵”等參數(shù),隨后調(diào)用搜索工具。

在獲取大量商品后,需進(jìn)行匹配和排序。我們使用 M3E 模型對(duì)商品信息和用戶需求進(jìn)行向量化,這構(gòu)成了基礎(chǔ)召回部分。如果缺乏資源或語(yǔ)料來(lái)訓(xùn)練大規(guī)模垂直領(lǐng)域表征模型,可以先嘗試使用通用的 M3E 或 BGE 嵌入。在信息明確的情況下,這些通用語(yǔ)義表征的噪聲通常不會(huì)過(guò)大。然而,向量召回的語(yǔ)義漂移問(wèn)題是需要關(guān)注的。例如,"婚禮連衣裙"可能被誤認(rèn)為"時(shí)尚連衣裙"而被召回。因此,需要第二個(gè)模塊,即使用傳統(tǒng)的深度學(xué)習(xí)模型(e.g. RoBERTa)進(jìn)行相關(guān)性打分。這類模型通過(guò)標(biāo)題和相應(yīng)的人工構(gòu)造查詢進(jìn)行訓(xùn)練。目前,更重的 LLM 重排方案也可考慮,但需要根據(jù)系統(tǒng)和場(chǎng)景實(shí)際評(píng)估。

圖片

(2)ReACT 的搜索優(yōu)化

下一階段是 ReACT 的搜索優(yōu)化。需求解析后會(huì)產(chǎn)生多個(gè)查詢,其中一些長(zhǎng)尾查詢難以召回商品,甚至可能出現(xiàn)空召回的情況。因此,需要根據(jù)這一反饋信號(hào)對(duì)查詢進(jìn)行改寫(xiě),并進(jìn)行二次嘗試。這個(gè)過(guò)程實(shí)質(zhì)上是通過(guò)結(jié)果對(duì)輸入進(jìn)行修正的逐步優(yōu)化收斂,而這種鏈路的實(shí)現(xiàn)只有在大型語(yǔ)言模型的驅(qū)動(dòng)下才成為可能。當(dāng)然,最終還需要施加規(guī)則約束,以防止過(guò)多的嘗試次數(shù)。理論上,所有能夠提供反饋信號(hào)的工具調(diào)用都可以通過(guò) ReACT 的過(guò)程來(lái)進(jìn)行優(yōu)化。然而,目前在效率方面仍然存在一些待解決的問(wèn)題。就電子商務(wù)搜索而言,供給側(cè)本身也會(huì)參與鏈路的聯(lián)動(dòng)優(yōu)化。ReACT 或者說(shuō)通過(guò)結(jié)果反饋來(lái)優(yōu)化收斂的模式,可能會(huì)為我們打開(kāi)更廣闊的想象空間。

圖片

6. 多模態(tài)商品信息分析

在電子商務(wù)領(lǐng)域,大量商品信息以圖片形式呈現(xiàn)。對(duì)于這部分信息的處理,主要有兩種邏輯:一種是在線構(gòu)建圖文混合的多模態(tài)知識(shí)庫(kù),然后進(jìn)行多模態(tài)的檢索增強(qiáng)生成(RAG);另一種是離線將信息統(tǒng)一處理成結(jié)構(gòu)化的文本知識(shí)。我們?cè)趯?shí)踐中選擇了后者。前者存在幾個(gè)問(wèn)題:首先,多模態(tài)大模型的推理能力尚不夠強(qiáng);其次,這種方式會(huì)顯著增加系統(tǒng)鏈路的復(fù)雜度。本文將從一個(gè)視角闡述當(dāng)前多模態(tài)大模型在推理方面的局限性。目前,主流的多模態(tài)架構(gòu)分為兩類:圖文編碼分離和圖文編碼統(tǒng)一。使用第一種架構(gòu)時(shí),多模態(tài)的感知(視覺(jué)編碼)和多模態(tài)的推理(模態(tài)橋接到 LLM)在某種程度上是分離的,模態(tài)橋接后段并未能在預(yù)訓(xùn)練中實(shí)現(xiàn)規(guī)?;╯caling),天然形成了推理效果瓶頸。對(duì)于第二種統(tǒng)一架構(gòu),以 GPT-4o 為代表,目前在多模態(tài)數(shù)據(jù)層面的規(guī)模法則(scaling law)似乎還不夠顯著,其在圖像理解和推理方面相比文本處理仍有不小差距。

因此,我們目前更傾向于信任多模態(tài)模型的感知能力。我們會(huì)將商品詳情圖中的文字信息提取出來(lái),構(gòu)建結(jié)構(gòu)化的文本知識(shí)。純文本大模型在理解這些信息方面表現(xiàn)更為出色。在這個(gè)過(guò)程中,我們還會(huì)進(jìn)行評(píng)測(cè),判斷是否可能產(chǎn)生幻覺(jué)。最終,我們將所有信息整合成統(tǒng)一的文本商品知識(shí),用于整體的商品信息分析或?qū)з?gòu)過(guò)程。從長(zhǎng)遠(yuǎn)來(lái)看,端到端的多模態(tài) RAG 能處理更豐富的場(chǎng)景,信息損失程度也會(huì)更低,但這有賴于多模態(tài)大模型的進(jìn)一步發(fā)展。

圖片

7. AI + 效果評(píng)測(cè)

所有上述工作完成后,還需對(duì)大模型的通用輸出進(jìn)行評(píng)測(cè)。這部分任務(wù)無(wú)法像標(biāo)準(zhǔn)輸出任務(wù)那樣提供測(cè)試集,而外包標(biāo)注從時(shí)間和成本角度考慮都相對(duì)較高,難以作為日常頻繁的評(píng)測(cè)環(huán)節(jié)。因此,自然而然地想到是否可以利用大模型來(lái)進(jìn)行評(píng)測(cè)。運(yùn)用大模型進(jìn)行評(píng)測(cè)時(shí),需要明確定義評(píng)測(cè)維度和目標(biāo)等方面,以構(gòu)造相應(yīng)的提示引導(dǎo)。例如,針對(duì)賣(mài)點(diǎn)生成任務(wù)的評(píng)測(cè),需要考察其準(zhǔn)確性、賣(mài)點(diǎn)生成的邏輯性,以及最基本的不涉及色情暴力等風(fēng)險(xiǎn)問(wèn)題。對(duì)于大模型生成的評(píng)測(cè)結(jié)果,可以通過(guò)人工抽樣分析,以驗(yàn)證評(píng)測(cè)結(jié)果的正確性。我們還研究了通過(guò)微調(diào)小規(guī)模模型來(lái)對(duì)大模型生成的任務(wù)結(jié)果進(jìn)行更低資源成本評(píng)測(cè)的可行性。從部分實(shí)驗(yàn)數(shù)據(jù)來(lái)看,這種方法顯示出一定的效果。然而,在實(shí)際應(yīng)用中存在較大局限性,因?yàn)闊o(wú)論是數(shù)據(jù)還是數(shù)據(jù)格式都與任務(wù)高耦合,這意味著難以實(shí)現(xiàn)通用化。

三、場(chǎng)景化導(dǎo)購(gòu)案例

1. AI 智能找挑輔助

打開(kāi) 1688 應(yīng)用程序后,進(jìn)入任意商品的詳情頁(yè)面,例如某款女裝連衣裙的詳情頁(yè)。當(dāng)您詢問(wèn)關(guān)于這些商品的采購(gòu)建議、質(zhì)量評(píng)估或賣(mài)點(diǎn)等問(wèn)題時(shí),系統(tǒng)會(huì)根據(jù)您的人群屬性(如都市女白領(lǐng)、程序員、全職媽媽等),給出針對(duì)性的回答,并為您總結(jié)最有價(jià)值的商品評(píng)價(jià)內(nèi)容。

圖片

同時(shí),在著裝搭配方面,如果您是女性用戶,想要購(gòu)買(mǎi)一件適合晚間約會(huì)的連衣裙,系統(tǒng)可以為您提供穿搭建議以增添魅力。我們會(huì)通過(guò)夸克搜索引擎獲取相關(guān)信息,然后利用大型語(yǔ)言模型進(jìn)行分析,確定最適合約會(huì)場(chǎng)合的風(fēng)格。隨后,系統(tǒng)會(huì)為您推薦一套完整的穿搭方案,這背后是有專業(yè)知識(shí)支撐的,例如襯衫與高跟鞋或耳環(huán)的搭配。當(dāng)您面臨兩件連衣裙的選擇困難時(shí),系統(tǒng)可以提供商品對(duì)比功能。它會(huì)告訴您哪件更適合您,同時(shí)考慮性價(jià)比因素。如果您繼續(xù)詢問(wèn)是否有同款推薦,系統(tǒng)會(huì)執(zhí)行兩個(gè)步驟:首先從上下文中識(shí)別目標(biāo)商品,然后通過(guò)圖像搜索找出相似款式。若您在推薦需求中表達(dá)了更多具體選擇信息,系統(tǒng)也會(huì)相應(yīng)地進(jìn)行精確篩選操作。

圖片

2. smart shopping

我們還嘗試了一個(gè)更加端到端的 AI + 電商搜索 demo,叫做 smart shopping,它能夠提供一種更加整體化的 AI + 找挑體驗(yàn)路徑。例如,當(dāng)您需要尋找春季流行服飾時(shí),系統(tǒng)會(huì)主動(dòng)訪問(wèn)一個(gè)趨勢(shì)分析的服務(wù)來(lái)獲得相關(guān)數(shù)據(jù),并緊接著生成一份采購(gòu)建議。完成這一步驟后,系統(tǒng)開(kāi)始調(diào)用平臺(tái)的商品搜索獲取候選商品并根據(jù)前面的需求、知識(shí)進(jìn)行深度選品分析。最終會(huì)向用戶呈現(xiàn)一個(gè)包含三件商品的采購(gòu)方案。方案中詳細(xì)說(shuō)明了每件商品適合您的理由,這些理由是伴隨整個(gè)信息流程產(chǎn)生的,而非與搜索過(guò)程割裂。

圖片

3. 原生導(dǎo)購(gòu)鏈路全域 tips

我們也嘗試在 APP 的更多地方,通過(guò)一些方式提醒用戶下一步要怎么做,比如用哪一張優(yōu)惠券更劃算,夏天到了需要去采購(gòu)一些什么東西,整個(gè)過(guò)程當(dāng)中會(huì)有更強(qiáng)的引導(dǎo)。

四、未來(lái) AI 導(dǎo)購(gòu)的一些隨想

商品信息分發(fā)將向采購(gòu)解決方案分發(fā)的方向演進(jìn)。目前,電商平臺(tái)會(huì)為用戶推薦或搜索商品,這是非常淺層且零碎的信息化連接。我們期望能夠提供一個(gè)更完整的解決方案直面用戶。打個(gè)比方,就像一位值得信賴的主播在為用戶指引,用戶之所以買(mǎi)單,本質(zhì)還是基于長(zhǎng)期采購(gòu)結(jié)果反饋而形成的信任機(jī)制。我們必然不可能真的成為主播或 mcn,但供應(yīng)鏈和前場(chǎng)的定制化分析對(duì)接是能產(chǎn)品化的。

從被動(dòng)式應(yīng)答轉(zhuǎn)向主動(dòng)式問(wèn)題解決。被動(dòng)式應(yīng)答模式需要用戶逐步推動(dòng),例如用戶輸入特定衣物的需求及條件,系統(tǒng)隨后根據(jù)輸入提供檢索結(jié)果。未來(lái),我們希望能夠主動(dòng)幫助用戶收斂需求,從而提升整體購(gòu)物體驗(yàn)。

從“大家的 1688”蛻變?yōu)椤澳愕?1688”。當(dāng)前電商平臺(tái)的千人千面很大程度上仍停留在短期、淺層的偏好迎合,比如用戶購(gòu)買(mǎi)了帽子后繼續(xù)推薦帽子。雖然某些采購(gòu)場(chǎng)景可能樂(lè)見(jiàn),但這顯然不是真正個(gè)性體驗(yàn)。我們對(duì)未來(lái)的期望是,電商平臺(tái)能夠?qū)γ课挥脩粜纬缮钊肭议L(zhǎng)效的理解。例如,對(duì)于一位新晉寶媽,平臺(tái)應(yīng)該圍繞其未來(lái)一年與嬰兒相關(guān)的采購(gòu)需求提供定制服務(wù)。不單是垂直,而是往陪伴的邏輯上走,真正的長(zhǎng)生成周期服務(wù)貼合。

最后歡迎大家下載 1688 的 APP,去體驗(yàn)我們的 AI 采購(gòu)助手。

五、Q&A

Q1:計(jì)劃式學(xué)習(xí)那里沒(méi)有 RAG?

A1:它是在用戶要買(mǎi)手機(jī)支架的前提下猜出來(lái)去問(wèn)預(yù)算和品牌,如果要買(mǎi)一張椅子,它會(huì)去問(wèn)材質(zhì)和可能長(zhǎng)寬高,基礎(chǔ)大模型本身蘊(yùn)含的知識(shí)會(huì)讓他在 0-shot 的時(shí)候想到一些可能的商品-屬性關(guān)聯(lián),當(dāng)然微調(diào)指令中提及的關(guān)聯(lián)多少也會(huì)影響到。這個(gè)框架本身是可以配合 RAG 的,當(dāng)開(kāi)啟某類商品的采買(mǎi),例如手機(jī)支架,第一步就是做一個(gè)知識(shí)庫(kù)的 function-call,從知識(shí)庫(kù)把手機(jī)支架采買(mǎi)需要引導(dǎo)詢問(wèn)的關(guān)鍵屬性放進(jìn)一個(gè)結(jié)構(gòu)性上下文中。從這里也可以看出,這個(gè)模型起到的作用是一個(gè) planning 的角色,在整個(gè) Agent 系統(tǒng)中做好調(diào)度。在實(shí)際落地中,對(duì) planning 的理解和推理都有很大的挑戰(zhàn),尤其是復(fù)雜場(chǎng)景中,這個(gè) bloom 1.5B 上的實(shí)驗(yàn)只是說(shuō)明了一種訓(xùn)練的可行性,以及這種方式在特定垂直場(chǎng)景下能以低資源看到的一些效果邊界,實(shí)際情況中,需要根據(jù)場(chǎng)景作出調(diào)整。

Q2:商品召回的時(shí)候怎么判斷 query 和商品 match?

A2:用商品的標(biāo)題匹配是不是 match,這個(gè)時(shí)候用 embedding 去做召回的時(shí)候,它會(huì)有漂移,就是有可能它不是一個(gè)時(shí)尚休閑連衣裙,而是一件婚禮連衣裙,它的 embedding 可能會(huì)很接近,這個(gè)時(shí)候需要有個(gè)監(jiān)督模型在后面來(lái)判斷 true or false,即這個(gè) query 和商品是不是匹配?這個(gè)模型是要訓(xùn)練的,要構(gòu)造一些 query 和 title 的關(guān)系對(duì),生成的 query 和商品的 title 過(guò)濾掉那些閾值比較低的候選。但這套方案是建立在一個(gè)理想的假設(shè)上,就是商品的標(biāo)題是反映真實(shí)信息的且描述了商品真實(shí)要點(diǎn),這屬于供給側(cè)信息的問(wèn)題,我們目前也遇到一些挑戰(zhàn)。

Q3:怎么保證整個(gè)鏈路準(zhǔn)確?

A3:我們通過(guò) COT 的邏輯,盡可能讓它先分析一下,生成對(duì)應(yīng)的 advice, advice 里面本身會(huì)有一些上下文來(lái)保證生成商品詞是盡可能跟需求比較相關(guān)的,有了這個(gè)過(guò)程相對(duì)來(lái)說(shuō)它的幻覺(jué)會(huì)弱一點(diǎn),但是如果一定要解決,讓它生成的 query 絕對(duì)滿足用戶的描述,那指標(biāo)是很難絕對(duì)被量化的,原因有些時(shí)候它的 query 是開(kāi)放式的,只能通過(guò)后面鏈路去慢慢調(diào)整它,甚至多輪對(duì)話再去調(diào)整它。它本身整個(gè)就是 pipeline 的,不是端到端的,所以其實(shí)很難保證每個(gè)環(huán)節(jié)沒(méi)有噪音,每個(gè)地方的噪音都會(huì)累積下來(lái)。比如匹配模型不太準(zhǔn),把一些錯(cuò)誤的商品放進(jìn)來(lái)了,后面還會(huì)有大模型來(lái)做篩選哪些是適合的商品,它大概會(huì)幫你過(guò)濾出來(lái)。

Q4:AI 導(dǎo)購(gòu)助手上線的時(shí)候有沒(méi)有業(yè)務(wù)指標(biāo)評(píng)測(cè),比如銷量或者轉(zhuǎn)化率?以及有沒(méi)有做過(guò) AB test?

A4:我們現(xiàn)在大概整個(gè)灰度的用戶量就幾萬(wàn),其實(shí)很少,它現(xiàn)在沒(méi)有轉(zhuǎn)化價(jià)值,但是值不值得去做這件事情?從第一性原理去出發(fā),它是解決用戶問(wèn)題的,從產(chǎn)品邏輯上面來(lái)看,它確實(shí)是一種更好的體驗(yàn)方向。所以我們現(xiàn)在不會(huì)嚴(yán)格去監(jiān)測(cè)所謂的轉(zhuǎn)化率,因?yàn)檗D(zhuǎn)化率太深了,大概率沒(méi)有那么優(yōu)秀,肯定在首頁(yè)去優(yōu)化 CTR 更好一些。我們會(huì)去監(jiān)測(cè) AI 助手用戶的使用輪次,用戶進(jìn)來(lái)之后有沒(méi)有意愿長(zhǎng)期地溝通下去?或者對(duì)于一些特定問(wèn)題,用戶點(diǎn)贊、點(diǎn)踩,通過(guò)這種方式去分析用戶對(duì)產(chǎn)品的認(rèn)同度。先不關(guān)注電商平臺(tái)的所謂轉(zhuǎn)化指標(biāo),而是先回歸到一個(gè)產(chǎn)品去看它的功能有效性、完整性和用戶的體驗(yàn)反饋。

責(zé)任編輯:姜華 來(lái)源: DataFunTalk
相關(guān)推薦

2011-08-30 22:59:31

一體機(jī)導(dǎo)購(gòu)

2011-05-05 09:50:24

噴墨打印機(jī)導(dǎo)購(gòu)

2025-04-07 02:00:00

2019-12-12 14:30:15

智能一點(diǎn)智能導(dǎo)購(gòu)對(duì)話機(jī)器人

2012-04-19 15:09:04

打印機(jī)推薦

2012-11-02 12:50:12

一體機(jī)

2009-02-21 11:35:27

路由器中小網(wǎng)絡(luò)模塊化

2012-03-28 11:21:13

復(fù)合一體機(jī)導(dǎo)購(gòu)

2009-08-23 15:06:29

2009-04-03 09:53:00

交換機(jī)無(wú)線產(chǎn)品導(dǎo)購(gòu)

2012-04-20 10:20:56

復(fù)合一體機(jī)導(dǎo)購(gòu)指南

2009-02-20 16:33:35

2023-09-20 15:22:17

人工智能數(shù)據(jù)

2010-01-26 13:37:41

全千兆交換機(jī)

2013-03-26 15:39:01

口袋小秘書(shū)微信微信公眾平臺(tái)

2009-02-24 09:31:00

2009-02-21 11:13:42

2011-09-19 14:13:40

投影儀行情

2012-02-06 20:36:53

復(fù)合一體機(jī)導(dǎo)購(gòu)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)