自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

LinkedIn在利用大型語言模型服務(wù)十億用戶中的收獲

人工智能
在2023年夏天,當(dāng)GenAI的興趣首次高漲時,LinkedIn開始考慮是否利用大型語言模型(LLMs)來匹配候選人與雇主,以及使信息流更加有用會更好。

LinkedIn 在全球擁有超過10億用戶,不斷挑戰(zhàn)當(dāng)今企業(yè)技術(shù)的極限。很少有公司能夠像LinkedIn那樣運營,或者擁有類似的大量數(shù)據(jù)資源。

對這個專注于商業(yè)和就業(yè)的社交媒體平臺來說,將合格的候選人與潛在雇主連接起來,幫助填補職位空缺是其核心業(yè)務(wù)。同樣重要的是確保平臺上的帖子反饋與消費者的需求相關(guān)。在LinkedIn的規(guī)模下,這些匹配過程一直依賴于技術(shù)。

在2023年夏天,當(dāng)GenAI的興趣首次高漲時,LinkedIn開始考慮是否利用大型語言模型(LLMs)來匹配候選人與雇主,以及使信息流更加有用會更好。

因此,這家社交媒體巨頭開啟了一段GenAI的旅程,并現(xiàn)在正在報告其利用Microsoft的Azure OpenAI服務(wù)的經(jīng)驗成果。各行各業(yè)的CIOs都可以從LinkedIn在此過程中學(xué)到的一兩點經(jīng)驗。

起伏跌宕

正如大多數(shù)CIO所經(jīng)歷的那樣,采用新興技術(shù)伴隨著試驗和挫折。LinkedIn的情況也不例外,據(jù)該公司的首席軟件工程師及技術(shù)負(fù)責(zé)人Juan Bottaro所說,其走向LLM洞察的道路一點也不平坦。

Bottaro表示,最初的成果“感覺不夠完善”,“連接的點還不夠多。”

圍繞GenAI的首波炒作并沒有幫助。

“LLM是新事物,感覺它能解決所有問題,”Bottaro說?!拔覀冮_始時對LLM能做什么并沒有一個非常清晰的概念?!?/p>

例如,早期版本的改進(jìn)型職位匹配工作可以說是相當(dāng)?shù)模靡粋€不太恰當(dāng)?shù)脑~來說,粗魯?;蛘咧辽龠^于直白。

“點擊‘評估我是否適合這份工作’后得到‘你完全不適合’并不實用,”Bottaro說。“我們希望[回應(yīng)]既事實準(zhǔn)確,同時也要有同理心。有些會員可能正在考慮轉(zhuǎn)行到他們目前并不十分適合的領(lǐng)域,需要幫助了解差距和下一步該怎么做?!?/p>

因此,LinkedIn初步學(xué)到的一個重要經(jīng)驗是調(diào)整LLM以滿足觀眾的期望——并幫助LLM理解如何以一種或許不是人類,但至少是人性化的方式來回應(yīng)。

速度問題

盡管LinkedIn擁有超過十億會員,依靠LinkedIn的LLM工作的大部分求職功能最初是針對高級會員的,這是一個相對較小的群體。(LinkedIn拒絕透露其擁有多少高級會員。)

在如此大的規(guī)模運作時,速度是至關(guān)重要的,特別是在與相關(guān)職位匹配候選人這樣細(xì)致的事務(wù)上。這里,人們認(rèn)為LLM會有所幫助,因為LLM的一個經(jīng)常被提及的優(yōu)點是其速度,使它們能夠迅速完成復(fù)雜的步驟。但Bottaro表示,LinkedIn的部署并非如此。

“我不會說LLM很快。我不認(rèn)為速度是一個優(yōu)勢,”他說。

速度可以有多種定義。雖然在操作上LLM可能沒有像希望的那樣快,但Bottaro表示整體部署過程的加速令人震驚。“這項新技術(shù)的超能力在于你可以非??焖俚貏?chuàng)建原型,大約在兩到三個月之間。在這項技術(shù)出現(xiàn)之前,這是不可能的,”他說。

當(dāng)被問及如果沒有LLM,項目的各個方面需要多久時,Bottaro表示有些可能根本無法完成,而其他元素“可能需要幾年時間?!?/p>

作為一個例子,Bottaro提到了旨在理解意圖的系統(tǒng)部分。沒有LLM,這可能需要兩到三個月,但LLM在“不到一周”的時間內(nèi)就掌握了它。

成本考慮

Bottaro稱之為“障礙”的一個方面是成本。同樣,成本在項目的不同階段意味著不同的東西,正如LinkedIn的經(jīng)驗所示。

“我們用于開發(fā)的金額微不足道,”Bottaro說。但當(dāng)涉及到向LinkedIn的客戶提供數(shù)據(jù)時,成本激增。

“即便只是針對幾百萬會員,”Bottaro說,這可能暗示了高級會員的數(shù)量,價格也飆升了。這是因為LLM的定價——至少是LinkedIn與Microsoft(其LLM提供商及母公司)達(dá)成的許可協(xié)議——是基于使用量的,具體來說是輸入和輸出令牌的使用量。

一位AI供應(yīng)商的首席執(zhí)行官Tarun Thummala在一篇與此項目無關(guān)的LinkedIn帖子中解釋說,LLM的輸入和輸出令牌大約相當(dāng)于0.75個單詞。LLM供應(yīng)商通常按成千上萬或成百萬賣令牌。例如,LinkedIn使用的Azure OpenAI在美國東部地區(qū)收費標(biāo)準(zhǔn)為每100萬個8K GPT-4輸入令牌30美元,每100萬個8K GPT-4輸出令牌60美元。

評估挑戰(zhàn)

LinkedIn為其項目設(shè)定的另一個功能目標(biāo)是自動評估。LLM在準(zhǔn)確性、相關(guān)性、安全性和其他關(guān)注點方面的評估一直是個挑戰(zhàn)。領(lǐng)先的組織和LLM制造商一直在嘗試自動化一些工作,但據(jù)LinkedIn稱,這種能力“仍然是在進(jìn)行中”。

沒有自動化評估,LinkedIn報告稱“工程師們只能靠目測結(jié)果,并在有限的樣本集上進(jìn)行測試,且通常會有超過1天的延遲才能知道指標(biāo)?!?/p>

該公司正在構(gòu)建基于模型的評估器,以幫助估計關(guān)鍵的LLM指標(biāo),如整體質(zhì)量得分、幻覺率、連貫性和負(fù)責(zé)任的AI違規(guī)情況。這樣做將能夠加快實驗的速度,公司的工程師說,盡管LinkedIn的工程師在幻覺檢測方面取得了一些成功,但他們還沒有完成該領(lǐng)域的工作。

數(shù)據(jù)質(zhì)量

LinkedIn在其職位匹配努力中遇到的部分挑戰(zhàn)歸結(jié)為雙方的數(shù)據(jù)質(zhì)量問題:雇主和潛在雇員。

LLM只能使用提供給它的數(shù)據(jù),有時候職位發(fā)布并不精確或全面地說明雇主所尋求的技能。另一方面,一些求職者發(fā)布的簡歷表述不佳,無法有效反映他們在解決問題等方面的豐富經(jīng)驗。

在這方面,Bottaro看到了LLM幫助雇主和潛在雇員的潛力。通過改善雇主和LinkedIn用戶的書寫,雙方都能受益,因為公司的職位匹配LLM在數(shù)據(jù)輸入質(zhì)量更高時能夠更有效地工作。

用戶體驗

在處理如此龐大的會員基礎(chǔ)時,準(zhǔn)確性和相關(guān)性指標(biāo)可能“給人一種虛假的安慰感,”Bottaro說。例如,如果LLM“90%的時間都做得對,這意味著十分之一的人會有糟糕的體驗,”他說。

使這種部署更加困難的是,提供有用、有幫助且準(zhǔn)確答案所涉及的極端細(xì)微差別和判斷。

“你如何定義什么是好的,什么是壞的?我們花了很多時間與語言學(xué)家一起制定關(guān)于如何提供全面代表性的指導(dǎo)。我們也做了很多用戶研究,”Bottaro說。“你如何訓(xùn)練人們撰寫正確的回應(yīng)?你如何定義任務(wù),規(guī)定回應(yīng)應(yīng)該是什么樣的?產(chǎn)品可能試圖建設(shè)性或有幫助。它不試圖假設(shè)太多,因為那是幻覺開始的地方。我們對回應(yīng)的一致性感到非常自豪?!?/p>

實時運營

LinkedIn龐大的規(guī)模為職位匹配帶來了另一個挑戰(zhàn)。在擁有十億會員的情況下,一個職位廣告在發(fā)布幾分鐘內(nèi)可能會收到數(shù)百甚至數(shù)千個應(yīng)聘回應(yīng)。如果看到已經(jīng)有數(shù)百人申請,許多求職者可能就不會再費心申請了。這就要求LLM非常迅速地找到匹配的會員,在資質(zhì)較低的申請者提交材料之前做出反應(yīng)。之后,會員是否看到通知并及時做出反應(yīng)仍然是一個問題。

在雇主方面,挑戰(zhàn)在于找到最合適的應(yīng)聘者——不一定是反應(yīng)最快的人。一些公司不愿公布薪資范圍,這進(jìn)一步復(fù)雜化了雙方的努力,因為最合格的應(yīng)聘者可能對職位的薪酬不感興趣。這是一個LLM無法解決的問題。

API和RAG

LinkedIn龐大的數(shù)據(jù)庫包含了關(guān)于個人、雇主、技能和課程的許多獨特信息,但其LLM尚未接受過這些數(shù)據(jù)的培訓(xùn)。因此,根據(jù)LinkedIn工程師的說法,它們目前無法使用這些資產(chǎn)進(jìn)行任何推理或生成響應(yīng)的活動,因為這些資產(chǎn)是如何存儲和提供的。

在這里,檢索增強生成(RAG)是一個典型的解決方案。通過建立內(nèi)部API的管道,企業(yè)可以用額外的上下文“增強”LLM提示,以更好地指導(dǎo)和限制LLM的響應(yīng)。LinkedIn的大部分?jǐn)?shù)據(jù)通過RPC API公開,公司的工程師說這“方便人類以編程方式調(diào)用”,但“對LLM并不友好”。

為了解決這個問題,LinkedIn的工程師圍繞其API“封裝了技能”,給它們提供了一個“對LLM友好的API功能描述以及何時使用它”,以及配置細(xì)節(jié)、輸入和輸出架構(gòu)以及將每個API的LLM版本映射到其底層(實際)RPC版本所需的所有邏輯。

LinkedIn的工程師在一份聲明中寫道:“像這樣的技能使LLM能夠執(zhí)行與我們產(chǎn)品相關(guān)的各種操作,如查看個人資料、搜索文章/人員/職位/公司,甚至查詢內(nèi)部分析系統(tǒng)。”他們還提到,“同樣的技術(shù)也用于調(diào)用非LinkedIn的API,如Bing搜索和新聞?!边@種方法不僅提高了LLM的功能性,還增強了其與現(xiàn)有技術(shù)基礎(chǔ)設(shè)施的整合能力,使得LLM能夠更廣泛地應(yīng)用于企業(yè)的各個方面。

責(zé)任編輯:姜華 來源: 企業(yè)網(wǎng)D1Net
相關(guān)推薦

2023-06-09 08:00:00

QLoRa語言模型微調(diào)

2024-06-13 10:52:43

2025-01-15 07:52:53

2021-10-25 16:25:07

模型人工智能計算

2024-04-16 16:14:01

人工智能LLMRAG

2023-06-02 15:47:49

2023-06-19 16:05:22

大型語言模型人工智能

2024-08-13 08:09:34

2024-12-12 09:11:58

2011-09-29 13:52:57

服務(wù)器HPC浪潮TS850

2023-11-24 14:05:00

AI訓(xùn)練

2023-07-10 08:00:00

2024-11-21 08:22:45

2024-07-10 11:38:15

2023-10-08 15:54:12

2024-05-16 16:37:33

大型語言模型人工智能

2024-12-23 08:03:13

2024-01-19 13:27:51

語言模型LLM

2021-06-30 14:02:21

黑客LinkedIn網(wǎng)絡(luò)攻擊

2022-09-16 07:23:24

人工智能自然語言系統(tǒng)
點贊
收藏

51CTO技術(shù)棧公眾號