譯者 | 李睿
審校 | 重樓
計(jì)劃在組織內(nèi)部引入人工智能/機(jī)器學(xué)習(xí)的產(chǎn)品經(jīng)理通常會(huì)提出這樣一個(gè)問題:“我從哪里開始著手?”對(duì)于缺乏該領(lǐng)域經(jīng)驗(yàn)的組織來說,深入研究人工智能/機(jī)器學(xué)習(xí)可能會(huì)讓人感到不知所措。構(gòu)建機(jī)器學(xué)習(xí)產(chǎn)品需要不同類型的技能和流程,而這些技能和流程需要逐步被吸納并融入組織的日常運(yùn)作中。
事實(shí)表明,成功的關(guān)鍵在于從小處著手,并且需要具有戰(zhàn)略眼光。組織啟用首個(gè)人工智能/機(jī)器學(xué)習(xí)項(xiàng)目的目標(biāo)是,在不會(huì)造成太多干擾的情況下,使組織逐步熟悉并接納機(jī)器學(xué)習(xí)技術(shù)。這可以幫助組織建立必要的基礎(chǔ)設(shè)施,并為致力成為人工智能/機(jī)器學(xué)習(xí)驅(qū)動(dòng)的組織奠定基礎(chǔ)。
從“容易實(shí)現(xiàn)的目標(biāo)”開始
最好的方法是從“容易實(shí)現(xiàn)的目標(biāo)”開始——這些項(xiàng)目相對(duì)容易實(shí)現(xiàn),但可以提供清晰和可衡量的商業(yè)價(jià)值。
人工智能/機(jī)器學(xué)習(xí)項(xiàng)目中容易實(shí)現(xiàn)的目標(biāo)通常具有以下特征:
- 對(duì)現(xiàn)有工作流程的干擾最小。這些項(xiàng)目可以與組織當(dāng)前的業(yè)務(wù)無縫集成。例如,可以使用機(jī)器學(xué)習(xí)自動(dòng)執(zhí)行通常需要人工完成的多步驟任務(wù)的一個(gè)階段。
- 明確的成功指標(biāo),便于從一開始就衡量結(jié)果。例如,它可以是每項(xiàng)任務(wù)節(jié)省的時(shí)間或在特定時(shí)間內(nèi)完成的工作量。
- 快速實(shí)施時(shí)間表,需長時(shí)間等待就能看到價(jià)值。得益于生成式人工智能工具,許多原型和概念驗(yàn)證項(xiàng)目的實(shí)施時(shí)間表正在縮短。
組織選擇首個(gè)人工智能/機(jī)器學(xué)習(xí)項(xiàng)目的標(biāo)準(zhǔn)
組織在選擇首個(gè)人工智能/機(jī)器學(xué)習(xí)項(xiàng)目時(shí),需要關(guān)注三個(gè)關(guān)鍵因素:數(shù)據(jù)可用性、流程特征和影響。
1.數(shù)據(jù)可用性
組織可以從已經(jīng)擁有大量數(shù)據(jù)的任務(wù)開始,最好是數(shù)據(jù)倉庫中干凈且結(jié)構(gòu)化的數(shù)據(jù)。如果沒有這樣的數(shù)據(jù),那就尋找擁有大量非結(jié)構(gòu)化文檔的領(lǐng)域,這些文檔具有很大的價(jià)值。在許多情況下,可以從原始文檔中獲得很多價(jià)值,或者用最少的注釋就可以使其準(zhǔn)備就緒。
如果沒有可用的數(shù)據(jù),可以尋找數(shù)據(jù)收集或創(chuàng)建容易且成本低的任務(wù),并且最好由小團(tuán)隊(duì)執(zhí)行。確保計(jì)劃使用的數(shù)據(jù)符合隱私和監(jiān)管標(biāo)準(zhǔn)。
2.流程特征
尋找涉及大量人工工作且過于復(fù)雜以至于無法通過基于規(guī)則的簡單方法實(shí)現(xiàn)自動(dòng)化的流程。如果這是一項(xiàng)重復(fù)但人工難以編碼的任務(wù),那么這是一個(gè)很好的跡象,表明它可以從人工智能中受益。具有明確的輸入輸出關(guān)系和可預(yù)測(cè)模式的任務(wù)是機(jī)器學(xué)習(xí)的理想選擇。
此外,還要嘗試選擇一個(gè)對(duì)其他系統(tǒng)或團(tuán)隊(duì)的依賴最小的項(xiàng)目,這樣組織就可以控制流程并快速交付結(jié)果。為了降低入門門檻,可以選擇無需完全自動(dòng)化即可改進(jìn)的任務(wù)。例如,即使機(jī)器學(xué)習(xí)模型只能將任務(wù)速度提高10%~15%,也可能為組織帶來巨大的價(jià)值。
3.影響
在理想情況下,人工智能/機(jī)器學(xué)習(xí)項(xiàng)目應(yīng)該通過節(jié)省成本或提高效率來交付可量化的投資回報(bào)率(ROI)。但是組織啟用首個(gè)項(xiàng)目的重點(diǎn)應(yīng)該是熟悉構(gòu)建機(jī)器學(xué)習(xí)產(chǎn)品的過程。采用機(jī)器學(xué)習(xí)需要許多支持功能,例如建立數(shù)據(jù)管道和模型服務(wù)平臺(tái)、性能監(jiān)控和模型再訓(xùn)練。在采用大型人工智能/機(jī)器學(xué)習(xí)項(xiàng)目之前,一個(gè)小項(xiàng)目可以幫助組織逐步試驗(yàn)和構(gòu)建這些部分。
人工智能/機(jī)器學(xué)習(xí)項(xiàng)目的實(shí)際示例
以下是許多組織首次嘗試機(jī)器學(xué)習(xí)時(shí)成功實(shí)施的人工智能/機(jī)器學(xué)習(xí)項(xiàng)目的兩個(gè)實(shí)際示例。
1.客戶支持票據(jù)分類
對(duì)于在線服務(wù)大量客戶的組織來說,這通常是一個(gè)很好的項(xiàng)目,因?yàn)榭赡芤呀?jīng)有數(shù)千張票據(jù)來訓(xùn)練其模型。此外,票據(jù)通常有很多非結(jié)構(gòu)化的文本,無法通過基于規(guī)則的方法進(jìn)行分類,這使得它們適用于機(jī)器學(xué)習(xí)。
處理票據(jù)需要閱讀許多內(nèi)容,這可能會(huì)花費(fèi)很多時(shí)間。機(jī)器學(xué)習(xí)可以節(jié)省大量時(shí)間。票據(jù)分類是簡單的第一步,可以快速實(shí)現(xiàn)并集成到現(xiàn)有的工作流程中,而不會(huì)中斷它們??蛻舴?wù)人員可以逐步地將機(jī)器學(xué)習(xí)系統(tǒng)納入他們的工作流程,建立信任,并提供有助于改進(jìn)底層模型的反饋。
得益于大型語言模型(LLM),票據(jù)分類可以很容易地實(shí)現(xiàn),而不需要訓(xùn)練自己的模型。組織可以使用少量帶注釋的示例獲得良好的結(jié)果,并且隨著收集到更多數(shù)據(jù),可以逐步提高模型性能。一旦擁有足夠多的示例,最終可以為該任務(wù)訓(xùn)練專用模型。此外,LLM還可以幫助生成其他見解,例如行動(dòng)項(xiàng)目和摘要。
同樣的流程可以應(yīng)用于任何其他需要文檔分類的任務(wù),例如電子郵件、合同、簡歷等。
2.文檔處理/數(shù)據(jù)提取
合同、發(fā)票和采購訂單等文檔采用不同的格式,無法使用基于規(guī)則的方法輕松處理。如果組織處理大量這樣的文檔,那么從其中提取信息可能是一個(gè)很好的起點(diǎn),可以凸顯機(jī)器學(xué)習(xí)在組織中的價(jià)值。
創(chuàng)建用于提取文檔數(shù)據(jù)的機(jī)器學(xué)習(xí)系統(tǒng)非常容易,特別是對(duì)于LLM來說。與前面的示例一樣,可以輕松地創(chuàng)建一個(gè)具有幾個(gè)文檔和預(yù)期結(jié)果的工作系統(tǒng)。組織還可以設(shè)計(jì)提示,以獲得可以輕松輸入到下游系統(tǒng)的格式化輸出。
此外,可以從小處開始,只指示模型提取非?;镜男畔ⅲ瑥亩層脩粲懈鄷r(shí)間處理更復(fù)雜的任務(wù)。該模型可以輕松監(jiān)控,并與現(xiàn)有流程進(jìn)行驗(yàn)證。隨著收集到更多數(shù)據(jù),可以逐步將更多工作負(fù)載轉(zhuǎn)移到模型上,包括對(duì)文檔內(nèi)容進(jìn)行推理和總結(jié)。
實(shí)施文檔提取系統(tǒng)并將其集成到現(xiàn)有工具中將會(huì)十分簡單。投資回報(bào)率(ROI)清晰明確,用戶將立即看到減少人工輸入的好處,這將有助于獲得利益相關(guān)者對(duì)未來機(jī)器學(xué)習(xí)項(xiàng)目的支持。
需要注意的是,組織啟用的首個(gè)人工智能項(xiàng)目/機(jī)器學(xué)習(xí)的目標(biāo)不是在一夜之間改變自己的業(yè)務(wù),而是證明機(jī)器學(xué)習(xí)在組織中的價(jià)值,并為未來的計(jì)劃提供動(dòng)力。因此,組織可以從小處著手,專注于快速的成功,并在這一基礎(chǔ)上不斷發(fā)展。
原文標(biāo)題:How to start with machine learning in your organization,作者:Ben Dickson