出品 | 51CTO技術(shù)棧(微信號:blog51cto)
如何理解AI代理,它們?nèi)绾喂ぷ鳎?/span>
想象一下開發(fā)一個生成式AI時代的API。這個API將支持自然語言輸入,利用大型語言模型的智能,通過與SaaS和企業(yè)系統(tǒng)的集成來自動化決策,并通過連接到其他生成式AI支持的API來實現(xiàn)業(yè)務(wù)流程編排。
上面就是一種不錯的理解方式。
它們將RAG支持的LLM的推理能力與對上下文業(yè)務(wù)知識的訪問,以及半獨立行動的能力相結(jié)合。與LLM接受自然語言輸入并回答問題不同,AI代理更像是一個真正能完成工作的商業(yè)伙伴。
更高級一點,復(fù)雜的自主代理被設(shè)計為在很大程度上無需人類互動即可工作。由于具有自主性,它們在解釋輸入和采取行動時會面臨更多風(fēng)險。
由于其廣泛的用例以及超出生成式AI的智能信息處理的適用性,人工智能代理引起了商業(yè)界的極大興趣。許多人工智能代理的用例并非遙不可及,而是很可能會給出極大的獲益。
“AI代理已經(jīng)從基于規(guī)則的系統(tǒng)發(fā)展成為能夠進(jìn)行自然語言交互的智能的、由生成式人工智能驅(qū)動的工具?!?/span>
TEKsystems的首席技術(shù)官Ram Palaniappan表示,“它們可以被部署在多種不同的用例中,比如在采購中評估供應(yīng)商和下達(dá)訂單、在客戶支持中進(jìn)行復(fù)雜的故障排除,以及在醫(yī)療保健中提供診斷總結(jié)。那些擁有流程驅(qū)動、人力密集型運營的組織將從可擴(kuò)展性、24×7的可用性和精簡的工作流程中受益?!?/span>
1.人工智能代理與API的區(qū)別
讓我們先從了解AI代理與API和其他網(wǎng)絡(luò)服務(wù)的區(qū)別開始。
AI代理接受自然語言和其他非技術(shù)性輸入,包括那些將接受語音、圖像和視頻的新興人工智能代理。相比之下,API只接受像JSON和XML這樣的系統(tǒng)導(dǎo)向的輸入。
AI代理不是通過編碼的業(yè)務(wù)規(guī)則,而是通過連接到RAG、語言模型和其他生成式人工智能模型來獲取相關(guān)知識。
AI代理可以根據(jù)它們被分配的角色以及它們被定義的不被允許做的事情的界限來推理下一步的行動方案。由于API是基于規(guī)則驅(qū)動的,因此它們需要更多的時間和編程工作來模擬不同的角色、決策和行動。
API和人工智能代理都可以執(zhí)行事務(wù)并與其他服務(wù)進(jìn)行通信。人工智能代理還可以根據(jù)它們的決策采取行動,并向其他人工智能代理發(fā)送自然語言提示。
人工智能代理向人類合作者提供自然語言輸出。非技術(shù)人員可以驗證人工智能代理的理解程度及其行動,因為決策步驟以及與API和其他人工智能代理的連接都以自然語言進(jìn)行了總結(jié)。
“為像客戶服務(wù)這樣的用例構(gòu)建人工智能代理的開發(fā)者應(yīng)該使用自然語言而不是代碼來編碼業(yè)務(wù)邏輯?!盕orethought的聯(lián)合創(chuàng)始人Deon Nicholas說,“他們應(yīng)該讓代理具備與API進(jìn)行通信的能力,就像人類與網(wǎng)站進(jìn)行通信一樣。這將解鎖真正的代理型人工智能,它可以采取行動并解決問題,提供真正的價值?!?/span>
你需要什么樣的人工智能代理?
根據(jù)它們?nèi)绾巫龀鰶Q策和采取行動,人工智能代理有幾種類型?;谀P偷拇碛萌斯ぶ悄苣P秃椭С?jǐn)?shù)據(jù)取代規(guī)則,而基于目標(biāo)和效用的代理會在選擇行動方案之前比較不同的場景。更復(fù)雜的人工智能學(xué)習(xí)代理使用反饋循環(huán)來改進(jìn)結(jié)果,而分層代理則以團(tuán)隊形式工作,以分解復(fù)雜任務(wù)。
你可以將一個API包裝上自然語言界面并稱之為人工智能代理嗎?答案是肯定的;這些是利用規(guī)則將自然語言輸入與行動聯(lián)系起來的簡單反射代理。
2.開發(fā)AI代理的先決條件是什么?
在開發(fā)人工智能代理時,你應(yīng)該了解涉及平臺、數(shù)據(jù)、集成、安全性和合規(guī)性的先決條件。
“人工智能代理的成功需要一個基礎(chǔ)平臺來處理數(shù)據(jù)集成、有效的流程自動化和非結(jié)構(gòu)化數(shù)據(jù)管理?!盩ray.ai的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Rich Waldron說,“人工智能代理可以被架構(gòu)為符合嚴(yán)格的數(shù)據(jù)政策和安全協(xié)議,這使得它們對于IT團(tuán)隊來說是有效的,可以推動生產(chǎn)力的提升,同時確保合規(guī)。”
Enthought的首席運營官Mike Connell說,你需要大量的干凈的(對于某些應(yīng)用來說)標(biāo)記過的數(shù)據(jù),這些數(shù)據(jù)能夠準(zhǔn)確地代表問題領(lǐng)域,以便訓(xùn)練和驗證模型。Connell說:“強(qiáng)大的數(shù)據(jù)管道對于預(yù)處理、轉(zhuǎn)換以及確保實時數(shù)據(jù)流的可用性是必不可少的,以便完善模型并使其保持與不斷變化的世界的校準(zhǔn)。此外,你還應(yīng)該考慮對特定領(lǐng)域的本體論或嵌入的需求,以增強(qiáng)代理的上下文理解和決策能力。”
關(guān)于安全性和合規(guī)性,Immuta的研究副總裁Joseph Regensburger說,人工智能代理擁有身份,因此對復(fù)雜的AI鏈和知識圖譜的訪問需要像對人類一樣進(jìn)行控制。Regensburger建議:“在訪問控制解決方案中捕捉法規(guī)和商業(yè)協(xié)議的頻繁變化,并在所有潛在的人類和機(jī)器行動者上執(zhí)行它們?!备喜粩嘧兓纳虡I(yè)規(guī)則是至關(guān)重要的,以確保人工智能代理不是基于過時的使用協(xié)議開發(fā)的。
3.開發(fā)人工智能代理的技術(shù)和平臺
像Appian、Atlassian、Cisco Webex、Cloudera、Pega、Salesforce、SAP、ServiceNow和Workday這樣的企業(yè)平臺已經(jīng)宣布在其工作流程和用戶體驗中嵌入了AI代理功能。例如,Workday招聘代理幫助人力資源招聘人員尋找和雇傭人才,而Atlassian的AI驅(qū)動的虛擬服務(wù)代理幫助自動化一級支持問題。
一些平臺還具備讓主題專家和非技術(shù)商業(yè)用戶開發(fā)自己的AI代理的能力。Salesforce的Agent Builder允許非技術(shù)用戶創(chuàng)建定制的人工智能代理。用戶描述代理的角色并選擇代表要完成的工作的主題,人工智能將這些映射到可以在平臺上執(zhí)行的活動。其他具有人工智能代理構(gòu)建能力的平臺包括Cisco Webex AI Agent Studio、ServiceNow Agentic AI和Tray.ai Merlin Agent Builder。
AI代理開發(fā)的一個選擇是直接來自平臺供應(yīng)商的服務(wù),它們使用你的數(shù)據(jù)來啟用代理分析,然后提供執(zhí)行事務(wù)的API。第二個選擇是來自低代碼或無代碼、自動化和數(shù)據(jù)結(jié)構(gòu)平臺的通用工具,它們可以提供用于代理開發(fā)的通用工具。
“低代碼和專業(yè)代碼工具將被用來構(gòu)建代理,但低代碼將占主導(dǎo)地位,因為業(yè)務(wù)分析師將被授權(quán)構(gòu)建自己的解決方案?!盋opado的傳道副總裁David Brooks說,“這將通過快速迭代解決關(guān)鍵業(yè)務(wù)需求的代理來惠及業(yè)務(wù)。專業(yè)編碼人員將使用人工智能代理來構(gòu)建提供代理功能的服務(wù)和集成。”
第三個選擇是直接用代碼、人工智能代理構(gòu)建器或LLM應(yīng)用框架來開發(fā)代理。
Aisera的首席執(zhí)行官Abhi Maheshwari說:“你可以用Python或C++等語言原生地構(gòu)建人工智能代理,或者使用像AutoGen、LangGraph或CrewAI這樣的框架,但這些框架可能無法很好地擴(kuò)展,或者沒有足夠的防護(hù)措施。”
你還需要現(xiàn)代化的數(shù)據(jù)基礎(chǔ)設(shè)施,比如數(shù)據(jù)湖或湖倉。數(shù)據(jù)也必須與領(lǐng)域相關(guān),并且“通過像對LLM進(jìn)行微調(diào)或RAG這樣的技術(shù)無縫集成?!?/span>
希望成為開發(fā)人工智能代理的早期采用者的組織可能需要審查他們的數(shù)據(jù)管理平臺、開發(fā)工具和更智能的DevOps流程,以便能夠大規(guī)模地開發(fā)和部署代理。
“為了加速代理開發(fā),公司需要一套強(qiáng)大的工具,使他們能夠設(shè)計、定制、部署和大規(guī)模監(jiān)控代理?!?/span>
IBM的watsonx.ai的產(chǎn)品管理總監(jiān)Maryam Ashoori說,“這包括針對函數(shù)調(diào)用優(yōu)化的模型、用于協(xié)調(diào)代理并將它們與更廣泛的企業(yè)工具集連接起來的中間件、優(yōu)化的運行時、技術(shù)防護(hù)措施以及治理能力,以確保它們按預(yù)期運行。它還將需要能夠滿足廣泛用戶和技能集的工具,從開發(fā)者的專業(yè)代碼工具到商業(yè)用戶的低代碼和無代碼工具,以便將它們嵌入到日常工作中?!?/span>
4.測試AI代理
測試LLM并驗證其準(zhǔn)確性需要人類測試者、自動化和合成數(shù)據(jù)來進(jìn)行基本的準(zhǔn)確性測試,而更復(fù)雜的技術(shù)則利用二級人工智能模型并使用生成對抗網(wǎng)絡(luò)(GAN)來進(jìn)行大規(guī)模測試。
Couchbase的AI、數(shù)據(jù)和分析副總裁兼戰(zhàn)略副總裁Rahul Pradhan說:“通過復(fù)雜的可觀測性工具、反饋循環(huán)和回退機(jī)制進(jìn)行準(zhǔn)確性測試,將幫助組織建立對人工智能代理的信任,這標(biāo)志著向利用能夠自主執(zhí)行任務(wù)的代理邁出了重要一步?!?/span>
AnswerRocket的首席技術(shù)官兼聯(lián)合創(chuàng)始人Mike Finley說,人工智能代理可以通過兩個階段進(jìn)行準(zhǔn)確性測試:
要求人工智能代理提供有據(jù)可查的證據(jù)點,其中使用的任何事實或引用都包含其來源,做出的任何決策都包含描述其輸入的有記錄的邏輯步驟。
人工智能驗證器是監(jiān)督代理,其工作是監(jiān)督其他人工智能代理的工作,并在審查準(zhǔn)確性的同時尋找微妙的線索,如語氣的轉(zhuǎn)變。
5.AI代理將重新定義生產(chǎn)力
繼LLM和RAG之后,AI代理如何影響廣泛業(yè)務(wù)工作流程中的生產(chǎn)力的潛力。隨著越來越多的平臺提供代理并使開發(fā)平臺可擴(kuò)展,可能會出現(xiàn)新的人類和人工智能責(zé)任。
“代理型人工智能將重塑工作場所,并創(chuàng)造新的角色,比如‘代理經(jīng)理’,他們將監(jiān)督專業(yè)代理,戰(zhàn)略性地指導(dǎo)這些系統(tǒng),并確保它們與業(yè)務(wù)角色保持一致,就像今天的主管管理團(tuán)隊一樣?!?/span>
Augury的戰(zhàn)略副總裁Artem Kroupenev說,“隨著多代理系統(tǒng)的增長,類似人力資源的部門可能會出現(xiàn),以管理人類和人工智能代理的混合勞動力,專注于培訓(xùn)、協(xié)調(diào)和績效指標(biāo)。這種混合方法可能會將人類直覺與機(jī)器效率結(jié)合起來,以實現(xiàn)更好的生產(chǎn)力?!?/span>
增長的關(guān)鍵可能不在于開發(fā)人工智能代理有多容易,而在于組織是否會信任它們,以及員工是否會接受它們的能力。
參考鏈接:https://www.infoworld.com/article/3812583/what-you-need-to-know-about-developing-ai-agents.html