撰稿 | 云昭
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
太猛了!甲骨文已經(jīng)按捺不住,就像找了某種魔法鑰匙一般,準(zhǔn)備在2024年大干一場(chǎng)!
近日,甲骨文宣布正在將生成式AI功能集成到該公司的整個(gè)云服務(wù)OCI(Oracle Cloud Infrastructure)的技術(shù)堆棧中。
從硬件到基礎(chǔ)平臺(tái)、再到模型和應(yīng)用,都將全面跟生成式AI深度融合,當(dāng)然,數(shù)據(jù)庫(kù)和Java也在其中。
1、Oracle全生態(tài)集成GenAI
在過(guò)去一年里,甲骨文一直在多種產(chǎn)品中推出其三層生成人工智能戰(zhàn)略。該公司于9月發(fā)布了OCI Generative AI Service的測(cè)試版預(yù)覽版。
如今,Oracle突然放出了一些列動(dòng)作,可謂一改保守的姿態(tài),主要有:宣布新模型入駐(Cohere和Meta新模型Llama 2)、新的AI Agents、用于管理開(kāi)源LLM的新的低代碼框架,并使該服務(wù)普遍可用。
在一次采訪中,Oracle Cloud Infrastructure副總裁兼Generative AI Services總經(jīng)理Vinod Mamtani,透露了一項(xiàng)甲骨文的計(jì)劃,其中包括全面提供生成式AI服務(wù)、推出生成式 AI Agent以及引入數(shù)據(jù)科學(xué)人工智能快速行動(dòng)。
IDC集團(tuán)副總裁Ritu Jyoti表示:“通過(guò)在整個(gè)Oracle生態(tài)系統(tǒng)中集成生成人工智能的通用架構(gòu),該公司正在將生成式AI帶到云數(shù)據(jù)中心和內(nèi)部環(huán)境中已有EB級(jí)客戶數(shù)據(jù)的地方?!?/p>
值得注意的是,這家企業(yè)友好型云服務(wù)提供商去年在Oracle應(yīng)用程序套件中的幾個(gè)應(yīng)用程序中添加了生成式AI服務(wù),其中包括HCM、SCM、CX、ERP、NetSuite和一系列其他行業(yè)垂直模型。
2、寶藏模型Llama 2入駐甲骨文
新模型包括Meta的Llama2-70B,這是一種針對(duì)聊天用例優(yōu)化的文本生成模型,以及最新版本的Cohere模型,如Command、Summary和Embed。Oracle在一份聲明中表示,這些模型將在可通過(guò)API調(diào)用使用的托管服務(wù)中提供,并補(bǔ)充說(shuō),這些模型也可以通過(guò)更新的服務(wù)進(jìn)行微調(diào)。
此外,除了托管Llama 2,OCI現(xiàn)在還將托管Cohere的520億嵌入式模型。Mamatani說(shuō):“如果你看看排行榜,Cohere的嵌入式模型排名很高。它同時(shí)支持英語(yǔ)和多語(yǔ)言嵌入?!彼忉屨f(shuō),無(wú)論使用何種語(yǔ)言,生成的嵌入都將在同一空間中。
此前,Cohere一直被視為甲骨文的AI大模型寵兒,當(dāng)時(shí)被視為其“構(gòu)成嵌入Oracle SaaS套件和行業(yè)應(yīng)用程序的GenAI功能的基礎(chǔ)”。
最近Llama 2的受歡迎程度飆升,甲骨文當(dāng)然不會(huì)放過(guò)這個(gè)寶藏模型。有趣的是,這是OCI首次托管Cohere以外的模型。當(dāng)被問(wèn)及是什么促使OCI轉(zhuǎn)向Llama 2時(shí),Mamtani說(shuō):“關(guān)于Llama,我們注意到了它在開(kāi)發(fā)者之間的興趣和受歡迎程度,這就是為什么我們認(rèn)為它對(duì)我們的客戶非常有用。”
OCI Generative AI服務(wù)還提供靈活的微調(diào),可通過(guò)vanilla和TPU微調(diào)用于Cohere的Command 52/6B型號(hào)。此外,為了讓客戶更容易構(gòu)建他們的人工智能應(yīng)用程序,Oracle還集成了流行甚廣的LangChain。
總的來(lái)說(shuō),OCI 托管 Llama 2 的決定是一個(gè)明智的舉措,這有助于他們?cè)诟?jìng)爭(zhēng)激烈的云服務(wù)市場(chǎng)中保持領(lǐng)先地位,并吸引更多的客戶。
畢竟,托管多個(gè)不同類型的模型也可以增加云服務(wù)提供商的靈活性和多樣性。通過(guò)托管這些模型,云服務(wù)提供商可以吸引更多的開(kāi)發(fā)者和研究者使用他們的服務(wù),進(jìn)而推動(dòng)其云業(yè)務(wù)的增長(zhǎng)。
3、押注AI Agents:RAG、數(shù)據(jù)庫(kù)、Java,一個(gè)都不能少
在測(cè)試版中,甲骨文引入的第一個(gè)AI代理是RAG代理。Mamtani表示,該代理的工作原理與LangChain類似,它結(jié)合了LLM和建立在OCI OpenSearch上的企業(yè)搜索的力量,提供了通過(guò)企業(yè)數(shù)據(jù)增強(qiáng)的情境化結(jié)果。
當(dāng)企業(yè)用戶通過(guò)業(yè)務(wù)應(yīng)用程序向RAG代理輸入自然語(yǔ)言查詢時(shí),該查詢將傳遞給OCI OpenSearch,這是一種矢量或語(yǔ)義搜索形式。OCI OpenSearch反過(guò)來(lái)從企業(yè)的數(shù)據(jù)存儲(chǔ)庫(kù)中讀取和收集相關(guān)信息。然后,ReRanker LLM對(duì)搜索結(jié)果進(jìn)行排名,該LLM將排名傳遞給文本生成LLM,文本生成LLM以自然語(yǔ)言回答查詢。
由于LLM是在公共數(shù)據(jù)集上訓(xùn)練的,并沒(méi)有囊括這些龐大的企業(yè)私有數(shù)據(jù)。為了解決這一問(wèn)題,OCI在其OpenSearch中引入了檢索增強(qiáng)生成Agents。用戶現(xiàn)在可以簡(jiǎn)單地將自己的文檔附加到它上,并開(kāi)始用自然語(yǔ)言與它聊天。
甲骨文 OpenSearch用例
Mamtani解釋道:“它將提供有根據(jù)的響應(yīng),減少幻覺(jué)。我們正在插入對(duì)OpenSearch的支持。用戶現(xiàn)在可以通過(guò)自然語(yǔ)言透明地訪問(wèn)各種企業(yè)數(shù)據(jù)集,而不需要專業(yè)技能,也不需要知道數(shù)據(jù)的格式或存儲(chǔ)位置。”
除了RAG Agent,Oracle還計(jì)劃引入新的Agent。即將發(fā)布的版本將支持更廣泛的數(shù)據(jù)搜索和聚合工具,并提供使用AI Vector search訪問(wèn)Oracle數(shù)據(jù)庫(kù)23c和使用Vector Store訪問(wèn)MySQL Heatwave的功能。
圖片
甲骨文表示,這些AI Agents是在普林斯頓大學(xué)和谷歌研究人員發(fā)表的ReAct論文的幫助下創(chuàng)建的。Agents通過(guò)使用ReAct框架根據(jù)一系列想法、行動(dòng)和觀察進(jìn)行推理、行動(dòng)和計(jì)劃。
Mamtani說(shuō),這些功能將允許Agents超越信息檢索任務(wù),代表用戶調(diào)用API,并自動(dòng)化其他任務(wù)。Oracle還計(jì)劃向服務(wù)中添加多回合代理,這些代理可以被要求保留過(guò)去交互的記憶,以進(jìn)一步豐富模型上下文及其響應(yīng)。
至于用途,據(jù)該公司稱,這些代理及其操作中的大多數(shù)都可以添加到其SaaS應(yīng)用程序套件中,包括Oracle Fusion Cloud applications suite、Oracle NetSuite和Oracle Cerner等行業(yè)應(yīng)用程序。
Oracle還將在其SaaS應(yīng)用程序套件中提供預(yù)構(gòu)建的代理操作,包括Oracle Fusion Cloud applications suite、Oracle NetSuite和Oracle Health等行業(yè)應(yīng)用程序。Mamtani說(shuō):“我們的SaaS應(yīng)用套件中存在這些復(fù)雜的工作流程。因此,我們希望實(shí)現(xiàn)自動(dòng)化和簡(jiǎn)化。我們會(huì)考慮構(gòu)建專門用于這些應(yīng)用程序的代理?!?/p>
此外,Mamtani表示,Oracle還計(jì)劃為Java應(yīng)用程序引入Code Gen Agent?!癘racle收購(gòu)了Sun Microsystems,所以我們最適合擁有Java語(yǔ)言的Agent,”他補(bǔ)充道。
4、AI Quick Actions低代碼部署開(kāi)源庫(kù)
此外,為了幫助企業(yè)使用和管理具有開(kāi)源庫(kù)的LLM,Oracle正在其OCI數(shù)據(jù)科學(xué)產(chǎn)品中添加一項(xiàng)新功能,稱為AI快速操作(AI Quick Actions)功能。這項(xiàng)功能將于下個(gè)月進(jìn)行測(cè)試,它允許對(duì)各種開(kāi)源LLM進(jìn)行無(wú)代碼訪問(wèn)。
AI Quick Actions從根本上為部署和微調(diào)提供了無(wú)代碼、低代碼的解決方案。為了幫助客戶使用開(kāi)源庫(kù)(如Hugging Face的Transformers或PyTorch)構(gòu)建、訓(xùn)練、部署和管理LLM,Oracle還擴(kuò)展了OCI Data Science的功能。
圖片
Mamtani總結(jié)道:“我們希望迎合全方位的數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)從業(yè)者。其中,有相當(dāng)一類開(kāi)發(fā)人員希望嘗試并使用其他的開(kāi)源模型。”
5、后發(fā)者的勝算:成本優(yōu)化
相較于AWS、谷歌、IBM而言,甲骨文的動(dòng)作在去年顯得有些緩慢,但正因如此,現(xiàn)在大家看到的激進(jìn)措施,不得不讓人聯(lián)想到甲骨文是否看到了決勝GenAI賽道的那把破局的鑰匙。
有分析人士指出,甲骨文正試圖將其生成式AI的基本要素集成到其基本產(chǎn)品中,特別是數(shù)據(jù)庫(kù)中,以優(yōu)化計(jì)算資源并降低成本?!霸S多數(shù)據(jù)庫(kù)廠商,例如MongoDB,采用數(shù)據(jù)庫(kù)內(nèi)機(jī)器學(xué)習(xí)功能并在最近在相同數(shù)據(jù)庫(kù)中構(gòu)建、存儲(chǔ)和檢索向量嵌入(其中被向量化的數(shù)據(jù)存在),這并不令人意外。這一切都是為了最小化復(fù)雜性并最大化支出。”
然而企業(yè)很難保證只用同一種數(shù)據(jù)庫(kù),至少需要兩個(gè):一個(gè)用于向量,一個(gè)用于源數(shù)據(jù)。這將很昂貴,因?yàn)樗麄儗⒉坏貌粸楣芾韮蓚€(gè)數(shù)據(jù)庫(kù)之間的數(shù)據(jù)集成和延遲付出代價(jià)。
而Oracle的機(jī)會(huì)或正在于此,該公司已經(jīng)尋求從數(shù)據(jù)庫(kù)處理到芯片網(wǎng)絡(luò)和數(shù)據(jù)檢索的整個(gè)過(guò)程中優(yōu)化其云基礎(chǔ)設(shè)施。通過(guò)降低復(fù)雜性并提高性能,能夠?yàn)槠淇蛻艉陀脩籼峁┡c眾不同的價(jià)值。
參考鏈接:
https://analyticsindiamag.com/oracles-generative-ai-madness-begins/