谷歌云數(shù)據(jù)庫增加更多人工智能功能
谷歌云正在加強其分析和事務數(shù)據(jù)庫,包括BigQuery, AlloyDB和Spanner,旨在推動其客戶生成人工智能應用程序的開發(fā)。
BigQuery是谷歌云的頂級數(shù)據(jù)庫,用于支持分析和人工智能工作負載,它開發(fā)了幾項人工智能增強功能。首先,該公司推出了BigQuery和Vertex AI在文本和語音方面的集成預覽。谷歌云表示,這將允許用戶從圖像和文檔等非結構化數(shù)據(jù)中提取見解。
該公司最大、功能最強的人工智能模型雙子座(Gemini)也通過Vertex AI向BigQuery客戶開放。上周,該模型在消費者市場首次亮相時表現(xiàn)不佳,引發(fā)了一些爭議。
這些AI功能是繼BigQuery早先宣布的向量搜索功能之后推出的。預覽中的向量搜索功能,支持GenAI應用程序的關鍵組件,例如使用大型語言模型的相似性搜索和檢索增強生成(RAG)。
BigQuery中直接訪問Vertex AI可以從多個方面為谷歌云AI客戶提供易用性,谷歌云AI總經理兼數(shù)據(jù)分析副總裁Gerrit Kazmaier表示。
Kazmaier在新聞發(fā)布會上說:“作為一名數(shù)據(jù)分析從業(yè)者,你可以通過SQL命令行或BigQuery嵌入式Python API訪問所有Vertex AI模型,包括我們的Gemini模型?!薄斑@很神奇,因為這意味著你不需要去找數(shù)據(jù)科學家或機器學習平臺。你可以在你正在工作的領域,在你手頭的數(shù)據(jù)上訪問它?!?/p>
Kazmaier說,整合的第二個好處是更好地訪問人工智能模型的數(shù)據(jù)。在此集成之前,將數(shù)據(jù)傳輸?shù)饺斯ぶ悄苣P屯ǔP枰獦嫿ê筒僮饕约皵?shù)據(jù)管道來移動數(shù)據(jù)。他說,現(xiàn)在已經不需要了?!八械膹碗s性都消失了?!?/p>
在vertex中結合基于文本和圖像的人工智能模型的能力(現(xiàn)在數(shù)據(jù)分析師可以通過BigQuery使用)也會給客戶帶來很大的好處。
“這開啟了分析情景的全新階段。”他說,結構化和非結構化數(shù)據(jù)的總結、情感提取、分類、濃縮、翻譯是一件大事。粗略地說,90%的數(shù)據(jù)都是非結構化的。這些數(shù)據(jù)通常不會用于企業(yè)數(shù)據(jù)分析,因為你無法以有意義的方式處理它們。
在事務(或運營)方面,谷歌云宣布全面推出AlloyDB AI,這是該公司在去年的Next 23大會上發(fā)布的托管Postgres數(shù)據(jù)庫的AI專用版本。AlloyDB AI具備存儲矢量嵌入和執(zhí)行矢量搜索功能的能力,谷歌云將其視為其客戶GenAI用例的核心組件。
谷歌云還推出了與LangChain的新集成,LangChain是一個流行的開源框架,可以幫助將客戶數(shù)據(jù)連接到大型語言模型(LLM)中。谷歌云總經理兼數(shù)據(jù)庫副總裁Andi Gutmans表示,谷歌云的所有數(shù)據(jù)庫都將與LangChain集成。
Gutmans說,新的功能是為了響應客戶的需求,找到一種從他們的數(shù)據(jù)中獲得更多GenAI價值的方法。
該公司還宣布,將在其云上為客戶托管的其他數(shù)據(jù)庫(包括Redis和MySQL)中添加矢量搜索功能。Gutmans說,Cloud Spanner、Firestore和Bigtable也將獲得矢量功能。
“Spanner的特別之處在于它將具有最近鄰搜索功能,這是一個稍微不同的變體?!盙utmans說,“真正令人興奮的是那些擁有非常非常大的用例的客戶——例如,數(shù)萬億的向量,例如基于用戶的高度分區(qū)。你可以想象,谷歌的一些內部應用程序是按用戶劃分的——它們將能夠以萬億(向量)規(guī)模存儲和搜索向量。”
他說:“我們的信念是,任何數(shù)據(jù)庫,任何存儲操作數(shù)據(jù)的地方,你可能需要在GenAI用例中使用,也應該具有矢量能力?!薄斑@與15到20年前數(shù)據(jù)庫都添加JSON支持時沒有什么不同。我們認為,好的矢量功能應該只是保持數(shù)據(jù)庫的基礎功能?!?/p>