年終盤點:2024年最炙手可熱的十家大數(shù)據(jù)初創(chuàng)公司
數(shù)據(jù)已經(jīng)成為很多企業(yè)和組織的寶貴資產(chǎn)。他們正在分析數(shù)據(jù)以深入了解市場、客戶和他們自己的運營情況。他們正在使用數(shù)據(jù)來推動數(shù)字化轉(zhuǎn)型計劃,支持新的數(shù)據(jù)密集型服務(wù)。
而數(shù)據(jù)——大量的數(shù)據(jù)——是AI和機器學(xué)習(xí)計劃的關(guān)鍵組成部分。
但整理、管理和分析數(shù)據(jù)是一項重大挑戰(zhàn)。根據(jù)市場研究公司IDC的數(shù)據(jù)顯示,創(chuàng)建、捕獲、復(fù)制和使用的數(shù)據(jù)總量每年以超過20%的速度增長,預(yù)計到2027年將達(dá)到約291 ZB。
這就是為什么會有源源不斷的大數(shù)據(jù)初創(chuàng)公司開發(fā)出尖端的技術(shù)來幫助企業(yè)訪問、收集、管理、移動、轉(zhuǎn)換、分析、理解、衡量、管理、維護(hù)和保護(hù)數(shù)據(jù)。
以下就是2024年引起了我們關(guān)注的10家大數(shù)據(jù)初創(chuàng)公司。
Ariga
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Ariel Mashraki
數(shù)據(jù)庫模式是數(shù)據(jù)在數(shù)據(jù)庫系統(tǒng)中組織和結(jié)構(gòu)的一種方式,包括了數(shù)據(jù)表以及定義不同數(shù)據(jù)元素之間關(guān)系的方式。
當(dāng)數(shù)據(jù)更新或數(shù)據(jù)庫需要支持運行在數(shù)據(jù)庫上的應(yīng)用的新特性和功能時,有時必須更改數(shù)據(jù)庫模式,這可能是一件苦差事。
Ariga開發(fā)了一個數(shù)據(jù)庫模式即代碼平臺,軟件工程師使用該平臺就可以通過代碼定義和管理數(shù)據(jù)庫模式,從而降低模式更改的復(fù)雜性并簡化數(shù)據(jù)庫管理。
Ariga的產(chǎn)品包括數(shù)據(jù)庫模式即代碼工具Atlas和用于Go編程語言的ent.go實體框架。
Ariga公司成立于2021年,總部位于以色列特拉維夫。2023年6月,Ariga宣布在A輪融資中獲得1500萬美元,以及此前未宣布的300萬美元種子輪融資。
DataPelago
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Rajan Goyal
初創(chuàng)公司DataPelago在今年10月走出隱身模式,推出了該公司所謂的全球首個“通用數(shù)據(jù)處理引擎”,可以應(yīng)對當(dāng)今數(shù)據(jù)的復(fù)雜性和數(shù)量,用于所謂的“加速計算”分析和AI工作負(fù)載。
DataPelago公司首席執(zhí)行官Goyal表示,基于CPU和基本軟件架構(gòu)的傳統(tǒng)數(shù)據(jù)處理系統(tǒng)無法應(yīng)對當(dāng)今數(shù)據(jù)的復(fù)雜性和數(shù)量。
他說:“數(shù)據(jù)在變化,應(yīng)用在變化,最重要的是,[IT]基礎(chǔ)設(shè)施也在變化,當(dāng)三種不同的顛覆性趨勢匯聚在一起時,你需要退后一步,看看未來會是什么樣子,數(shù)據(jù)處理平臺應(yīng)該是什么樣子?!?/p>
為了解決這個問題,Goyal在2021年宣布推出了DataPelago,并組建了一支“多學(xué)科團隊”,由在系統(tǒng)架構(gòu)、數(shù)據(jù)分析、云、SaaS、開源開發(fā)和其他技術(shù)領(lǐng)域擁有專業(yè)知識的人員組成。
DataPelago的通用數(shù)據(jù)處理引擎正在被一些客戶以試點或者預(yù)覽的方式使用,旨在克服當(dāng)前IT系統(tǒng)的性能、成本和可擴展性限制。該系統(tǒng)是從零開始構(gòu)建的,采用硬件和軟件協(xié)同設(shè)計的方法,支持生成式AI和數(shù)據(jù)湖屋分析工作負(fù)載。
DataPelago總部位于美國加利福尼亞州山景城,目前已經(jīng)累計從投資方Eclipse、Taiwania Capital、Qualcomm Ventures、Alter Venture Partners、Nautilus Venture Partners和First Citizens Bank旗下Silicon Valley Back那里獲得了4700萬美元的種子輪和A輪融資。
DeasyLabs
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Reece Griffiths
AI模型的好壞取決于輸入的數(shù)據(jù)。DeasyLabs表示,該公司的使命是提供數(shù)據(jù)治理,以確保大型語言模型僅運行在安全的、相關(guān)的、高質(zhì)量的數(shù)據(jù)上。
這家初創(chuàng)公司開發(fā)了一個元數(shù)據(jù)編排平臺,用于創(chuàng)建高質(zhì)量、定制的元數(shù)據(jù)并將其嵌入到他們的AI工作流中,包括檢索增強生成和代理框架。
DeasyLabs公司成立于2023年,總部位于紐約,在2023年獲得了300萬美元的種子資金,并得到了Y Combinator的支持,資金來自General Catalyst、RTP Global和J12等投資方。
Diliko
首席執(zhí)行官:Dave Albano
Diliko公司在11月7日剛剛走出隱身模式,它開發(fā)了一個具有自動數(shù)據(jù)管理和治理功能的代理AI平臺,并表示這可以降低運營復(fù)雜性和成本。
Diliko總部位于美國弗吉尼亞州雷斯頓,主要面向數(shù)據(jù)密集型醫(yī)療、金融和物流行業(yè)的中型企業(yè)。該公司表示,其服務(wù)為CIO、CFO和CDO等C級高管以及數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析師等數(shù)據(jù)相關(guān)人員帶來了好處。
基于云的Diliko平臺優(yōu)化了數(shù)據(jù)管理性能,無需部署和管理昂貴的基礎(chǔ)設(shè)施。該服務(wù)使用按需數(shù)據(jù)集成、ETL(提取、轉(zhuǎn)換、加載)和編排來實現(xiàn)復(fù)雜數(shù)據(jù)管理工作流程的自動化,并可在內(nèi)部系統(tǒng)和外部系統(tǒng)之間實時同步數(shù)據(jù)。
Diliko平臺還通過零信任架構(gòu)、端到端加密和多因素身份驗證等云原生安全功能確保數(shù)據(jù)治理和安全。
Dymium
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Denzil Wessel
Dymium開發(fā)了一個數(shù)據(jù)訪問管理平臺,可以在“數(shù)據(jù)所在位置”提供對數(shù)據(jù)的安全訪問,從而消除了將數(shù)據(jù)移動到數(shù)據(jù)倉庫和數(shù)據(jù)湖以進(jìn)行分析和AI任務(wù)的相關(guān)成本和復(fù)雜性。
“通過復(fù)制數(shù)據(jù)向團隊提供各種格式數(shù)據(jù)的做法,每種格式都有不同的訪問控制、策略和安全要求,這就導(dǎo)致了前所未有的復(fù)雜性,阻礙了創(chuàng)新并破壞了安全和治理,”Wessel說。
Dymium平臺可以幫助組織以經(jīng)濟高效的方式管理快速增長的數(shù)據(jù)源中的數(shù)據(jù)訪問要求,增強其安全態(tài)勢并幫助他們遵守監(jiān)管要求。
該系統(tǒng)結(jié)合了零信任架構(gòu)、集中訪問策略、實時數(shù)據(jù)轉(zhuǎn)換服務(wù)、AI和機器學(xué)習(xí),以正確的格式向正確的用戶提供正確的數(shù)據(jù)。
Dymium公司成立于2022年,總部位于美國加利福尼亞州洛斯加托斯,在今年3月走出隱身模式并獲得700萬美元的融資。
Mind
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Eran Barak
初創(chuàng)公司Mind開發(fā)了下一代數(shù)據(jù)丟失預(yù)防技術(shù),并且剛剛走出隱身模式,獲得來自YL Ventures的1100萬美元種子資金。該公司總部位于美國西雅圖。
Mind的平臺結(jié)合了AI和“智能自動化”來監(jiān)控數(shù)據(jù)事件,識別、檢測和防止數(shù)據(jù)泄露。該系統(tǒng)發(fā)現(xiàn)并分類眾多IT工作負(fù)載中的敏感數(shù)據(jù)(包括靜態(tài)的、動態(tài)的和使用中的數(shù)據(jù)),覆蓋了SaaS、生成式AI應(yīng)用、端點、本地系統(tǒng)和電子郵件。
Mind AI系統(tǒng)的核心是由數(shù)百種定制算法和專有AI引擎組成的,用于對敏感的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分類和歸類,了解上下文感知業(yè)務(wù)視圖以確定風(fēng)險嚴(yán)重性,并在需要時采取自動預(yù)防和補救措施。
Mind公司是由Eran Barak在2023年共同創(chuàng)立的,之前他創(chuàng)立了Hexadite公司,后來該公司被微軟收購。他和其他聯(lián)合創(chuàng)始人之前曾在以色列軍事情報局8200部門擔(dān)任領(lǐng)導(dǎo)職務(wù)。
MotherDuck
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Jordan Tigani
初創(chuàng)公司MotherDuck在2023年6月推出了無服務(wù)器的MotherDuck Cloud Analytics Platform平臺首個版本,該平臺結(jié)合了云和嵌入式數(shù)據(jù)庫技術(shù),無論數(shù)據(jù)位于何處,都可以輕松地對其進(jìn)行分析。
MotherDuck的軟件基于MotherDuck的DuckDB開源嵌入式數(shù)據(jù)庫。據(jù)稱,這個云系統(tǒng)通過將進(jìn)程內(nèi)數(shù)據(jù)庫的速度與云的可擴展性相結(jié)合,簡化了對任何規(guī)模數(shù)據(jù)的分析。
MotherDuck認(rèn)為,近年來數(shù)據(jù)分析的大多數(shù)進(jìn)步都是針對擁有超過1PB數(shù)據(jù)的大型企業(yè)和組織,而忽略了擁有類似規(guī)模數(shù)據(jù)量的中小型企業(yè)。
總部位于美國西雅圖的MotherDuck是由Google BigQuery創(chuàng)始工程師Tigani在2022年共同創(chuàng)立的。2023年9月,該公司在B輪融資中獲得了5250萬美元,總?cè)谫Y金額達(dá)到1億美元。
Onehouse
首席執(zhí)行官:Vinoth Chandar
Onehouse公司提供了云原生、完全托管的通用數(shù)據(jù)湖屋服務(wù),并表示,該服務(wù)旨在從任何來源提取數(shù)據(jù),并可以支持所有查詢引擎。該系統(tǒng)是基于Apache Hudi開源數(shù)據(jù)湖平臺的。
Onehouse希望幫助企業(yè)和組織解決數(shù)據(jù)分散和孤立的問題——數(shù)據(jù)分散在本地和云端的數(shù)據(jù)存儲系統(tǒng)、運營數(shù)據(jù)庫和數(shù)據(jù)倉庫系統(tǒng)中。
今年6月,Onehouse公司推出了產(chǎn)品線的新增產(chǎn)品LakeView,這是面向開源社區(qū)的Lakehouse可觀察性工具,以及用于Lakehouse自動優(yōu)化的Table Optimizer。8月,Onehouse推出了一個向量嵌入生成器,用于嵌入管道自動化,作為Onehouse管理中ELT(提取、性能和加載)云服務(wù)的一個組成部分。
Onehouse公司成立于2021年,總部位于美國加利福尼亞州門洛帕克,今年6月在由Craft Ventures領(lǐng)投的B輪融資中獲得了3500萬美元,早期投資方Addition和Greylock Partners也參與其中。
Scoop Analytics
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Brad Peters
初創(chuàng)公司Scoop Analytics在今年6月憑借其用于自動化報告流程和開發(fā)AI驅(qū)動的商業(yè)智能演示文稿和報告軟件脫穎而出。
據(jù)Scoop Analytics稱,該軟件使任何具有電子表格技能的人都可以從任何應(yīng)用中收集數(shù)據(jù),混合來自不同來源的數(shù)據(jù),通過基于實時數(shù)據(jù)的幻燈片演示來創(chuàng)建“視覺上引人注目的數(shù)據(jù)故事”。
Peters表示,Scoop的使命是“以不需要數(shù)據(jù)團隊的形式提供數(shù)據(jù)分析”,并實現(xiàn)真正的自助式商業(yè)智能的長期目標(biāo)。
總部位于美國舊金山的Scoop Analytics公司是由Peters和其他曾在商業(yè)分析軟件開發(fā)商Birst工作的人創(chuàng)立。該公司于6月18日正式成立,獲得了來自Ridge Ventures、Industry Ventures和Engineering Capital的350萬美元種子資金。
Unstructured
創(chuàng)始人、首席執(zhí)行官:Brian Raymond
Unstructured因其用于訪問、準(zhǔn)備和轉(zhuǎn)換數(shù)據(jù)(尤其是文檔和圖像等非結(jié)構(gòu)化數(shù)據(jù))的技術(shù)而受到關(guān)注,這些技術(shù)可用于為AI和生成式AI應(yīng)用提供支持的大型語言模型。
在AI發(fā)展的浪潮中,各種組織正在努力清理和準(zhǔn)備大量數(shù)據(jù),尤其是文檔和圖像等非結(jié)構(gòu)化數(shù)據(jù)。Unstructured公司表示,超過80%的企業(yè)數(shù)據(jù)都存儲在文檔和其他非結(jié)構(gòu)化文件中。
Unstructured的平臺和開發(fā)工具可以將非結(jié)構(gòu)化或“自然語言”數(shù)據(jù)轉(zhuǎn)換為可用于大型語言模型、矢量數(shù)據(jù)庫和LangChain的格式。Unstructured的系統(tǒng)適用于一系列難以使用的文件類型和格式,包括HTML、PDF、CSV、PNG、PPTX等。
今年7月,總部位于美國加利福尼亞州薩克拉門托的Unstructured分別在由Bain Capital Ventures和Madrona領(lǐng)投的種子輪和A輪融資中獲得了2500萬美元資金。