年終盤點:2024年最酷的十款開源軟件工具
對新想法持開放態(tài)度
開源軟件工具因其具有的多項優(yōu)勢而持續(xù)受到歡迎,包括更低的前期軟件和硬件成本、更低的總擁有成本、無廠商鎖定、更簡單的許可管理和來自活躍社區(qū)的支持。
下面我們將介紹今年引起我們關(guān)注的一些最受歡迎的開源軟件產(chǎn)品,其中一些已經(jīng)存在了一段時間,并且已經(jīng)被廣泛使用,而另一些則相對較新——一些在去年左右才首次亮相——但已經(jīng)顯示出早期的發(fā)展勢頭。
毫不奇怪,AI和生成式AI應(yīng)用開發(fā)的浪潮是推動開源軟件采用的主要驅(qū)動力,這個榜單中的部分產(chǎn)品屬于軟件開發(fā)領(lǐng)域,或有助于滿足管理AI系統(tǒng)所需大量數(shù)據(jù)的需求。
這些產(chǎn)品可在MIT許可、Apache 2.0許可、GNU GPL等開源許可下使用,有些產(chǎn)品是由獲得創(chuàng)業(yè)加速器和風(fēng)險投資公司Y Combinator資助的初創(chuàng)公司開發(fā)的產(chǎn)品。
1. Airbyte
Airbyte是一個快速增長的數(shù)據(jù)集成和數(shù)據(jù)移動平臺,用于ETL/ELT數(shù)據(jù)管道,可以把應(yīng)用、API、數(shù)據(jù)庫和文件連接到數(shù)據(jù)倉庫、數(shù)據(jù)湖和其他目的地。Airbyte還可以用于把非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)移動到AI應(yīng)用的矢量數(shù)據(jù)庫和大型語言模型框架中。
Airbyte核心的Airbyte Open Source已經(jīng)被40000多家公司使用,這款軟件可以在多個開源許可下使用,包括MIT許可和Elastic許可2.0。
總部位于美國舊金山的Airbyte還圍繞這個平臺提供了許多商業(yè)產(chǎn)品和服務(wù)。今年5月Airbyte啟動了一項合作伙伴計劃,其中包括了認(rèn)證課程,用于幫助技術(shù)服務(wù)提供商和經(jīng)銷商使用Airbyte軟件。
2. Apache DataFusion
Apache軟件基金會把DataFusion描述為“一種快速的、可擴展的查詢引擎,用于構(gòu)建高質(zhì)量、以數(shù)據(jù)為中心的系統(tǒng)”,例如數(shù)據(jù)庫、數(shù)據(jù)框庫、機器學(xué)習(xí)和流媒體應(yīng)用。
DataFusion可以用作嵌入式SQL引擎,也可以定制并用作構(gòu)建新系統(tǒng)的基礎(chǔ),重點關(guān)注高吞吐量、低延遲的分析、流式傳輸和事務(wù)工作負(fù)載。
DataFusion采用了Apache Arrow(一種用于構(gòu)建處理列式數(shù)據(jù)的數(shù)據(jù)分析應(yīng)用的、語言無關(guān)的框架)和Rust編程語言的技術(shù)功能。
Apache軟件基金會自2019年以來一直在開發(fā)DataFusion,今年6月Apache軟件基金會表示,作為Apache Arrow項目的一部分,DataFusion現(xiàn)在已經(jīng)被指定為頂級項目,“以提供更有針對性的治理能力,實現(xiàn)持續(xù)增長”。
用戶可以從Apache軟件基金會網(wǎng)站、GitHub和其他網(wǎng)站下載DataFusion,該軟件遵循Apache 2.0許可,最新源代碼版本為41.0.0。
3. Danswer
據(jù)Danswer公司網(wǎng)站介紹,Danswer提供了一個開源AI助手和企業(yè)搜索應(yīng)用,可以連接企業(yè)所有的工具、應(yīng)用和文檔,使整個組織中的信息查找變得更加容易。
Danswer表示,可以把這款軟件看做是ChatGPT,但可以訪問組織自己的信息、數(shù)據(jù)和文檔,而不會產(chǎn)生幻覺。Danswer的軟件已經(jīng)提供了40多個交鑰匙集成,例如與Slack和Google Docs的集成,“而且每天都在構(gòu)建更多的集成”。
Danswer軟件可在企業(yè)數(shù)據(jù)中心或云平臺上自行托管。
Danswer公司成立于2023年,獲得Y Combinator的支持。該軟件采用MIT許可,可從該公司和GitHub獲得。
4. DuckDB
DuckDB是一種高性能進(jìn)程內(nèi)數(shù)據(jù)庫,旨在支持在線分析處理(OLAP)查詢工作負(fù)載。
根據(jù)Database of Databases網(wǎng)站顯示,這款關(guān)系型(面向表的)數(shù)據(jù)庫支持SQL并使用列向量化查詢執(zhí)行引擎,這個引擎可以在一次操作中將大量值作為向量處理,而且數(shù)據(jù)庫設(shè)計為嵌入在主機進(jìn)程中運行,無需安裝服務(wù)器數(shù)據(jù)庫。
DuckDB最初是2018年在荷蘭國家數(shù)學(xué)和計算機科學(xué)研究所Centrum Wiskunde & Informatica開發(fā)的。
DuckDB及其核心擴展在MIT許可下開源,整個源代碼可以在GitHub上免費獲取。DuckDB 1.0.0版本是今年6月剛剛發(fā)布的,可以通過DuckDB.org網(wǎng)站和GitHub獲取。
DuckDB備受關(guān)注的一個原因是初創(chuàng)公司MotherDuck開發(fā)了運行在DuckDB上的云分析軟件。
5. Grafana可觀察性工具
Grafana是一個開源可觀察性和數(shù)據(jù)可視化平臺,用于收集和可視化來自許多數(shù)據(jù)源的指標(biāo)、跟蹤和日志數(shù)據(jù),常用作IT/OT監(jiān)控系統(tǒng)的組件。
Grafana是由Grafana Labs開發(fā)的,在AGPL-3.0開源許可下可用。今年4月,該公司推出了Grafana 11.0,其中包含新的Explore Metrics根本原因分析功能、改進(jìn)的可視化、更簡單的警報和對其他數(shù)據(jù)源的支持。
除了旗艦軟件外,Grafana Labs還開發(fā)了其他開源軟件,包括多租戶日志聚合系統(tǒng)Grafana Loki、用于大規(guī)模分布式跟蹤的后端軟件Grafana Tempo、以及可擴展后端指標(biāo)存儲和分析工具Grafana Mimir,此外Grafana Labs還銷售軟件的商用企業(yè)版。
6. LangChain
根據(jù)Python.Langchain.com網(wǎng)站和IBM網(wǎng)站介紹,LangChain是一個開源編排框架,用于開發(fā)連接了外部數(shù)據(jù)源的大型語言模型所驅(qū)動的生成式AI應(yīng)用。
如果企業(yè)和組織有辦法將自己的專有數(shù)據(jù)加載到大型語言模型中,他們就可以從生成式AI中獲得更多價值,由于數(shù)據(jù)準(zhǔn)備和大型語言模型調(diào)整的復(fù)雜性以及數(shù)據(jù)安全問題,這可能是一項艱巨的任務(wù)。
LangChain簡化了大型語言模型應(yīng)用生命周期的每個階段,包括開發(fā)和將應(yīng)用部署到生產(chǎn)中,具體工具包括用于構(gòu)建有狀態(tài)代理的LangGraph、用于檢查和監(jiān)控鏈的LangSmith,以及開源構(gòu)建塊、組件和第三方集成。
GitHub上提供了具體的LangChain工具,包括MIT許可下的框架本身。
7. MindsDB
MindsDB是一個開源虛擬數(shù)據(jù)庫和開發(fā)平臺,可以自動執(zhí)行把實時數(shù)據(jù)連接到AI系統(tǒng)的工作流程。該軟件讓使用SQL查詢構(gòu)建、訓(xùn)練和部署機器學(xué)習(xí)模型變得更加容易。
該軟件的開發(fā)商MindsDB成立于2017年,總部位于美國舊金山。據(jù)該公司網(wǎng)站顯示,其開源軟件的使命是使機器學(xué)習(xí)民主化。為了實現(xiàn)這一目標(biāo),MindsDB公司在2023年9月推出了MindsDB AI Collective,一個由AI初創(chuàng)公司和開發(fā)者組成的網(wǎng)絡(luò),他們正在推進(jìn)開源機器學(xué)習(xí)和AI項目,連接投資方、技術(shù)援助和人才資源。
MindsDB公司是Y Combinator資助的眾多開源技術(shù)初創(chuàng)公司之一。
MindsDB軟件在開源MIT許可下可用,軟件的核心組件MindsDB Core則專門采用了Elastic v2許可。
8. OpenFoundry
OpenFoundry平臺為開源AI項目提供了開發(fā)者基礎(chǔ)設(shè)施。據(jù)稱,該技術(shù)可以幫助工程師以10倍的速度構(gòu)建、部署和擴展他們的開源AI“堆?!保斓匕l(fā)布開源、AI驅(qū)動的產(chǎn)品。
OpenFoundry公司是由其首席執(zhí)行官Tyler Lehman(曾任Meta的產(chǎn)品經(jīng)理)和首席技術(shù)官Arthur Chi(Slack的軟件工程師)在今年創(chuàng)立的,也是由Y Combinator資助的開源技術(shù)初創(chuàng)公司。
Y Combinator網(wǎng)站上的OpenFoundry頁面將該初創(chuàng)公司宣傳為Hugging Face機器學(xué)習(xí)和數(shù)據(jù)科學(xué)平臺的開源替代品。OpenFoundry在GitHub上以MIT許可的形式提供。
9. OpenZiti
根據(jù)www.openziti.io網(wǎng)站顯示,OpenZiti是一個免費的開源項目,專注于將零信任網(wǎng)絡(luò)原則直接引入任何應(yīng)用。該平臺提供了實現(xiàn)零信任覆蓋網(wǎng)絡(luò)所需的所有組件,為開發(fā)人員提供了把零信任集成到應(yīng)用中所需的所有工具。
根據(jù)該網(wǎng)站的說法,OpenZiti項目“認(rèn)為零信任原則不應(yīng)該止步于您的網(wǎng)絡(luò),這些想法應(yīng)該融入您的應(yīng)用中”。
OpenZiti在Apache 2.0許可下提供,可通過OpenZiti.io網(wǎng)站和GitHub下載。
OpenZiti的組件包括The Fabric,一個具有內(nèi)置智能路由的可擴展覆蓋網(wǎng)絡(luò)網(wǎng)格;The Edge,為覆蓋網(wǎng)絡(luò)提供安全入口點的組件;SDK,讓開發(fā)人員把零信任原則嵌入應(yīng)用中;Tunneling技術(shù),為無法內(nèi)置零信任的應(yīng)用搭建橋梁。
10. Twenty
初創(chuàng)公司Twenty正在執(zhí)行一項大膽的任務(wù),即開發(fā)一款基于SaaS的開源CRM應(yīng)用,以提供一個對應(yīng)用巨頭Salesforce的現(xiàn)代化替代方案。
Twenty在其網(wǎng)站上表示,該軟件提供了一個用于管理客戶數(shù)據(jù)的操作系統(tǒng),提供了領(lǐng)先的CRM系統(tǒng)所具備的所有功能,包括任務(wù)和“看板視圖”工作流可視化。
該應(yīng)用仍處于早期的“alpha”開發(fā)階段,但可以從該公司網(wǎng)站和GitHub獲取(在GNU Affero General Public License許可下),供想要查看的人使用。
最新版本0.32.0是在11月3日發(fā)布的,其中包含了很多新增功能和增強功能,包括更強大的搜索、webhook過濾器和webhook多對象過濾、高級設(shè)置和新設(shè)置布局、軟刪除功能、以及用于存儲非預(yù)定義值的新數(shù)組字段類型。
Twenty公司成立于2023年,總部位于美國舊金山,獲得了Y Combinator的資助。