MLSQL 正式更名 Byzer ,打造新一代開(kāi)源語(yǔ)言生態(tài)
12月21日,開(kāi)源項(xiàng)目MLSQL 宣布正式更名為 Byzer。Byzer 將秉持 MLSQL 低成本落地 Data + AI 的技術(shù)初衷,并融合更加開(kāi)放且多元的語(yǔ)言及產(chǎn)品能力,打造更加完善的新一代開(kāi)源語(yǔ)言生態(tài)。與此同時(shí),全新的 Byzer 開(kāi)源社區(qū)正式成立,社區(qū)官網(wǎng)(https://www.byzer.org) 也已同步上線,歡迎大家積極訪問(wèn)。
全新的 Byzer 以及 Byzer 開(kāi)源社區(qū)
Byzer 這一名稱源于中國(guó)古代神獸「白澤」,其能言語(yǔ),通萬(wàn)物之情,知鬼神之事。我們希望 Byzer 可以像神獸白澤一樣,讓數(shù)據(jù)說(shuō)「人」話。
Byzer 是一門結(jié)合了聲明式編程和命令式編程的混合編程語(yǔ)言,其低代碼且類 SQL 的編程邏輯配合內(nèi)置算法及插件的加持,能幫助數(shù)據(jù)工作者們高效打通數(shù)據(jù)鏈路,完成數(shù)據(jù)的清洗轉(zhuǎn)換,并快速地進(jìn)行機(jī)器學(xué)習(xí)相關(guān)的訓(xùn)練及預(yù)測(cè)。Byzer 語(yǔ)言的關(guān)鍵詞如下:
- 萬(wàn)物皆表(Everything is a table)
- 類 SQL 語(yǔ)法(SQL-like Language)
- 內(nèi)置算法和插件(Built-in algorithms and plugins)
- 可定制,簡(jiǎn)單,強(qiáng)大(Customizable, Simple and Powerful)
Byzer 社區(qū)主要圍繞 Byzer 語(yǔ)言來(lái)打造面向 Data + AI 領(lǐng)域的開(kāi)源生態(tài),旨在幫助用戶以低成本和高效率的方式落地?cái)?shù)據(jù)平臺(tái)和完成 AI 工程化,釋放分析師、工程師以及運(yùn)維人員的生產(chǎn)力。目前 Byzer 社區(qū)內(nèi)的項(xiàng)目均采用 Apache License V2 發(fā)行,允許所有社區(qū)參與者在該協(xié)議下進(jìn)行自由使用。
我們?yōu)槭裁葱枰?Byzer
隨著大數(shù)據(jù)、人工智能、云計(jì)算等技術(shù)的迅速發(fā)展,云基礎(chǔ)設(shè)施、基礎(chǔ)軟件、算法模型等都逐漸完善和成熟,業(yè)界對(duì)數(shù)據(jù)平臺(tái)的效率訴求是越來(lái)越高,低效的跨平臺(tái)數(shù)據(jù)運(yùn)轉(zhuǎn)逐漸成為工程師落地?cái)?shù)據(jù)平臺(tái)和完成 AI 工程化的痛點(diǎn)。但是,無(wú)論是從更換基礎(chǔ)設(shè)施入手,還是換上更易用的框架,又或是招聘更優(yōu)秀的研發(fā)人才,都無(wú)法做到大幅度的效率提升。
我們相信只有在編程語(yǔ)言層面進(jìn)行革新,才能從根本上提高數(shù)據(jù)平臺(tái)落地和 AI 工程化的效率。Byzer 作為一門低代碼的開(kāi)源編程語(yǔ)言,可以在語(yǔ)言層面將數(shù)據(jù)處理鏈路、AI 工程中的復(fù)雜操作以及權(quán)限管控進(jìn)行抽象,同時(shí)降低編程語(yǔ)言的學(xué)習(xí)成本和上手成本,從而幫助企業(yè)真正將效率提升上來(lái)。
Byzer 語(yǔ)言設(shè)計(jì)理念
在抽象業(yè)務(wù)能力的時(shí)候,數(shù)據(jù)的處理和流轉(zhuǎn)承載著信息傳遞的核心任務(wù),而數(shù)據(jù)的載體往往就是二維數(shù)據(jù)表或多維數(shù)據(jù)表,SQL 語(yǔ)言其實(shí)就是抽象在二維數(shù)據(jù)表上的各種數(shù)據(jù)操作。Byzer 語(yǔ)言的核心設(shè)計(jì)是萬(wàn)物皆表(Everything is a table),我們希望用戶可以非常容易的將任何實(shí)體對(duì)象通過(guò) Byzer 來(lái)抽象成二維表,從而能夠基于表來(lái)進(jìn)行數(shù)據(jù)處理或模型訓(xùn)練等進(jìn)一步操作。
1. 聲明式融合命令式的語(yǔ)言設(shè)計(jì),SQL-like 語(yǔ)法簡(jiǎn)單又靈活
在語(yǔ)言設(shè)計(jì)層面,Byzer 采用了聲明式編程設(shè)計(jì),使用類 SQL 的語(yǔ)法,開(kāi)發(fā)者更容易學(xué)習(xí)和使用。但是聲明式設(shè)計(jì)又缺乏一些靈活性,無(wú)法滿足一些很復(fù)雜的編程需求,所以 Byzer 在聲明式設(shè)計(jì)的基礎(chǔ)上又結(jié)合了命令式編程設(shè)計(jì)來(lái)對(duì) SQL-like 的語(yǔ)法進(jìn)行擴(kuò)展。
2. 云原生設(shè)計(jì),充分利用云上算力和便宜的存儲(chǔ)
在云基礎(chǔ)設(shè)施日趨成熟的今天,無(wú)論是基礎(chǔ)軟件還是上層應(yīng)用,用戶都十分關(guān)注可擴(kuò)展性,Byzer 在 Day1 的設(shè)計(jì)就是云原生設(shè)計(jì),不僅能夠利用云上便宜的存儲(chǔ),同時(shí)原生分布式引擎(Spark 引擎和可插拔 Ray引擎)的設(shè)計(jì),可以讓 Byzer 充分利用云上算力。
3. 一套語(yǔ)言,一個(gè)引擎,覆蓋 Data + AI 的能力,開(kāi)箱即用
企業(yè)在落地?cái)?shù)據(jù)平臺(tái)或者 AI 工程時(shí),往往面臨著選型難的問(wèn)題,對(duì)于數(shù)據(jù)工程師來(lái)講,更是需要了解、學(xué)習(xí)、開(kāi)發(fā)和維護(hù)整個(gè)數(shù)據(jù)處理鏈路中的各個(gè)組件,上手成本和維護(hù)成本都很高。Byzer 希望能夠提供一套語(yǔ)言、一個(gè)引擎,就能覆蓋整個(gè)數(shù)據(jù)鏈路,同時(shí)可以提供各種算法、模型訓(xùn)練等開(kāi)箱即用的能力。
Byzer 在 12 月 15 日正式發(fā)布了 Byzer 2.2.0 版本,歡迎大家試用和反饋。
IDE 支持 - Byzer Notebook
Byzer 作為一門語(yǔ)言,需要能夠支持 IDE 或者文本編輯器,完成諸如代碼高亮,代碼提示,運(yùn)行等能力。目前比較流行的方式是實(shí)現(xiàn) LSP(Language Server Protocol),各類主流編輯器或者 IDE 就可以基于 LSP 的協(xié)議來(lái)實(shí)現(xiàn)相關(guān)的功能。Byzer 實(shí)現(xiàn)了 LSP 協(xié)議并提供了 code suggest API,用戶可以自行開(kāi)發(fā)相關(guān)的編輯器插件來(lái)支持 Byzer 開(kāi)發(fā)。
Byzer Notebook 是由 Kyligence 開(kāi)發(fā)并貢獻(xiàn)到社區(qū)的一個(gè)基于 Byzer 的 Web IDE。具備以下主要特性:
- 擁有強(qiáng)大的交互編譯能力,支持代碼高亮、代碼提示等功能;
- 提供穩(wěn)定可靠的數(shù)據(jù)工程能力,支持多數(shù)據(jù)源的表進(jìn)表出和 AI 模型的訓(xùn)練與發(fā)布;
- 支持 Notebook 和 Workflow 的形式給用戶提供低代碼、交互式編程的能力。
除了 Byzer Notebook 外,社區(qū)還開(kāi)發(fā)了 Byzer 語(yǔ)言的 VSCode 插件,用戶在 VSCode 中就可以編寫(xiě)運(yùn)行 Byzer 代碼了。
Byzer Notebook 在 12 月 15 日正式發(fā)布了 Byzer Notebook 1.0.0 版本,歡迎大家試用和反饋。
真誠(chéng)邀請(qǐng)您共建社區(qū)
Byzer 社區(qū)作為一個(gè)新興的開(kāi)源社區(qū),非常歡迎大家來(lái)參與和貢獻(xiàn)。目前 Byzer 已經(jīng)獲得了不少生產(chǎn)客戶,數(shù)據(jù)團(tuán)隊(duì)選用 Byzer 后僅需少量的開(kāi)發(fā)人員就可以支撐整個(gè)數(shù)據(jù)平臺(tái),詳情可以關(guān)注 Byzer 社區(qū)的Meetup 活動(dòng)以及官方公眾號(hào)等渠道。
除了代碼貢獻(xiàn)外,社區(qū)也歡迎其他形式的參與,比如提 Feature Request、貢獻(xiàn)文檔、視頻教學(xué)、編寫(xiě)博客,擔(dān)任講師,以及協(xié)助社區(qū) Meetup 活動(dòng)等,更多詳情可以看如何貢獻(xiàn) Byzer 社區(qū),期待和大家一起共建一個(gè) Geek 且充滿想象力的社區(qū)!
- 社區(qū):https://github.com/byzer-org
- 官網(wǎng):https://byzer.org/home
- 文檔:https://docs.byzer.org
- Roadmap:https://github.com/byzer-org/.github/blob/main/roadmap/2022h1.md
同時(shí)也非常歡迎大家關(guān)注我們的微信公眾號(hào)