自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

聊一聊構建的抽象

開發(fā) 后端
不同編程語言編寫的應用,在它運行的狀態(tài)下,會有不同的運行機制,有的是以二進制的方式運行的,有運行在編程語言的虛擬機之上。而構建所做的事情呢,就是將那些我們寫給人類看的代碼,轉換為機器/程序能看懂的代碼。

[[341120]]

 最近,在研究 Gradle 和 Java 相關構建的實現,讓我對不同編程語言的應用構建燃起了一點點的興趣。

不同編程語言編寫的應用,在它運行的狀態(tài)下,會有不同的運行機制,有的是以二進制的方式運行的,有運行在編程語言的虛擬機之上。而構建所做的事情呢,就是將那些我們寫給人類看的代碼,轉換為機器/程序能看懂的代碼。所以,構建的本質就是翻譯(~~復讀機~~)。

PS:本文旨在嘗試性的整理我所了解的構建知識。部分內容限于對某一些編程語言的理解有限,并非非常準確。如有偏頗之此,希望大家指正。

引子 1:從 Java 的編譯說起

絕大多數程序員都是從 hello, world! 開始自己復制、粘貼的人生生涯。對于那些剛上手 Java 的程序員也是類似的:

  1. javac HelloWorld.java 

而當我們依賴于其它的軟件包時,就需要在編譯時和運行時加入 classpath 來加入依賴項。于是,對應的運行命令就如下所示:

  1. java -classpath .:libs/joda-time-2.10.6.jar HelloWorld 

這樣,我們就能得到預期的結果了:

  1. Hello, World 
  2. Millisecond timein.getMillis(): 1599284014762 

而如果我們需要打成 jar 包就需要一個復雜一點的過程:

  1. jar cvfm hello.jar manifest.txt HelloWorld.class libs/* 

這個過程中,涉及到幾個關鍵的要素:

工具鏈。即 java 和 javac,以及對應的 Runtime 等。

構建過程。即我要先執(zhí)行 javac 進行編譯,再通過 java 命令來啟動應用。

依賴管理。即我們的 joda-time-2.10.6.jar 的位置獲取等問題,以及在打包時加入的過程。

源碼配置。即轉換過程中的 class 和 java

過程中的輸入和輸出。

引子 2:任務及任務的輸入和輸出

對于一個制品的構建來說,我們往往會把它拆分為一系列的任務,每個任務有自己的輸入和輸出。當輸入發(fā)生變化的時候,需要變化對應的輸出。緊接著,我們只需要對任務進行編排即可:

  1. exports.build = series( 
  2. clean, 
  3. parallel( 
  4. cssTranspile, 
  5. series(jsTranspile, jsBundle) 
  6. ), 
  7. parallel(cssMinify, jsMinify), 
  8. publish 
  9. ); 

如上展示的是:哪些任務可以并行,哪些任務需要按順序執(zhí)行——也可以認為是任務的依賴。

當然了,還有一種任務是 watch 任務,只用于開發(fā)時,而非構建時。如下是 Node.js 中的 Gulp 構建工具的文件監(jiān)控示例:

  1. function javascript(cb) { 
  2. // body omitted 
  3. cb(); 
  4.  
  5. function scss(cb) { 
  6. // body omitted 
  7. cb(); 
  8.  
  9. watch('src/*.scss', scss); 
  10. watch('src/*.js', series(javascript)); 

兩間結合之下,我們就會看到增量任務的概念:只針對修改的部分進行編譯,以提升構建效率。在這方面做得比較好的就是 Gradle ,看個官方的示例InputChanges:

  1. abstract class IncrementalReverseTask extends DefaultTask { 
  2. @Incremental 
  3. @InputDirectory 
  4. abstract DirectoryProperty getInputDir() 
  5.  
  6. @OutputDirectory 
  7. abstract DirectoryProperty getOutputDir() 
  8.  
  9. @TaskAction 
  10. void execute(InputChanges inputChanges) { 
  11. inputChanges.getFileChanges(inputDir).each { change -> 
  12. if (change.fileType == FileType.DIRECTORY) return 
  13.  
  14. def targetFile = outputDir.file(change.normalizedPath).get().asFile 
  15. if (change.changeType == ChangeType.REMOVED) { 
  16. targetFile.delete() 
  17. else { 
  18. targetFile.text = change.file.text.reverse() 

同樣的,它也需要我們監(jiān)控對應的輸入和輸出。稍有不同的是,Gradle 會對文件進行索引,每次只提供變化的部分,讓我們根據自己的實際需要進行處理。

增量構建相關資源:

  • tup 是用于 Linux、OSX 和 Windows 的基于文件的構建系統(tǒng)。它輸入文件的更改列表和有向無環(huán)圖(DAG),然后處理DAG 以執(zhí)行更新依賴文件所需的適當命令。
  • ninja 是一個專注于速度的小型構建系統(tǒng),類似于GNU Make。
  • SCons 是一套由Python 語言編寫的開源構建系統(tǒng),類似于GNU Make。

引子 3:可選的依賴管理(地獄)

關于依賴的管理槽點,我已經寫過一系列的文章,諸如于:管理依賴的 11 個策略、依賴孿生:低成本的依賴安全方案。

單純從構建這件事情上,對于依賴的管理是可有可無的。出現這個狀況的主要原因是:歷史上的編程語言都不考慮這個問題。所以,在古老的 C/C++ 語言中,構建系統(tǒng)就是一個頭疼的問題。當然了,新晉的 Golang 也缺少良好的設計。

好在,對于依賴管理來說,這個過程并不復雜:

  1. 包命名和版本機制
  2. 包管理服務器
  3. 構建和運行時的依賴管理
  4. 包沖突處理
  5. ……

構建的抽象

好了,有了上面的這一系列基礎知識之后,接下來我們就可以看看不同的構建系統(tǒng)里,對于同一概念的抽象,整合了 Bazel、Gradle、Cargo、NPM 等之后有了一個基礎的抽象層次:

  • 工作空間(workspace)。工作空間是一個或者多個軟件包的集成,它們可以共享依賴、輸出目錄配置等等。典型的有 Java 中的 Gradle settings.gradle、Rust 中的 Cargo 的 Cargo.toml 等。
  • 倉庫。倉庫可以映射到 Git 的 repository 中,代表一個可獨立構建的軟件。
  • 包。最小的可執(zhí)行單位的項目結構。
  • 包布局。對應于不同的語言、構建系統(tǒng)來說,它用于定義代碼的存放位置和結構。
  • 制品。即構建產生的產物,可能是可復用的軟件包,也可能是可運行的應用。
  • 任務。定義構建的規(guī)則,并執(zhí)行。

FAQ

為什么是沒有項目?在業(yè)務領域和技術領域,我們對于項目的定義存在著一定的歧義性。為了減少二義性,我們使用工作空間 + 倉庫來解決這個問題。工作空間可以視為一個完整的業(yè)務項目。而倉庫呢,則是單一個的代碼庫,可能是一個庫,也可能是包含庫的完整工程。

現有的最佳方案是 Bazel。

工作區(qū)

工作空間是一個或者多個軟件包的集成,它們可以共享依賴、輸出目錄配置等等。典型的有 Java 中的 Gradle settings.gradle、Rust 中的 Cargo 的 Cargo.toml 等。

我們可以將其視為最終的產物,如 Android 生成的 APK,Rust 最后生成的可執(zhí)行文件。過程中,生成的共享的包都是為了支持這個工程的一部分。

先看 CMakeLists.txt 的目錄,我們在工作區(qū)的根節(jié)點,定義了這個工程,并添加了 projectA 和 projectB。

  1. cmake_minimum_required(VERSION 3.2.2) 
  2. project(globalProject) 
  3.  
  4. add_subdirectory(projectA) 
  5. add_subdirectory(projectB) 

以用于生成最后的構建產物。相似的還有 Rust 中的 workspace:

  1. [workspace] 
  2.  
  3. members = [ 
  4. "adder"

又或者是前端的 Yarn 中的工作區(qū):

  1. "private"true
  2. "workspaces": ["workspace-a""workspace-b"

它們做的都是相同的事情。

倉庫

這個概念的再提取是來源于 Bazel。倉庫是一系列包的合集,我們可以將其視為團隊的邊界,從某種意義上可以看作是代碼倉庫。對于一個龐大的工程來說,它的代碼來源是多種多樣的,來自組織內的其它團隊,來自組織外的其它團隊。每個獨立的部分,即是一個倉庫。

值得注意的是,從最終產物來看,每個團隊的產出都是倉庫,但是呢,在團隊內部,他們就是工作區(qū)。

讓我們看個 Gradle 的多項目構建示例(Android 工程):

  1. ├── README.md 
  2. ├── library_a 
  3. ├── app 
  4. │   ├── build.gradle 
  5. │   └── src 
  6. ├── build.gradle 
  7. ├── local.properties 
  8. ├── settings.gradle 
  9. └── third-partys 
  10. ├── ... 
  11. ├── build.gradle 
  12. └── settings.gradle 

從目錄結構來看,這個是一個工作區(qū),而在工作區(qū)呢,它包含了一些三方的代碼倉庫(third-partys),以及自身的庫 library_a 和應用 app。

因此,在這里的 library_a 和 third-partys 的各個項目都算是倉庫。

包是一系列代碼的合集,它可大可小。最主要的原因在于,因為構建時,我們可能會把一個倉庫(哪怕是最小的 Gradle 項目)產出多個包,如 Java 項目中的 src/main 和 src/test。

于是在諸如 bazel 這樣的構建工具中,支持自定義的包:

  1. src/my/app/BUILD 
  2. src/my/app/app.cc 
  3. src/my/app/data/input.txt 
  4. src/my/app/tests/BUILD 
  5. src/my/app/tests/test.cc 

對于一個包來說,往往我們還需要定義一系列的相關信息,如包名、依賴信息、入口等等。如 Bazel 中對于 Java 構建的示例:

  1. java_binary( 
  2. name = "ProjectRunner"
  3. srcs = ["src/main/java/com/phodal/ProjectRunner.java"], 
  4. main_class = "com.phodal.ProjectRunner"
  5. deps = [":greeter"], 

這已經實現了對于不同包的信息抽象。順帶的再看個 Java 包中的 MANIFEST 的示例:

  1. Main-Class: HelloWorld 
  2. Class-Path: libs/joda-time-2.10.6.jar 

我們就可以知道之間的聯系。

包定義

在打包階段,我們以簡單的形式定義了這個包——因為它并非那么重要,我們也不關心。而當我們決定發(fā)布這個包到互聯網時,我們就需要好好定義這個包。對應的一些必要信息有:

  • name
  • version
  • authors
  • license
  • description
  • ……

這些信息用于在包管理中心展示,并向使用者提供包相關的信息等。不同的語言中使用的是不同的形式,Rust 使用了自定義的 toml,而諸如 Maven 倉庫中則使用了 XML:

  1. <groupId>...</groupId> 
  2. <artifactId>...</artifactId> 
  3. <version>...</version> 
  4. <packaging>...</packaging> 
  5. <dependencies>...</dependencies> 
  6. <name>...</name
  7. <description>...</description> 

類似的在 NPM 的 package.json 中也使用了類似的字段: name、 verison 等信息。

而在這些編程語言中,這個東西就設計得過于簡單了,如 Python 的 pip 中使用的 requirements.txt 來管理依賴,當你要發(fā)布包的時候使用 setup.py 進行配置。于是,你的應用如果不發(fā)布,那就沒有包名了……。

包布局

構建工具在設計的時候,會設計默認的軟件包分層結構,這個分層架構就是包布局(package layout)。構建工具通過這個布局,來獲取所需的輸入源和配置等信息。它也包含了一些默認的配置,如 src/main 指向了源碼的目錄, src/test 指向的是測試代碼(不會加入到制品中)

  1. ├── build.gradle 
  2. └── src 
  3. ├── main 
  4. └── test 

對于使用者來說,它們也可以針對于它們的需要擴展這個布局,如 Gradle 里的 SourceSets:

  1. sourceSets { 
  2. main { 
  3. output.resourcesDir = file('out/bin'
  4. java.outputDir = file('out/bin'

對于其它語言也是類似的。但是呢,對于某些語言來說,并非有這么強的關聯,如在 Golang 中,就沒有這么強的約束。只是呢,原先是默認值,現在需要開發(fā)人員來手動配置。

制品

制品是最終的構建產物。同樣的,在不同的語言中有不同的命名方式。在 Gradle 中稱為 artifacts,在 Rust 中稱為 targets……。制品,主要涉及到的是各種文件的流轉及其流轉規(guī)則。

舉個簡單的例子,一個 jar 文件中必須包含一個 MANIFEST.MF,以用于配置應用程序、擴展和類裝載器等相關信息。而相關的文件又會以 META-INF 的方式組織起來。

因此在整個制品的創(chuàng)建過程中,就是復制對應的文件,進行相應的轉換,如 java -> .class,再復制到對應的目錄,最后再打包在一起的過程。

任務:規(guī)則引擎 + DSL

在上述我們看到的例子中,很多就是創(chuàng)建了自身的 DSL,而后用于構建。只有這樣才能讓使用者得到最大的方便。這是一個相當復雜的過程,它相當于我們要設計一個和平臺、語言無關的 DSL。而這種演變方式有多種:

使用 API 抽象的內部 DSL。諸如于 Webpack、Gulp 等實現。

自制的外部 DSL 語言。如 Gradle 所使用的 Groovy、多語言的 Bazel。

規(guī)則引擎本身是一組關于任務的 DSL,看個 Gradle 的例子:

  1. task copyReportsDirForArchiving2(type: Copy) { 
  2. from("$buildDir") { 
  3. include "reports/**" 
  4. into "$buildDir/toArchive" 

它所做的事情就是復制。對應的 Gradle 打包示例也是蠻簡單的 DSL 抽象:

  1. task packageDistribution(type: Zip) { 
  2. archiveFileName = "my-distribution.zip" 
  3. destinationDirectory = file("$buildDir/dist"
  4.  
  5. from "$buildDir/toArchive" 

Gradle 使用的就是外部 DSL。再看看 Webpack 的打包示例:

  1. module.exports = { 
  2. entry: './path/to/my/entry/file.js'
  3. output: { 
  4. filename: 'my-first-webpack.bundle.js'
  5. path: path.resolve(__dirname, 'dist'
  6. }, 
  7. module: { 
  8. rules: [ 
  9. test: /\.(js|jsx)$/, 
  10. use: 'babel-loader' 
  11. }, 
  12. plugins: [ 
  13. new webpack.ProgressPlugin(), 
  14. new HtmlWebpackPlugin({template: './src/index.html'}) 
  15. }; 

這里的 rules 就是一個簡單的規(guī)則引擎(使用正則表達式來匹配)

兩種模式各自有自己的優(yōu)缺點,復雜場景下,使用 DSL + 自定義的腳本更容易完成。

PS:看來有空,我也應該寫一個的規(guī)則引擎

構建的擴展

對于主流的構建系統(tǒng)來說,他們都支持不同形式的擴展支持:

  1. 外部 DSL 擴展
  2. 插件化的接口編程
  3. 項目內編程語言擴展
  4. 項目外編程語言擴展

大部分的東西,我們已經在文中的先前部分提到了,這里就不重復描述了。

結論

應用的構建是一個相當有意思的過程。

設計一個構建系統(tǒng)也變得頗為有趣的。

參考資料:

  • Gradle vs Bazel for JVM Projects
  • Bazel: Concepts and terminology
  • Yarn: Workspaces
  • Gradle: Authoring Multi-Project Builds
  • Cargo: Workspaces
  • Gulp: Tasks

相關目的開源庫:

  • lerna A tool for managing JavaScript projects with multiple packages.
  • bazel
  • Blueprint is a meta-build system that reads in Blueprints files that describe modules that need to be built, and produces a Ninja manifest describing the commands that need to be run and their dependencies.

本文轉載自微信公眾號「phodal」,可以通過以下二維碼關注。轉載本文請聯系phodal公眾號。

 

責任編輯:武曉燕 來源: Phodal
相關推薦

2021-11-24 22:47:07

Docker開發(fā)容器

2023-07-06 13:56:14

微軟Skype

2021-01-28 22:31:33

分組密碼算法

2023-09-22 17:36:37

2020-05-22 08:16:07

PONGPONXG-PON

2018-06-07 13:17:12

契約測試單元測試API測試

2021-08-01 09:55:57

Netty時間輪中間件

2023-09-27 16:39:38

2024-10-28 21:02:36

消息框應用程序

2021-12-06 09:43:01

鏈表節(jié)點函數

2021-03-01 18:37:15

MySQL存儲數據

2023-09-20 23:01:03

Twitter算法

2021-07-16 11:48:26

模型 .NET微軟

2021-08-04 09:32:05

Typescript 技巧Partial

2022-08-08 08:25:21

Javajar 文件

2022-11-01 08:46:20

責任鏈模式對象

2018-11-29 09:13:47

CPU中斷控制器

2019-02-13 14:15:59

Linux版本Fedora

2021-01-29 08:32:21

數據結構數組

2021-02-06 08:34:49

函數memoize文檔
點贊
收藏

51CTO技術棧公眾號