作者丨Niels Claeys
編譯丨諾亞
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
與許多公司類似,我們?yōu)楫a(chǎn)品中使用的所有組件構(gòu)建docker映像。隨著時(shí)間的推移,其中一些映像變得越來越大,我們的CI構(gòu)建花費(fèi)的時(shí)間也越來越長。我的目標(biāo)是CI構(gòu)建不超過5分鐘——差不多是喝杯咖啡休息的理想時(shí)間。如果構(gòu)建花費(fèi)的時(shí)間超過這個(gè)時(shí)間,就會(huì)降低開發(fā)人員的工作效率。
造成生產(chǎn)力損失的原因是:
1、開發(fā)人員需要等待構(gòu)建完成,從而浪費(fèi)時(shí)間。
2、開發(fā)人員開始做一些新的東西,并在晚些時(shí)候再回來做。切換必然耗時(shí),這通常也會(huì)導(dǎo)致效率低下。
圖片
在這篇文章中,我想說明我們應(yīng)用的2個(gè)小變化,兩者極大地改善了我們的構(gòu)建時(shí)間。當(dāng)然,在關(guān)注這些改進(jìn)之前,請確保你已經(jīng)遵循編寫dockerfile的最佳實(shí)踐,比如盡量減少層數(shù);使用多級(jí)構(gòu)建;使用最小的基礎(chǔ)圖像等等。
1、Buildkit vs Buildx
讓我們從解釋Buildkit和Buildx開始,因?yàn)檫@兩個(gè)術(shù)語經(jīng)?;Q使用,但它們并不相同。
Builkit
Buildkit是經(jīng)過改進(jìn)的后端,用來取代舊的Docker構(gòu)建器。它在2018年打包在Docker中,并成為docker engine 23.0的默認(rèn)構(gòu)建器。
它提供了許多有趣的功能:
- 改進(jìn)的緩存功能
- 并行構(gòu)建不同的層
- 延遲拉取基礎(chǔ)鏡像(≥Buildkit 0.9)
在使用Buildkit時(shí),你很快就會(huì)注意到docker構(gòu)建命令的輸出看起來更清晰、更結(jié)構(gòu)化。
在docker版本低于23.0的情況下使用Buildkit的典型方法是設(shè)置Buildkit參數(shù)。如下所示:
DOCKER_BUILDKIT=1 docker build --platform linux/amd64 . -t someImage:someVersion
DOCKER_BUILDKIT=1 docker push someImage:someVersion
Buildx
Buildx是Docker的一個(gè)插件,它使你能夠在Docker中使用Buildkit的全部潛力。之所以創(chuàng)建它,是因?yàn)锽uildkit支持許多新的配置選項(xiàng),這些選項(xiàng)不能全部以向后兼容的方式集成到docker構(gòu)建命令中。
除了構(gòu)建鏡像之外,Buildx還支持管理多個(gè)構(gòu)建器。在CI中,這對于定義具有不同配置的作用域環(huán)境非常有用,因?yàn)樗鼈儾粫?huì)修改共享Docker守護(hù)進(jìn)程。
你可以像下面這樣開始使用Buildx:
docker buildx create --bootstrap --name builder
docker buildx use builder
2、受益于遠(yuǎn)程緩存
加快構(gòu)建速度的第一種方法是在遠(yuǎn)程注冊表中緩存鏡像。這樣,即使在不同的機(jī)器上執(zhí)行構(gòu)建,也可以從構(gòu)建緩存中獲益,這是CI中的典型情況。作為一種解決方法,許多人在構(gòu)建新映像版本之前提取了映像的最新版本。這樣做的好處是,你可以緩存未更改的圖層,而代價(jià)是最初提取完整的圖像。拉取完整的圖像可能需要一段時(shí)間,但也不能保證圖層可以被重用。為了說明這一點(diǎn),我們使用了以下命令:
圖片
使用Buildx,你可以將緩存信息存儲(chǔ)在遠(yuǎn)程位置(例如容器注冊表、blob存儲(chǔ)等)。構(gòu)建器檢查給定層是否已經(jīng)存在,如果是這種情況,它將重用它而不是再次創(chuàng)建它。這甚至可以在不拉動(dòng)本地圖層的情況下完成。為了從這個(gè)機(jī)制中受益,我們將之前的命令修改為:
圖片
模式“max”意味著我們將存儲(chǔ)每一層的構(gòu)建信息,甚至是生成圖像中未使用的層(例如,當(dāng)使用多階段構(gòu)建時(shí))。默認(rèn)模式下使用“min”,它只存儲(chǔ)最終映像中存在的層的構(gòu)建信息。
緩存的一個(gè)特殊情況是“內(nèi)聯(lián)”存儲(chǔ)緩存數(shù)據(jù),這意味著它將與圖像一起緩存。當(dāng)使用Buildkit而不使用Buildx時(shí),也支持此選項(xiàng)。它是最容易開始的,但在使用多階段構(gòu)建時(shí)就比較棘手了,而且它沒有在工件輸出和緩存之間提供明確的分離。內(nèi)聯(lián)存儲(chǔ)緩存數(shù)據(jù)的命令如下:
圖片
3、添加文件到Docker鏡像的新方法
Docker引入了新的dockerfile編寫語法,即:
#syntax= docker /dockerfile:1.4。它支持COPY和ADD命令的額外鏈接選項(xiàng)。
以前,當(dāng)你使用COPY或ADD命令時(shí),構(gòu)建器會(huì)創(chuàng)建一個(gè)新快照,它將新文件與現(xiàn)有文件系統(tǒng)合并。其結(jié)果是,在執(zhí)行此操作之前,父層都需要存在,否則目標(biāo)目錄可能還不存在。最后,你的映像(構(gòu)建命令的結(jié)果)將由每個(gè)層的tarball組成,其中包含各個(gè)快照之間的差異。
圖片
當(dāng)使用link選項(xiàng)時(shí),新文件將被放入它們自己的快照中,而不依賴于以前的層。鏈接的文件存儲(chǔ)在它們自己的tarball中,不同的tarball被鏈接在一起,不依賴于現(xiàn)有的文件系統(tǒng),如下圖所示。
https://www.docker.com/blog/image-rebase-and-improved-remote-cache-support-in-new-buildkit/
圖片
主要優(yōu)點(diǎn)是文件不再依賴于以前的層。只要文件沒有改變,即使父層改變了,層也可以被重用。
此外,這還可以提高構(gòu)建的速度,因?yàn)楝F(xiàn)在可以并行執(zhí)行多層復(fù)制數(shù)據(jù)。
4、結(jié)論
本文描述了我們在優(yōu)化CI管道后獲得的一些新見解。我討論了2個(gè)小的變化,導(dǎo)致我們的整體docker構(gòu)建時(shí)間減少了40%:其一,遠(yuǎn)程存儲(chǔ)構(gòu)建緩存信息;其二,在添加、復(fù)制文件到docker鏡像時(shí)使用link選項(xiàng)。
參考鏈接:https://medium.com/datamindedbe/how-we-reduced-our-docker-build-times-by-40-afea7b7f5fe7