一文讀懂Base64
本文轉(zhuǎn)載自微信公眾號「全棧修仙之路」,作者阿寶哥。轉(zhuǎn)載本文請聯(lián)系全棧修仙之路公眾號。
一、為什么要使用 base64
我們知道一個字節(jié)可表示的范圍是 0 ~ 255(十六進(jìn)制:0x00 ~ 0xFF), 其中 ASCII 值的范圍為 0 ~ 127(十六進(jìn)制:0x00 ~ 0x7F);而超過 ASCII 范圍的 128~255(十六進(jìn)制:0x80 ~ 0xFF)之間的值是不可見字符。
ASCII(American Standard Code for Information Interchange,美國信息交換標(biāo)準(zhǔn)代碼)是基于拉丁字母的一套電腦編碼系統(tǒng)。它主要用于顯示現(xiàn)代英語,而其擴(kuò)展版本延伸美國標(biāo)準(zhǔn)信息交換碼則可以部分支持其他西歐語言,并等同于國際標(biāo)準(zhǔn) ISO/IEC 646。
在 ASCII 碼中 0 - 31和 127 是控制字符,共 33 個。以下是其中一部分控制字符:
其余 95 個,即 32 - 126 是可打印字符,包括數(shù)字、大小寫字母、常用符號等。
當(dāng)不可見字符在網(wǎng)絡(luò)上傳輸時,比如說從 A 計算機(jī)傳到 B 計算機(jī),往往要經(jīng)過多個路由設(shè)備,由于不同的設(shè)備對字符的處理方式有一些不同,這樣那些不可見字符就有可能被處理錯誤,這是不利于傳輸?shù)摹?/p>
為了解決這個問題,我們可以先對數(shù)據(jù)進(jìn)行編碼,比如 base64 編碼,變成可見字符,也就是 ASCII 碼可表示的可見字符,從而確保數(shù)據(jù)可靠傳輸。Base64 的內(nèi)容是有 0 ~ 9,a ~ z,A ~ Z,+,/ 組成,正好 64 個字符,這些字符是在 ASCII 可表示的范圍內(nèi),屬于 95 個可見字符的一部分。
二、什么是 base64
Base64 是一種基于 64 個可打印字符來表示二進(jìn)制數(shù)據(jù)的表示方法。由于 2? = 64 ,所以每 6 個比特為一個單元,對應(yīng)某個可打印字符。3 個字節(jié)有 24 個比特,對應(yīng)于 4 個 base64 單元,即 3 個字節(jié)可由 4 個可打印字符來表示。相應(yīng)的轉(zhuǎn)換過程如下圖所示:
Base64 常用于在處理文本數(shù)據(jù)的場合,表示、傳輸、存儲一些二進(jìn)制數(shù)據(jù),包括 MIME 的電子郵件及 XML 的一些復(fù)雜數(shù)據(jù)。在 MIME 格式的電子郵件中,base64 可以用來將二進(jìn)制的字節(jié)序列數(shù)據(jù)編碼成 ASCII 字符序列構(gòu)成的文本。使用時,在傳輸編碼方式中指定 base64。使用的字符包括大小寫拉丁字母各 26 個、數(shù)字 10 個、加號 + 和斜杠 /,共 64 個字符,等號 = 用來作為后綴用途。Base64 相應(yīng)的索引表如下:
了解完上述的知識,我們以編碼 Man 字符串為例,來直觀的感受一下編碼過程。Man 由 M、a 和 n 3 個字符組成,它們對應(yīng)的 ASCII 碼為 77、97 和 110。
接著我們以每 6 個比特為一個單元,進(jìn)行 base64 編碼操作,具體如下圖所示:
由圖可知,Man (3字節(jié))編碼的結(jié)果為 TWFu(4字節(jié)),很明顯經(jīng)過 base64 編碼后體積會增加 1/3。Man 這個字符串的長度剛好是 3,我們可以用 4 個 base64 單元來表示。但如果待編碼的字符串長度不是 3 的整數(shù)倍時,應(yīng)該如何處理呢?
如果要編碼的字節(jié)數(shù)不能被 3 整除,最后會多出 1 個或 2 個字節(jié),那么可以使用下面的方法進(jìn)行處理:先使用 0 字節(jié)值在末尾補(bǔ)足,使其能夠被 3 整除,然后再進(jìn)行 base64 的編碼。
以編碼字符 A 為例,其所占的字節(jié)數(shù)為 1,不能被 3 整除,需要補(bǔ) 2 個字節(jié),具體如下圖所示:
由上圖可知,字符 A 經(jīng)過 base64 編碼后的結(jié)果是 QQ==,該結(jié)果后面的兩個 = 代表補(bǔ)足的字節(jié)數(shù)。而最后個 1 個 base64 字節(jié)塊有 4 位是 0 值。
接著我們來看另一個示例,假設(shè)需編碼的字符串為 BC,其所占字節(jié)數(shù)為 2,不能被 3 整除,需要補(bǔ) 1 個字節(jié),具體如下圖所示:
由上圖可知,字符串 BC 經(jīng)過 base64 編碼后的結(jié)果是 QkM=,該結(jié)果后面的 1 個 = 代表補(bǔ)足的字節(jié)數(shù)。而最后個 1 個 base64 字節(jié)塊有 2 位是 0 值。
三、base64 編碼的應(yīng)用
3.1 顯示 base64 編碼的圖片
在編寫 HTML 網(wǎng)頁時,對于一些簡單圖片,通常會選擇將圖片內(nèi)容直接內(nèi)嵌在網(wǎng)頁中,從而減少不必要的網(wǎng)絡(luò)請求,但是圖片數(shù)據(jù)是二進(jìn)制數(shù)據(jù),該怎么嵌入呢?絕大多數(shù)現(xiàn)代瀏覽器都支持一種名為 Data URLs 的特性,允許使用 base64 對圖片或其他文件的二進(jìn)制數(shù)據(jù)進(jìn)行編碼,將其作為文本字符串嵌入網(wǎng)頁中。
Data URLs 由四個部分組成:前綴(data:)、指示數(shù)據(jù)類型的 MIME 類型、如果非文本則為可選的 base64 標(biāo)記、數(shù)據(jù)本身:
- data:[<mediatype>][;base64],<data>
mediatype 是個 MIME 類型的字符串,例如 "image/jpeg" 表示 JPEG 圖像文件。如果被省略,則默認(rèn)值為 text/plain;charset=US-ASCII。如果數(shù)據(jù)是文本類型,你可以直接將文本嵌入(根據(jù)文檔類型,使用合適的實(shí)體字符或轉(zhuǎn)義字符)。如果是二進(jìn)制數(shù)據(jù),你可以將數(shù)據(jù)進(jìn)行 base64 編碼之后再進(jìn)行嵌入。比如嵌入一張圖片:
- <img alt="logo" src="...">
MIME(Multipurpose Internet Mail Extensions)多用途互聯(lián)網(wǎng)郵件擴(kuò)展類型,是設(shè)定某種擴(kuò)展名的文件用一種應(yīng)用程序來打開的方式類型,當(dāng)該擴(kuò)展名文件被訪問的時候,瀏覽器會自動使用指定應(yīng)用程序來打開。多用于指定一些客戶端自定義的文件名,以及一些媒體文件打開方式。
常見的 MIME 類型有:超文本標(biāo)記語言文本 .html text/html、PNG圖像 .png image/png、普通文本 .txt text/plain 等。
但需要注意的是:如果圖片較大,圖片的色彩層次比較豐富,則不適合使用這種方式,因為該圖片經(jīng)過 base64 編碼后的字符串非常大,會明顯增大 HTML 頁面的大小,從而影響加載速度。 除此之外,利用 HTML FileReader API,我們也可以方便的實(shí)現(xiàn)圖片本地預(yù)覽功能,具體代碼如下:
- <input type="file" accept="image/*" onchange="loadFile(event)">
- <img id="output"/>
- <script>
- const loadFile = function(event) {
- const reader = new FileReader();
- reader.onload = function(){
- const output = document.querySelector('#output');
- output.src = reader.result;
- };
- reader.readAsDataURL(event.target.files[0]);
- };
- </script>
- 在完成本地圖片預(yù)覽之后,
在完成本地圖片預(yù)覽之后,可以直接把圖片對應(yīng)的 Data URLs 數(shù)據(jù)提交到服務(wù)器。針對這種情形,服務(wù)端需要做一些相關(guān)處理,才能正常保存上傳的圖片,這里以 Express 為例,具體處理代碼如下:
- const app = require('express')();
- app.post('/upload', function(req, res){
- let imgData = req.body.imgData; // 獲取POST請求中的base64圖片數(shù)據(jù)
- let base64Data = imgData.replace(/^data:image\/\w+;base64,/, "");
- let dataBuffer = Buffer.from(base64Data, 'base64');
- fs.writeFile("image.png", dataBuffer, function(err) {
- if(err){
- res.send(err);
- }else{
- res.send("圖片上傳成功!");
- }
- });
- });
3.2 瀏覽器端圖片壓縮
在一些場合中,我們希望在上傳本地圖片時,先對圖片進(jìn)行一定的壓縮,然后再提交到服務(wù)器,從而減少傳輸?shù)臄?shù)據(jù)量。在前端要實(shí)現(xiàn)圖片壓縮,我們可以利用 Canvas 對象提供的 toDataURL() 方法,該方法接收 type 和 encoderOptions 兩個可選參數(shù)。
其中 type 表示圖片格式,默認(rèn)為 image/png。而 encoderOptions 用于表示圖片的質(zhì)量,在指定圖片格式為 image/jpeg 或 image/webp 的情況下,可以從 0 到 1 的區(qū)間內(nèi)選擇圖片的質(zhì)量。如果超出取值范圍,將會使用默認(rèn)值 0.92,其他參數(shù)會被忽略。
下面我們來看一下具體如何實(shí)現(xiàn)圖片壓縮:
- // compress.js
- const MAX_WIDTH = 800; // 圖片最大寬度
- function compress(base64, quality, mimeType) {
- let canvas = document.createElement("canvas");
- let img = document.createElement("img");
- img.crossOrigin = "anonymous";
- return new Promise((resolve, reject) => {
- img.src = base64;
- img.onload = () => {
- let targetWidth, targetHeight;
- if (img.width > MAX_WIDTH) {
- targetWidth = MAX_WIDTH;
- targetHeight = (img.height * MAX_WIDTH) / img.width;
- } else {
- targetWidth = img.width;
- targetHeight = img.height;
- }
- canvas.width = targetWidth;
- canvas.height = targetHeight;
- let ctx = canvas.getContext("2d");
- ctx.clearRect(0, 0, targetWidth, targetHeight);
- ctx.drawImage(img, 0, 0, canvas.width, canvas.height);
- let imageData = canvas.toDataURL(mimeType, quality / 100);
- resolve(imageData);
- };
- });
- }
對于返回的 Data URL 格式的圖片數(shù)據(jù),為了進(jìn)一步減少傳輸?shù)臄?shù)據(jù)量,我們可以把它轉(zhuǎn)換為 Blob 對象:
- function dataUrlToBlob(base64, mimeType) {
- let bytes = window.atob(base64.split(",")[1]);
- let ab = new ArrayBuffer(bytes.length);
- let ia = new Uint8Array(ab);
- for (let i = 0; i < bytes.length; i++) {
- ia[i] = bytes.charCodeAt(i);
- }
- return new Blob([ab], { type: mimeType });
- }
在轉(zhuǎn)換完成后,我們就可以壓縮后的圖片對應(yīng)的 Blob 對象封裝在 FormData 對象中,然后再通過 AJAX 提交到服務(wù)器上:
- function uploadFile(url, blob) {
- let formData = new FormData();
- let request = new XMLHttpRequest();
- formData.append("image", blob);
- request.open("POST", url, true);
- request.send(formData);
- }
其實(shí) Canvas 對象除了提供 toDataURL() 方法之外,它還提供了一個 toBlob() 方法,該方法的語法如下:
- canvas.toBlob(callback, mimeType, qualityArgument)
和 toDataURL() 方法相比,toBlob() 方法是異步的,因此多了個 callback 參數(shù),這個 callback 回調(diào)方法默認(rèn)的第一個參數(shù)就是轉(zhuǎn)換好的 blob 文件信息。
介紹完上述的內(nèi)容,我們來看一下本地圖片壓縮完整的示例:
- <!DOCTYPE html>
- <html>
- <head>
- <meta charset="UTF-8" />
- <meta name="viewport" content="width=device-width, initial-scale=1.0" />
- <title>本地圖片壓縮</title>
- </head>
- <body>
- <input type="file" accept="image/*" onchange="loadFile(event)" />
- <script src="./compress.js"></script>
- <script>
- const loadFile = function (event) {
- const reader = new FileReader();
- reader.onload = async function () {
- let compressedDataURL = await compress(
- reader.result,
- 90,
- "image/jpeg"
- );
- let compressedImageBlob = dataUrlToBlob(compressedDataURL);
- uploadFile("https://httpbin.org/post", compressedImageBlob);
- };
- reader.readAsDataURL(event.target.files[0]);
- };
- </script>
- </body>
- </html>
四、如何進(jìn)行 base64 編碼和解碼
4.1 使用 btoa 與 atob 函數(shù)
在 JavaScript 中,有兩個函數(shù)被分別用來處理解碼和編碼 base64 字符串:
- btoa():從字符串創(chuàng)建一個 base64 編碼的 ASCII 字符串,其中字符串中的每個字符都被視為一個二進(jìn)制數(shù)據(jù)字節(jié)。
- atob():該函數(shù)能夠解碼通過 base64 編碼的字符串?dāng)?shù)據(jù)。
btoa 使用示例
- const name = 'Semlinker';
- const encodedName = btoa(name);
- console.log(encodedName); // U2VtbGlua2Vy
atob 使用示例
- const encodedName = 'U2VtbGlua2Vy';
- const name = atob(encodedName);
- console.log(name); // Semlinker
介紹完 btoa 和 atob 這兩個函數(shù),我們再來看一下它們的兼容性:
(圖片來源 —— https://caniuse.com/?search=atob)
由上圖可知,除了 IE6-9 和 Opera 10.1 這些版本的瀏覽器之外,主流的瀏覽器都支持 btoa 和 atob 這兩個函數(shù)。
4.2 使用第三方庫
對于不支持 btoa 和 atob 這兩個函數(shù)的瀏覽器來說,我們可以使用第三方庫,比如 js-base64 這個庫,來實(shí)現(xiàn) base64 的編碼和解碼。
具體的使用示例如下:
- <!DOCTYPE html>
- <html lang="zh">
- <head>
- <meta charset="UTF-8" />
- <meta name="viewport" content="width=device-width, initial-scale=1.0" />
- <title>Base64 編碼與解碼示例</title>
- <script src="https://cdn.jsdelivr.net/npm/js-base64@3.6.0/base64.min.js"></script>
- </head>
- <body>
- <h3>Base64 編碼與解碼示例</h3>
- <script>
- let name = Base64.encode("阿寶哥");
- console.log(name);
- console.log(Base64.decode(name));
- </script>
- </body>
- </html>
在前端進(jìn)行二進(jìn)制處理的場景中,你可能會遇到 Data URL 轉(zhuǎn)換成 Blob/File 對象的情形,接下來阿寶哥將匯總一下常用的轉(zhuǎn)換函數(shù)。
五、常用轉(zhuǎn)換函數(shù)
5.1 Data URL 轉(zhuǎn) Blob 對象
- function dataUrlToBlob(dataurl, mimeType) {
- let bytes = window.atob(dataurl.split(",")[1]);
- let ab = new ArrayBuffer(bytes.length);
- let ia = new Uint8Array(ab);
- for (let i = 0; i < bytes.length; i++) {
- ia[i] = bytes.charCodeAt(i);
- }
- return new Blob([ab], { type: mimeType });
- }
- // 使用示例
- let blob = dataUrlToBlob('data:text/plain;base64,aGVsbG8gd29ybGQ=','hello.txt');
- console.log(blob);
5.2 Data URL 轉(zhuǎn) File 對象
- function dataUrlToFile(dataurl, filename) {
- let arr = dataurl.split(","),
- mime = arr[0].match(/:(.*?);/)[1],
- bstr = atob(arr[1]),
- n = bstr.length,
- u8arr = new Uint8Array(n);
- while (n--) {
- u8arr[n] = bstr.charCodeAt(n);
- }
- return new File([u8arr], filename, { type: mime });
- }
- // 使用示例
- let file = dataUrlToFile('data:text/plain;base64,aGVsbG8gd29ybGQ=','hello.txt');
- console.log(file);
5.3 URL 轉(zhuǎn) File 對象
- function urlToFile(url, filename, mimeType) {
- return fetch(url).then((res) => {
- return res.arrayBuffer();
- }).then((buffer) =>{
- return new File([buffer], filename, { type: mimeType });
- });
- }
- // 使用示例
- urlToFile('data:text/plain;base64,aGVsbG8gd29ybGQ=', 'hello.txt','text/plain')
- .then(function(file){ console.log(file);});
六、總結(jié)
Base64 是一種數(shù)據(jù)編碼方式,目的是為了保障數(shù)據(jù)的安全傳輸。但標(biāo)準(zhǔn)的 base64 編碼無需額外的信息,即可以進(jìn)行解碼,是完全可逆的。因此在涉及傳輸私密數(shù)據(jù)時,并不能直接使用 base64 編碼,而是要使用專門的對稱或非對稱加密算法。如果你對加密感興趣的話,可以閱讀 玩轉(zhuǎn)混合加密 這篇文章。
七、參考資源
維基百科 - Base64
Base64 編碼原理與應(yīng)用
知乎 - 為什么要使用base64編碼,有哪些情景需求?