自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

生動形象地介紹 WebAssembly

開發(fā) 開發(fā)工具
這篇文章主要是從JavaScript Just-in-time (JIT) 工作原理和編譯器如何生成匯編兩方面來了解 WebAssembly的獨特特性。

這篇文章主要是從JavaScript Just-in-time (JIT) 工作原理和編譯器如何生成匯編兩方面來了解 WebAssembly的獨特特性。

一、等等,什么是 WebAssembly?

WebAssembly 是除了 JavaScript 以外,另一種可以在瀏覽器中執(zhí)行的編程語言。所以當(dāng)人們說 WebAssembly 更快的時候,一般來講是與 JavaScript 相比而言的。

這里并不是暗示大家說開發(fā)時只能選擇 WebAssembly或 JavaScript。實際上,我們更希望在同一個工程中,兩個你同時使用。

對二者的比較倒是非常有必要的,這樣你就可以了解到 WebAssembly 所擁有的獨特特性。

二、一些關(guān)于性能的歷史

JavaScript 于 1995 年問世,它的設(shè)計初衷并不是為了執(zhí)行起來快,在前 10 個年頭,它的執(zhí)行速度也確實不快。

緊接著,瀏覽器市場競爭開始激烈起來。

被人們廣為傳播的“性能大戰(zhàn)”在 2008 年打響。許多瀏覽器引入了 Just-in-time 編譯器,也叫 JIT。基于 JIT 的模式,JavaScript 代碼的運行漸漸變快。

正是由于這些 JIT 的引入,使得 JavaScript 的性能達(dá)到了一個轉(zhuǎn)折點,JS 代碼執(zhí)行速度快了 10 倍。

隨著性能的提升,JavaScript 可以應(yīng)用到以前根本沒有想到過的領(lǐng)域,比如用于后端開發(fā)的 Node.js。性能的提升使得 JavaScript 的應(yīng)用范圍得到很大的擴展。

現(xiàn)在通過 WebAssembly,我們很有可能正處于第二個拐點。

那么, JIT 是如何起作用的呢?下面來看。

三、JavaScript Just-in-time (JIT) 工作原理

1. JavaScript 在瀏覽器中是如何運行的?

如果是你一個開發(fā)者,當(dāng)你決定在你的頁面中使用 JavaScript 的時候,有兩個要考慮的事情:目標(biāo)和問題。

  • 目標(biāo):告訴計算機你想做什么。
  • 問題:你和計算機說不同的語言,無法溝通。

你說的是人類的語言,而計算機用的是機器語言。機器語言也是一種語言,只是 JavaScript 或者其他高級編程語言機器能看得懂,而人類不用他們來交流罷了。它們是基于人類認(rèn)知而設(shè)計出來的。

所以呢,JavaScript 引擎的工作就是把人類的語言轉(zhuǎn)換成機器能看懂的語言。

這就像電影《降臨》中,人類和外星人的互相交流一樣。

電影《降臨》中,人類和外星人的互相交流

在電影里面,人類和外星人不僅僅是語言不同,兩個群體看待世界的方式都是不一樣的。其實人類和機器也是類似(后面我會詳細(xì)介紹)。

那么,翻譯是如何進(jìn)行的呢?

在代碼的世界中,通常有兩種方式來翻譯機器語言:解釋器和編譯器。

如果是通過解釋器,翻譯是一行行地邊解釋邊執(zhí)行

解釋器,翻譯

編譯器是把源代碼整個編譯成目標(biāo)代碼,執(zhí)行時不再需要編譯器,直接在支持目標(biāo)代碼的平臺上運行。

編譯器是把源代碼整個編譯成目標(biāo)代碼

這兩種翻譯的方式都各有利弊。

2. 解釋器的利弊

解釋器啟動和執(zhí)行的更快。你不需要等待整個編譯過程完成就可以運行你的代碼。從***行開始翻譯,就可以依次繼續(xù)執(zhí)行了。

正是因為這個原因,解釋器看起來更加適合 JavaScript。對于一個 Web 開發(fā)人員來講,能夠快速執(zhí)行代碼并看到結(jié)果是非常重要的。

這就是為什么最開始的瀏覽器都是用 JavaScript 解釋器的原因。

可是當(dāng)你運行同樣的代碼一次以上的時候,解釋器的弊處就顯現(xiàn)出來了。比如你執(zhí)行一個循環(huán),那解釋器就不得不一次又一次的進(jìn)行翻譯,這是一種效率低下的表現(xiàn)。

3. 編譯器的利弊

編譯器的問題則恰好相反。

它需要花一些時間對整個源代碼進(jìn)行編譯,然后生成目標(biāo)文件才能在機器上執(zhí)行。對于有循環(huán)的代碼執(zhí)行的很快,因為它不需要重復(fù)的去翻譯每一次循環(huán)。

另外一個不同是,編譯器可以用更多的時間對代碼進(jìn)行優(yōu)化,以使的代碼執(zhí)行的更快。而解釋器是在 runtime 時進(jìn)行這一步驟的,這就決定了它不可能在翻譯的時候用很多時間進(jìn)行優(yōu)化。

4. Just-in-time 編譯器:綜合了兩者的優(yōu)點

為了解決解釋器的低效問題,后來的瀏覽器把編譯器也引入進(jìn)來,形成混合模式。

不同的瀏覽器實現(xiàn)這一功能的方式不同,不過其基本思想是一致的。在 JavaScript 引擎中增加一個監(jiān)視器(也叫分析器)。監(jiān)視器監(jiān)控著代碼的運行情況,記錄代碼一共運行了多少次、如何運行的等信息。

起初,監(jiān)視器監(jiān)視著所有通過解釋器的代碼。

Just-in-time 編譯器

如果同一行代碼運行了幾次,這個代碼段就被標(biāo)記成了 “warm”,如果運行了很多次,則被標(biāo)記成 “hot”。

5. 基線編譯器

如果一段代碼變成了 “warm”,那么 JIT 就把它送到編譯器去編譯,并且把編譯結(jié)果存儲起來。

基線編譯器

代碼段的每一行都會被編譯成一個“樁”(stub),同時給這個樁分配一個以“行號 + 變量類型”的索引。如果監(jiān)視器監(jiān)視到了執(zhí)行同樣的代碼和同樣的變量類型,那么就直接把這個已編譯的版本 push 出來給瀏覽器。

通過這樣的做法可以加快執(zhí)行速度,但是正如前面我所說的,編譯器還可以找到更有效地執(zhí)行代碼的方法,也就是做優(yōu)化。

基線編譯器可以做一部分這樣的優(yōu)化(下面我會給出例子),不過基線編譯器優(yōu)化的時間不能太久,因為會使得程序的執(zhí)行在這里 hold 住。

不過如果代碼確實非常 “hot”(也就是說幾乎所有的執(zhí)行時間都耗費在這里),那么花點時間做優(yōu)化也是值得的。

6. 優(yōu)化編譯器

如果一個代碼段變得 “very hot”,監(jiān)視器會把它發(fā)送到優(yōu)化編譯器中。生成一個更快速和高效的代碼版本出來,并且存儲之。

優(yōu)化編譯器

為了生成一個更快速的代碼版本,優(yōu)化編譯器必須做一些假設(shè)。例如,它會假設(shè)由同一個構(gòu)造函數(shù)生成的實例都有相同的形狀——就是說所有的實例都有相同的屬性名,并且都以同樣的順序初始化,那么就可以針對這一模式進(jìn)行優(yōu)化。

整個優(yōu)化器起作用的鏈條是這樣的,監(jiān)視器從他所監(jiān)視代碼的執(zhí)行情況做出自己的判斷,接下來把它所整理的信息傳遞給優(yōu)化器進(jìn)行優(yōu)化。如果某個循環(huán)中先前每次迭代的對象都有相同的形狀,那么就可以認(rèn)為它以后迭代的對象的形狀都是相同的??墒菍τ? JavaScript 從來就沒有保證這么一說,前 99 個對象保持著形狀,可能第 100 個就少了某個屬性。

正是由于這樣的情況,所以編譯代碼需要在運行之前檢查其假設(shè)是不是合理的。如果合理,那么優(yōu)化的編譯代碼會運行,如果不合理,那么 JIT 會認(rèn)為做了一個錯誤的假設(shè),并且把優(yōu)化代碼丟掉。

優(yōu)化編譯器

這時(發(fā)生優(yōu)化代碼丟棄的情況)執(zhí)行過程將會回到解釋器或者基線編譯器,這一過程叫做去優(yōu)化。

通常優(yōu)化編譯器會使得代碼變得更快,但是一些情況也會引起一些意想不到的性能問題。如果你的代碼一直陷入優(yōu)化<->去優(yōu)化的怪圈,那么程序執(zhí)行將會變慢,還不如基線編譯器快。

大多數(shù)的瀏覽器都做了限制,當(dāng)優(yōu)化/去優(yōu)化循環(huán)發(fā)生的時候會嘗試跳出這種循環(huán)。比如,如果 JIT 做了 10 次以上的優(yōu)化并且又丟棄的操作,那么就不繼續(xù)嘗試去優(yōu)化這段代碼了樁。

7. 一個優(yōu)化的例子:類型特化(Type specialization)

有很多不同類型的優(yōu)化方法,這里我介紹一種,讓大家能夠明白是如何優(yōu)化的。優(yōu)化編譯器最成功一個特點叫做類型特化,下面詳細(xì)解釋。

JavaScript 所使用的動態(tài)類型體系在運行時需要進(jìn)行額外的解釋工作,例如下面代碼:

  1. function arraySum(arr) { 
  2.   var sum = 0
  3.   for (var i = 0; i < arr.length; i++) { 
  4.     sum += arr[i]; 
  5.   } 

+= 循環(huán)中這一步看起來很簡單,只需要進(jìn)行一步計算,但是恰恰因為是用動態(tài)類型,他所需要的步驟要比你所想象的更復(fù)雜一些。

我們假設(shè) arr 是一個有 100 個整數(shù)的數(shù)組。當(dāng)代碼被標(biāo)記為 “warm” 時,基線編譯器就為函數(shù)中的每一個操作生成一個樁。sum += arr[i]會有一個相應(yīng)的樁,并且把里面的 += 操作當(dāng)成整數(shù)加法。

但是,sum 和 arr[i] 兩個數(shù)并不保證都是整數(shù)。因為在 JavaScript 中類型都是動態(tài)類型,在接下來的循環(huán)當(dāng)中,arr[i] 很有可能變成了string 類型。整數(shù)加法和字符串連接是完全不同的兩個操作,會被編譯成不同的機器碼。

JIT 處理這個問題的方法是編譯多基線樁。如果一個代碼段是單一形態(tài)的(即總是以同一類型被調(diào)用),則只生成一個樁。如果是多形態(tài)的(即調(diào)用的過程中,類型不斷變化),則會為操作所調(diào)用的每一個類型組合生成一個樁。

這就是說 JIT 在選擇一個樁之前,會進(jìn)行多分枝選擇,類似于決策樹,問自己很多問題才會確定最終選擇哪個,見下圖:

JIT 在選擇一個樁之前,會進(jìn)行多分枝選擇

正是因為在基線編譯器中每行代碼都有自己的樁,所以 JIT 在每行代碼被執(zhí)行的時候都會檢查數(shù)據(jù)類型。在循環(huán)的每次迭代,JIT 也都會重復(fù)一次分枝選擇。

如果代碼在執(zhí)行的過程中,JIT 不是每次都重復(fù)檢查的話,那么執(zhí)行的還會更快一些,而這就是優(yōu)化編譯器所需要做的工作之一了。

優(yōu)化編譯器中,整個函數(shù)被統(tǒng)一編譯,這樣的話就可以在循環(huán)開始執(zhí)行之前進(jìn)行類型檢查。

一些瀏覽器的 JIT 優(yōu)化更加復(fù)雜。比如在 Firefox 中,給一些數(shù)組設(shè)定了特定的類型,比如里面只包含整型。如果 arr 是這種數(shù)組類型,那么 JIT 就不需要檢查 arr[i] 是不是整型了,這也意味著 JIT 可以在進(jìn)入循環(huán)之前進(jìn)行所有的類型檢查。

8. 總結(jié)

簡而言之 JIT 是什么呢?它是使 JavaScript 運行更快的一種手段,通過監(jiān)視代碼的運行狀態(tài),把 hot 代碼(重復(fù)執(zhí)行多次的代碼)進(jìn)行優(yōu)化。通過這種方式,可以使 JavaScript 應(yīng)用的性能提升很多倍。

為了使執(zhí)行速度變快,JIT 會增加很多多余的開銷,這些開銷包括:

  • 優(yōu)化和去優(yōu)化開銷
  • 監(jiān)視器記錄信息對內(nèi)存的開銷
  • 發(fā)生去優(yōu)化情況時恢復(fù)信息的記錄對內(nèi)存的開銷
  • 對基線版本和優(yōu)化后版本記錄的內(nèi)存開銷

 

這里還有很大的提升空間:即消除開銷。通過消除開銷使得性能上有進(jìn)一步地提升,這也是 WebAssembly 所要做的事之一。

四、編譯器如何生成匯編

理解什么是匯編,以及編譯器如何生成它,對于理解 WebAssembly 是很有幫助的。

在上一篇關(guān)于 JIT 的文章中,我介紹了和計算機打交道,就像同外星人打交道一樣。

現(xiàn)在來思考一下“外星人”的大腦是如何工作的——機器的“大腦”是如何對我們輸入給它的內(nèi)容進(jìn)行分析和理解的。

“大腦”中,有一部分負(fù)責(zé)思考——處理加法、減法或者邏輯運算。還有其他的部分分別負(fù)責(zé)短暫記憶和長期記憶的。

這些不同的部分都有自己的名字:

  • 負(fù)責(zé)思考的部分叫做算數(shù)邏輯單元(ALU)
  • 寄存器提供短暫記憶功能
  • 隨機存取存儲器(RAM)提供長期記憶功能

機器代碼中的語句稱作指令。

那么在指令進(jìn)入“大腦”以后都發(fā)生了什么呢?它們會被切分為不同的部分傳送到不同的單元進(jìn)行處理。

“大腦”切分指令通過不同連接線路進(jìn)行。舉個例子,“大腦”會將指令最開始的 6 比特通過管道送到 ALU 中。而 ALU 會通過 0 和 1 的位置來決定對兩個數(shù)做加法。

這串 01 串就叫做“操作碼”,它告訴了 ALU 要執(zhí)行什么樣的操作。

然后“大腦”會取后面兩個連續(xù)的 3 比特 01 串來確定把哪兩個數(shù)加到一起,而這 3 比特指的是寄存器的地址。

3 比特指的是寄存器的地址

注意看上面機器碼的注釋:“ADD R1 R2”,這對于人類來講很容易理解其含義。這就是匯編,也叫符號機器碼,它使人類也能看懂機器代碼的含義。

可以看到匯編和這臺機器的機器碼之間有直接的映射關(guān)系。正是因為如此,擁有不同機器結(jié)構(gòu)的計算機會有不同的匯編系統(tǒng)。如果你有一個機器,它有自己的內(nèi)部結(jié)構(gòu),那么它就需要它所獨有的匯編語言。

從上面的分析可以知道我們進(jìn)行機器碼的翻譯并不是只有一種,不同的機器有不同的機器碼,就像我們?nèi)祟愐舱f各種各樣的語言一樣,機器也“說”不同的語言。

人類和外星人之間的語言翻譯,可能會從英語、德語或中文翻譯到外星語 A 或者外星語 B。而在程序的世界里,則是從 C、C++ 或者 JAVA 翻譯到 x86 或者 ARM。

你想要從任意一個高級語言翻譯到眾多匯編語言中的一種(依賴機器內(nèi)部結(jié)構(gòu)),其中一種方式是創(chuàng)建不同的翻譯器來完成各種高級語言到匯編的映射。

這種翻譯的效率實在太低了。為了解決這個問題,大多數(shù)編譯器都會在中間多加一層。它會把高級語言翻譯到一個低層,而這個低層又沒有低到機器碼這個層級。這就是中間代碼( intermediate representation,IR)。

這就是說編譯器會把高級語言翻譯到 IR 語言,而編譯器另外的部分再把 IR 語言編譯成特定目標(biāo)結(jié)構(gòu)的可執(zhí)行代碼。

重新總結(jié)一下:編譯器的前端把高級語言翻譯到 IR,編譯器的后端把 IR 翻譯成目標(biāo)機器的匯編代碼。

五、總結(jié)

本文介紹了 WebAssembly的相關(guān)知識 ,在下一篇文章中,我們來介紹 WebAssembly 的工作原理。

點擊《WebAssembly 系列(一)生動形象地介紹 WebAssembly》閱讀原文。

【本文是51CTO專欄作者“胡子大哈”的原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系作者本人獲取授權(quán)】

戳這里,看該作者更多好文

責(zé)任編輯:趙寧寧 來源: 51CTO專欄
相關(guān)推薦

2015-06-05 14:10:25

WEB思維形象生動

2015-02-12 09:41:20

移動思維WEB思維

2023-12-10 16:48:00

Wasm瀏覽器

2020-11-03 08:12:20

WebAssemblyAPI

2021-07-02 09:05:16

網(wǎng)絡(luò)技術(shù)網(wǎng)絡(luò)協(xié)議網(wǎng)絡(luò)

2009-09-27 16:15:42

CCIE找工作

2022-08-15 06:00:00

二進(jìn)制編程語言

2023-05-05 17:20:04

2023-01-31 09:02:24

JSVMVR

2017-03-19 22:13:10

WebAssemblyJavaScript編程

2022-06-02 08:01:11

云原生工具

2022-10-28 16:57:18

DockerWasm

2011-08-02 10:14:06

WPS課件

2017-03-19 22:43:12

WebAssemblyJavaScript編程

2023-03-27 13:25:18

WebAssembl語言Scheme

2021-06-11 09:00:00

語言WebWebAssembly

2019-01-24 15:50:06

區(qū)塊鏈數(shù)字貨幣比特幣

2020-11-30 15:42:18

SQL

2012-05-25 12:37:33

Git編程開發(fā)

2022-05-16 10:25:03

Web內(nèi)部垃圾收集安全性
點贊
收藏

51CTO技術(shù)棧公眾號