如何提升JSON.stringify()的性能?
1. 熟悉的JSON.stringify()
在瀏覽器端或服務端,JSON.stringify()都是我們很常用的方法:
- 將 JSON object 存儲到 localStorage 中;
- POST 請求中的 JSON body;
- 處理響應體中的 JSON 形式的數(shù)據(jù);
- 甚至某些條件下,我們還會用它來實現(xiàn)一個簡單的深拷貝;
- ……
在一些性能敏感的場合下(例如服務端處理大量并發(fā)),或面對大量 stringify 的操作時,我們會希望它的性能更好,速度更快。這也催生了一些優(yōu)化的 stringify 方案/庫,下圖是它們與原生方法的性能對比:
綠色部分時原生JSON.stringify(),可見性能相較這些庫都要低很多。那么,在大幅的性能提升背后的技術原理是什么呢?
2. 比 stringify 更快的 stringify
由于 JavaScript 是動態(tài)性很強的語言,所以對于一個 Object 類型的變量,其包含的鍵名、鍵值、鍵值類型最終只能在運行時確定。因此,執(zhí)行JSON.stringify()時會有很多工作要做。在一無所知的情況下,我們想要大幅優(yōu)化顯然無能為力。
那么如果我們知道這個 Object 中的鍵名、鍵值信息呢 —— 也就是知道它的結構信息,這會有幫助么?
看個例子:
下面這個 Object,
- const obj = {
- name: 'alienzhou',
- status: 6,
- working: true
- };
我們對它應用JSON.stringify(),得到結果為
- JSON.stringify(obj);
- // {"name":"alienzhou","status":6,"working":true}
現(xiàn)在如果我們知道這個obj的結構是固定的:
- 鍵名不變
- 鍵值的類型一定
那么其實,我可以創(chuàng)建一個“定制化”的 stringify 方法
- function myStringify(o) {
- return (
- '{"name":"'
- + o.name
- + '","status":'
- + o.status
- + ',"isWorking":'
- + o.working
- + '}'
- );
- }
看看我們的myStringify方法的輸出:
- myStringify({
- name: 'alienzhou',
- status: 6,
- working: true
- });
- // {"name":"alienzhou","status":6,"isWorking":true}
- myStringify({
- name: 'mengshou',
- status: 3,
- working: false
- });
- // {"name":"mengshou","status":3,"isWorking":false}
可以得到正確的結果,但只用到了類型轉(zhuǎn)換和字符串拼接,所以“定制化”方法可以讓“stringify”更快。
總結來看,如何得到比 stringify 更快的 stringify 方法呢?
- 需要先確定對象的結構信息;
- 根據(jù)其結構信息,為該種結構的對象創(chuàng)建“定制化”的stringify方法,其內(nèi)部實際是通過字符串拼接生成結果的;
- ***,使用該“定制化”的方法來 stringify 對象即可。
這也是大多數(shù) stringify 加速庫的套路,轉(zhuǎn)化為代碼就是類似:
- import faster from 'some_library_faster_stringify';
- // 1. 通過相應規(guī)則,定義你的對象結構
- const theObjectScheme = {
- // ……
- };
- // 2. 根據(jù)結構,得到一個定制化的方法
- const stringify = faster(theObjectScheme);
- // 3. 調(diào)用方法,快速 stringify
- const target = {
- // ……
- };
- stringify(target);
3. 如何生成“定制化”的方法
根據(jù)上面的分析,核心功能在于,根據(jù)其結構信息,為該類對象創(chuàng)建“定制化”的stringify方法,其內(nèi)部實際是簡單的屬性訪問與字符串拼接。
為了了解具體的實現(xiàn)方式,下面我以兩個實現(xiàn)上略有差異的開源庫為例來簡單介紹一下。
3.1. fast-json-stringify
下圖是根據(jù) fast-json-stringify 提供的 benchmark 結果,整理出來的性能對比。
可以看到,在大多數(shù)場景下具備2-5倍的性能提升。
3.1.1. scheme 的定義方式
fast-json-stringify 使用了 JSON Schema Validation 來定義(JSON)對象的數(shù)據(jù)格式。其 scheme 定義的結構本身也是 JSON 格式的,例如對象
- {
- name: 'alienzhou',
- status: 6,
- working: true
- }
對應的 scheme 就是:
- {
- title: 'Example Schema',
- type: 'object',
- properties: {
- name: {
- type: 'string'
- },
- status: {
- type: 'integer'
- },
- working: {
- type: 'boolean'
- }
- }
- }
其 scheme 定義規(guī)則豐富,具體使用可以參考 Ajv 這個 JSON 校驗庫。
3.1.2. stringify 方法的生成
fast-json-stringify 會根據(jù)剛才定義的 scheme,拼接生成出實際的函數(shù)代碼字符串,然后使用 Function 構造函數(shù)在運行時動態(tài)生成對應的 stringify 函數(shù)。
在代碼生成上,首先它會注入預先定義好的各類工具方法,這一部分不同的 scheme 都是一樣的:
- var code = `
- 'use strict'
- `
- code += `
- ${$asString.toString()}
- ${$asStringNullable.toString()}
- ${$asStringSmall.toString()}
- ${$asNumber.toString()}
- ${$asNumberNullable.toString()}
- ${$asIntegerNullable.toString()}
- ${$asNull.toString()}
- ${$asBoolean.toString()}
- ${$asBooleanNullable.toString()}
- `
其次,就會根據(jù) scheme 定義的具體內(nèi)容生成 stringify 函數(shù)的具體代碼。而生成的方式也比較簡單:通過遍歷 scheme。
遍歷 scheme 時,根據(jù)定義的類型,在對應代碼處插入相應的工具函數(shù)用于鍵值轉(zhuǎn)換。例如上面例子中name這個屬性:
- var accessor = key.indexOf('[') === 0 ? sanitizeKey(key) : `['${sanitizeKey(key)}']`
- switch (type) {
- case 'null':
- code += `
- json += $asNull()
- `
- break
- case 'string':
- code += nullable ? `json += obj${accessor} === null ? null : $asString(obj${accessor})` : `json += $asString(obj${accessor})`
- break
- case 'integer':
- code += nullable ? `json += obj${accessor} === null ? null : $asInteger(obj${accessor})` : `json += $asInteger(obj${accessor})`
- break
- ……
上面代碼中的code變量保存的就是***生成的函數(shù)體的代碼串。由于在 scheme 定義中,name為string類型,且不為空,所以會在code中添加如下一段代碼字符串:
- "json += $asString(obj['name'])"
由于還需要處理數(shù)組、及聯(lián)對象等復雜情況,實際的代碼省略了很多。
然后,生成的完整的code字符串大致如下:
- function $asString(str) {
- // ……
- }
- function $asStringNullable(str) {
- // ……
- }
- function $asStringSmall(str) {
- // ……
- }
- function $asNumber(i) {
- // ……
- }
- function $asNumberNullable(i) {
- // ……
- }
- /* 以上是一系列通用的鍵值轉(zhuǎn)換方法 */
- /* $main 就是 stringify 的主體函數(shù) */
- function $main(input) {
- var obj = typeof input.toJSON === 'function'
- ? input.toJSON()
- : input
- var json = '{'
- var addComma = false
- if (obj['name'] !== undefined) {
- if (addComma) {
- json += ','
- }
- addComma = true
- json += '"name":'
- json += $asString(obj['name'])
- }
- // …… 其他屬性(status、working)的拼接
- json += '}'
- return json
- }
- return $main
***,將code字符串傳入 Function 構造函數(shù)來創(chuàng)建相應的 stringify 函數(shù)。
- // dependencies 主要用于處理包含 anyOf 與 if 語法的情況
- dependenciesName.push(code)
- return (Function.apply(null, dependenciesName).apply(null, dependencies))
3.2. slow-json-stringify
slow-json-stringify 雖然名字叫 "slow",但其實是一個 "fast" 的 stringify 庫(命名很調(diào)皮)。
The slowest stringifier in the known universe. Just kidding, it's the fastest (:
它的實現(xiàn)比前面提到的 fast-json-stringify 更輕量級,思路也很巧妙。同時它在很多場景下效率會比 fast-json-stringify 更快。
3.2.1. scheme 的定義方式
slow-json-stringify 的 scheme 定義更自然與簡單,主要就是將鍵值替換為類型描述。還是上面這個對象的例子,scheme 會變?yōu)?nbsp;
- {
- name: 'string',
- status: 'number',
- working: 'boolean'
- }
確實非常直觀。
3.2.2. stringify 方法的生成
不知道你注意到?jīng)]有
- // scheme
- {
- name: 'string',
- status: 'number',
- working: 'boolean'
- }
- // 目標對象
- {
- name: 'alienzhou',
- status: 6,
- working: true
- }
scheme 和原對象的結構是不是很像?
這種 scheme 的巧妙之處在于,這樣定義之后,我們可以先把 scheme JSON.stringify一下,然后“扣去”所有類型值,***等著我們的就是把實際的值直接填充到 scheme 對應的類型聲明處。
具體如何操作呢?
首先,可以直接對 scheme 調(diào)用JSON.stringify()來生成基礎模版,同時借用JSON.stringify()的第二個參數(shù)來作為遍歷方法收集屬性的訪問路徑:
- let map = {};
- const str = JSON.stringify(schema, (prop, value) => {
- const isArray = Array.isArray(value);
- if (typeof value !== 'object' || isArray) {
- if (isArray) {
- const current = value[0];
- arrais.set(prop, current);
- }
- _validator(value);
- map[prop] = _deepPath(schema, prop);
- props += `"${prop}"|`;
- }
- return value;
- });
此時,map 里收集所有屬性的訪問路徑。同時生成的props可以拼接為匹配相應類型字符還的正則表達式,例如我們這個例子里的正則表達式為/name|status|working"(string|number|boolean|undef)"|\\[(.*?)\\]/。
然后,根據(jù)正則表達式來順序匹配這些屬性,替換掉屬性類型的字符串,換成統(tǒng)一的占位字符串"__par__",并基于"__par__"拆分字符串:
- const queue = [];
- const chunks = str
- .replace(regex, (type) => {
- switch (type) {
- case '"string"':
- case '"undefined"':
- return '"__par__"';
- case '"number"':
- case '"boolean"':
- case '["array-simple"]':
- case '[null]':
- return '__par__';
- default:
- const prop = type.match(/(?<=\").+?(?=\")/)[0];
- queue.push(prop);
- return type;
- }
- })
- .split('__par__');
這樣你就會得到chunks和props兩個數(shù)組。chunks里包含了被分割的 JSON 字符串。以例子來說,兩個數(shù)組分別如下
- // chunks
- [
- '{"name":"',
- '","status":"',
- '","working":"',
- '"}'
- ]
- // props
- [
- 'name',
- 'status',
- 'working'
- ]
***,由于 map 中保存了屬性名與訪問路徑的映射,因此可以根據(jù) prop 訪問到對象中某個屬性的值,循環(huán)遍歷數(shù)組,將其與對應的 chunks 拼接即可。
從代碼量和實現(xiàn)方式來看,這個方案會更輕便與巧妙,同時也不需要通過 Function、eval 等方式動態(tài)生成或執(zhí)行函數(shù)。
4. 總結
雖然不同庫的實現(xiàn)有差異,但從整體思路上來說,實現(xiàn)高性能 stringify 的方式都是一樣的:
- 開發(fā)者定義 Object 的 JSON scheme;
- stringify 庫根據(jù) scheme 生成對應的模版方法,模版方法里會對屬性與值進行字符串拼接(顯然,屬性訪問與字符串拼接的效率要高多了);
- ***開發(fā)者調(diào)用返回的方法來 stringify Object 即可。
歸根到底,它本質(zhì)上是通過靜態(tài)的結構信息將優(yōu)化與分析前置了。
Tips
***,還是想提一下
- 所有的 benchmark 只能作為一個參考,具體是否有性能提升、提升多少還是建議你在實際的業(yè)務中測試;
- fast-json-stringify 中使用到了 Function 構造函數(shù),因此建議不要將用戶輸入直接用作 scheme,以防一些安全問題。