Node.js中實(shí)現(xiàn)文件的循環(huán)寫入
node.js對(duì)所有外部資源調(diào)用提供異步機(jī)制,文件IO也不例外。在這種異步機(jī)制下,進(jìn)程不會(huì)被阻塞,這極大提高了CPU的利用率,為單進(jìn)程的模式奠定了基礎(chǔ)。但同時(shí),異步機(jī)制的引入也給程序邏輯的實(shí)現(xiàn)帶來了一定復(fù)雜性,原來一些慣常的思維方式需要進(jìn)行轉(zhuǎn)換。
本文將以一個(gè)文件操作的實(shí)例來說明這一點(diǎn)。
假設(shè)我們需要新建一個(gè)文件,在其中循環(huán)寫入0-9的數(shù)字,文件的總長度為1G bytes。在通常情況下,我們需要建立一個(gè)buffer,將內(nèi)容放入其中,然后打開文件,在一個(gè)循環(huán)中多次向文件中寫入,直至寫滿1G的長度。在node.js中我們同樣可以使用同步文件寫操作(例如 fs.writeSync)來實(shí)現(xiàn)這個(gè)邏輯,但這樣做顯然無法利用node.js提供的異步機(jī)制的優(yōu)勢。寫操作會(huì)在fs.writeSync調(diào)用時(shí)阻塞,如果同時(shí)有其他運(yùn)算任務(wù)需要處理,則會(huì)在進(jìn)程中排隊(duì),造成 CPU資源浪費(fèi)。
如果我們使用基于事件回調(diào)的異步文件寫操作(例如 fs.write),如何來模擬同步模式下的循環(huán)邏輯呢?自然可以想到的一點(diǎn)是定義一個(gè)函數(shù)用來處理單次寫入操作,然后依靠事件回調(diào)反復(fù)調(diào)用此函數(shù),直至寫滿計(jì)劃中的長度。但問題在于回調(diào)函數(shù)的參數(shù)形式是固定的,無法加入fd (file descriptor)和循環(huán)變量來標(biāo)注當(dāng)前運(yùn)行的進(jìn)度狀況。解決這個(gè)問題,我們可以應(yīng)用js語言中的“閉包”機(jī)制,因?yàn)殚]包函數(shù)可以在棧中保存定義此函數(shù)的現(xiàn)場。
具體代碼如下:
- var file_size = 1024*1024*1024; //1G
- var buf_size = 10240;
- var fs = require('fs');
- var buf = new Buffer(buf_size);
- // init temp buffer
- var temp = new Buffer(10);
- for (var i=0; i<10; i++) {
- temp[i] = (i).toString().charCodeAt(0);
- }
- // init buf
- for (var i=0; i<buf_size/10-1; i++) {
- temp.copy(buf, 10*i);
- }
- temp.copy(buf, 10*i, 0, buf_size-parseInt(buf_size/10)*10);
- // write to file
- fs.open('big.block', 'w', 0666, function(err, fd){
- if (err) throw err;
- function write(err, written) {
- if (err) throw err;
- if (i>=file_size/buf_size) { //close the file
- fs.close(fd);
- } else { //continue to write
- var length = buf_size;
- if ((i+1)*buf_size>file_size) {
- length = file_size-i*buf_size;
- }
- fs.write(fd, buf, 0, length, null, write);
- i++;
- }
- }
- var i=0;
- write(null, 0);
- });
需要注意緩沖區(qū)大小對(duì)寫操作的性能影響很大。過小的緩沖區(qū)會(huì)造成從磁盤到文件系統(tǒng),甚至用戶程序,整個(gè)過程更大的資源消耗,從而影響程序的執(zhí)行效率。通過time數(shù)據(jù)可明顯觀察到其差別:
1K緩沖:
real 0m39.340s
user 0m18.244s
sys 0m34.750s
10K緩沖:
real 0m7.985s
user 0m2.037s
sys 0m7.525s
100K緩沖:
real 0m4.223s
user 0m0.312s
sys 0m4.077s
原文:http://cnodejs.org/blog/?p=168#comment-820
【編輯推薦】