.NET程序中的正則表達式性能問題
之前在web程序中錯誤的使用了RegexOptions.Compiled 選項,導(dǎo)致每個頁面打開整度慢了接近0.5秒..
因為是在httpModule里過濾關(guān)鍵字,對性能比較敏感,做了個簡單測試.
- Stopwatch w = new Stopwatch();
- w.Start();
- Regex r = new Regex(@".*", RegexOptions.Compiled );
- Match m = r.Match("aaa");
- if (m.Success)
- {
- w.Stop();
- Response.Write(w.Elapsed.TotalSeconds.ToString("0.0000000"));
- }
不加RegexOptions.Compiled ,計時器顯示0.0000x,添加RegexOptions.Compiled 后計數(shù)器顯示0.00x
如果正則式寫的在復(fù)雜一些,那么僅編譯時間都要0.x秒了. 看來大部分應(yīng)用使用RegexOptions.Compiled 反而會降低性能,除非是很BT的應(yīng)用
.NET的正則表達使用NFA引擎,NFA引擎正則式的寫法對性能的很大.
- Regex r = new Regex(@"(a|[^a]+)*^" );
- string str="111111111111111111111111111111111";
- Match m = r.Match(str);
- if (m.Success)
- {
- Response.Write(w.Elapsed.TotalSeconds.ToString("0.0000000"));
- }
只要str長度超過26基本上很匹配難完成.
以下這些都類似
- (b|[^b]+)*^
- (c|[^c]+)*^
- (^|[^^]+)*(^|[^^]+)*^
- (^|[^^]+|[^^]*)*^
看來正則的寫法對性能影響挺大的
【編輯推薦】