Foreach 集合又拋經典異常了,這次一定要刨根問底
一、背景
1. 講故事
最近同事在寫一段業(yè)務邏輯的時候,程序跑起來總是報:集合已修改;可能無法執(zhí)行枚舉操作,硬是沒有找到什么情況下會導致這個異常產生,就讓我來找一下bug,其實這個異常在座的每個程序員幾乎都遇到過,誰也不是一生下就是大牛,簡單看了下代碼,確實是多線程操作foreach,但并沒有對foreach進行Add,Remove操作,掃完代碼其實我也是有點懵,沒撤只能調試了,在foreach里套一層trycatch,查看異常的線程堆棧從而找出了問題代碼,代碼簡化如下:
static void Main(string[] args)
{
var dict = new Dictionary<int, int>()
{
[1001] = 1,
[1002] = 10,
[1003] = 20
};
foreach (var userid in dict.Keys)
{
dict[userid] = dict[userid] + 1;
}
}
先尋找點安慰,說實話,憑肉眼你覺得這段代碼會拋出異常嗎?反正我是被騙過了,大寫的尷尬,結論如下,運行一下便知。
圖片
從圖中看確實是異常,說明在foreach的過程中連迭代集合的 value 都不可以修改,這讓我激起了強烈的探索欲,看看FCL中到底是怎么限制的。
二、源碼探索
1. 從IL中尋找答案
C#已發(fā)展到 9.0 了,到處都充斥著語法糖,有時候不看一下底層的IL都不知道到底是轉化成了什么,所以這個是必須的。
IL_000d: callvirt instance void class [System.Collections]System.Collections.Generic.Dictionary`2<int32, int32>::set_Item(!0, !1)
IL_001b: callvirt instance void class [System.Collections]System.Collections.Generic.Dictionary`2<int32, int32>::set_Item(!0, !1)
IL_0029: callvirt instance void class [System.Collections]System.Collections.Generic.Dictionary`2<int32, int32>::set_Item(!0, !1)
IL_0037: callvirt instance valuetype [System.Collections]System.Collections.Generic.Dictionary`2/KeyCollection/Enumerator<!0, !1> class [System.Collections]System.Collections.Generic.Dictionary`2/KeyCollection<int32, int32>::GetEnumerator()
.try
{
IL_003d: br.s IL_005a
// loop start (head: IL_005a)
IL_003f: ldloca.s 1
IL_0041: call instance !0 valuetype [System.Collections]System.Collections.Generic.Dictionary`2/KeyCollection/Enumerator<int32, int32>::get_Current()
IL_004c: callvirt instance !1 class [System.Collections]System.Collections.Generic.Dictionary`2<int32, int32>::get_Item(!0)
IL_0053: callvirt instance void class [System.Collections]System.Collections.Generic.Dictionary`2<int32, int32>::set_Item(!0, !1)
IL_005a: ldloca.s 1
IL_005c: call instance bool valuetype [System.Collections]System.Collections.Generic.Dictionary`2/KeyCollection/Enumerator<int32, int32>::MoveNext()
IL_0061: brtrue.s IL_003f
// end loop
IL_0063: leave.s IL_0074
} // end .try
finally
{
} // end handler
從IL代碼中可以看到,先執(zhí)行了三次字典的索引器操作,然后調用了 Dictionary.GetEnumerator 來生成字典的迭代類,這思路就非常清晰了,然后我們看一下類索引器都做了些什么。
圖片
從圖中可以看到,每一次的索引器操作,這里都執(zhí)行了version++,所以字典初始化完成之后,這里的 versinotallow=3,沒有問題吧,然后繼續(xù)看代碼,尋找 Dictionary.GetEnumerator 方法啟動迭代類。
圖片
上面代碼的 _version = dictionary._version; 一定要看仔細了,在啟動迭代類的時候記錄了當時字典的版本號,也就是_versinotallow=3,然后繼續(xù)探索moveNext方法干了什么,如下圖:
圖片
從圖中可以看到,當每次執(zhí)行moveNext的過程中,都會判斷一下字典的 version 和 當初初始化迭代類中的version 版本號是否一致,如果不一致就拋出異常,所以這行代碼就是點睛之筆了,當在foreach體中執(zhí)行了 dict[userid] = dict[userid] + 1; 語句,相當于又執(zhí)行了一次類索引器操作,這時候字典的version就變成 4 了,而當初初始化迭代類的時候還是3,自然下一次執(zhí)行 moveNext 就是 3 != 4 拋出異常了。
如果你非要讓我證明給你看,這里可以使用dnspy直接調試源碼,在異常那里下一個斷點再查看兩個version版本號不就知道啦。。。
圖片
2. 面對疾風
有些朋友可能要說,碼農今天分享的這篇一點水準都沒有,我18年前就知道字典是不能動態(tài)修改的,還分析的頭頭是勁??????。
但是我有話要說,這個還確實是我的一個盲區(qū),平時在迭代字典的時候value一般都是引用類型,動態(tài)修改引用類型的值自然是沒有問題的,這是因為你不管怎么修改都不會改變 _version 版本號,但質疑我的也不要把話說的太滿,因為這種操作是非常語義化非常大眾的需求,你能保證后面net版本不支持這個嗎??? 如果你說不可能,那恭喜你,被我?guī)У娇永锩嫒ダ病??????
下面我用原封不動的代碼在 .net 5 下跑一次,睜大眼睛好好看哦~~~
圖片
驚訝吧, 居然在 .Net 5 中可以的,接下來用ILSpy去查查底層源碼,.netcore 3.1 和 net5 中分別對 類索引器 都做了啥修改。
- netcore 3.1
Path:C:\Program Files\dotnet\shared\Microsoft.NETCore.App\3.1.2\System.Private.CoreLib.dll
圖片
- net5
Path:C:\Program Files\dotnet\shared\Microsoft.NETCore.App\5.0.0-preview.5.20278.1\System.Private.CoreLib.dll
對比兩張圖你會發(fā)現(xiàn) .Net5 中并沒有做 _version++ 操作,這就????了,如果你再細讀代碼,你還發(fā)現(xiàn) .Net5 對字典進行了較大幅度的優(yōu)化,哈哈,當初在 .Net5 之前產生的錯誤,在 .Net5 中居然沒有啦!
四、總結
源碼面前,不談隱私,沒事多翻翻源碼,有可能還有意外收獲,比如在 .Net 5下的這點新發(fā)現(xiàn),可能還是全網第一個哦,這要是兩個大牛爭吵,讓小白去相信誰呢,嘿嘿,源碼才是真正的專家!