學(xué)習(xí)并行LINQ的一點(diǎn)總結(jié)
我們了解和學(xué)習(xí)并行LINQ的時(shí)候首先來(lái)看看LINQ,LINQ(Language Integrated Query)是Visual Studio 2008中的重頭戲,那么什么是并行LINQ呢?下面我們來(lái)看看具體的內(nèi)容。
學(xué)習(xí)并行LINQ的前期:
借助于LINQ技術(shù),我們可以使用一種類似SQL的語(yǔ)法來(lái)查詢?nèi)魏涡问降臄?shù)據(jù)。目前為止LINQ所支持的數(shù)據(jù)源有SQL Server、XML以及內(nèi)存中的數(shù)據(jù)集合。開發(fā)人員也可以使用其提供的擴(kuò)展框架添加更多的數(shù)據(jù)源,例如MySQL、Amazon甚至是Google Desktop。
一般來(lái)講,這類查詢語(yǔ)句的一個(gè)重要特點(diǎn)就是可以并行化執(zhí)行。雖然有些情況下并行可能會(huì)帶來(lái)一些問(wèn)題,但這種情況非常少見(jiàn)。這樣也就水到渠成地引出了PLINQ這個(gè)并行處理的LINQ類庫(kù)。
PLINQ原名為Parallel LINQ,支持XML和內(nèi)存中的數(shù)據(jù)集合。執(zhí)行于遠(yuǎn)程服務(wù)器上的查詢語(yǔ)句(例如LINQ to SQL)顯然無(wú)法實(shí)現(xiàn)這個(gè)功能。
將LINQ語(yǔ)句轉(zhuǎn)換為PLINQ語(yǔ)句極為簡(jiǎn)單——只需要在查詢語(yǔ)句中From子句所指定的數(shù)據(jù)源的最后添加.AsParallel()即可。隨后Where、OrderBy和Select子句將自動(dòng)改為調(diào)用這個(gè)并行的LINQ版本。
并行LINQ之PLINQ可以以三種方式執(zhí)行。
第一種是管道處理:一個(gè)線程用來(lái)讀取數(shù)據(jù)源,而其他的線程則用來(lái)處理查詢語(yǔ)句,二者同步進(jìn)行——雖然這個(gè)單一的消費(fèi)線程可能并不那么容易與多個(gè)生產(chǎn)線程同步。不過(guò)若是能夠仔細(xì)配置好負(fù)載平衡的話,仍然會(huì)極大地減少內(nèi)存占用。
第二種模式叫做“stop and go”,用于處理結(jié)果集需要被一次返回時(shí)(例如調(diào)用ToList、ToArray或?qū)Y(jié)果排序)的情況。在這種模式下,將依次完成各個(gè)處理過(guò)程,并將結(jié)果統(tǒng)一返回給消費(fèi)線程。這個(gè)模式在性能上將優(yōu)于第一種模式,因?yàn)樗∪チ擞脕?lái)保持線程同步所花費(fèi)的開銷。
第三種方法叫做“inverted enumeration”。該方法并不需要實(shí)現(xiàn)收集到所有的輸出,然后在單一的線程中處理,而是將最終調(diào)用的函數(shù)通過(guò)ForAll擴(kuò)展傳遞到每個(gè)線程中。 這是目前為止最快的一種處理模式,不過(guò)這需要傳遞到ForAll中的函數(shù)是線程安全的,且最好不包含任何lock之類的互斥語(yǔ)句。
若是PLINQ中任意的一個(gè)線程拋出異常,那么所有的其他線程將會(huì)被終止。若是拋出了多個(gè)異常,那么這些異常將被組合成一個(gè)MultipleFailuresException類型的異常,但每個(gè)異常的調(diào)用堆棧仍會(huì)被保留。
學(xué)習(xí)并行LINQ的相關(guān)內(nèi)容就向你介紹到這里,希望對(duì)你了解和學(xué)習(xí)學(xué)習(xí)并行LINQ有所幫助。
【編輯推薦】