Scala中的for表達(dá)式:枚舉的“瑞士軍刀”
Scala的for表達(dá)式是為枚舉準(zhǔn)備的“瑞士軍刀”。它可以讓你用不同的方式把若干簡(jiǎn)單的成分組合來(lái)表達(dá)各種各樣的枚舉。簡(jiǎn)單的用法完成如把整數(shù)序列枚舉一遍那樣通常的任務(wù)。更高級(jí)的表達(dá)式可以列舉不同類(lèi)型的多個(gè)集合,可以用任意條件過(guò)濾元素,還可以制造新的集合。
51CTO編輯推薦:Scala編程語(yǔ)言專(zhuān)題
枚舉集合類(lèi)
你能用for做的最簡(jiǎn)單的事情就是把一個(gè)集合類(lèi)的所有元素都枚舉一遍。如,代碼7.5展示了打印當(dāng)前目錄所有文件名的例子。I/O操作使用了Java的API。首先,我們創(chuàng)建指向當(dāng)前目錄,".",的文件,然后調(diào)用它的listFiles方法。方法返回File對(duì)象數(shù)組,每個(gè)都代表當(dāng)前目錄包含的目錄或文件。我們把結(jié)果數(shù)組保存在filesHere變量。
代碼 7.5 用for循環(huán)列表目錄中的文件
- val filesHere = (new java.io.File(".")).listFiles
- for (file < - filesHere)
- println(file)
通過(guò)使用被稱(chēng)為發(fā)生器:generator的語(yǔ)法“file < - filesHere”,我們遍歷了filesHere的元素。每一次枚舉,名為file的新的val就被元素值初始化。編譯器推斷file的類(lèi)型是File,因?yàn)閒ilesHere是Array[File]。對(duì)于每一次枚舉,for表達(dá)式的函數(shù)體,println(file),將被執(zhí)行一次。由于File的toString方法產(chǎn)生文件或目錄的名稱(chēng),因此當(dāng)前目錄的所有文件和目錄的名稱(chēng)都會(huì)被打印出來(lái)。
for表達(dá)式語(yǔ)法對(duì)任何種類(lèi)的集合類(lèi)都有效,而不只是數(shù)組。更精確地說(shuō),在<-符號(hào)右側(cè)的表達(dá)式必須支持名為foreach的方法。第80頁(yè)的表格5-4中看到的Range類(lèi)型是其中一個(gè)方便的特例,你可以使用類(lèi)似于“1 to 5”這樣的語(yǔ)法創(chuàng)建一個(gè)Range,然后用for枚舉。以下是一個(gè)簡(jiǎn)單的例子:
如果你不想包括被枚舉的Range的上邊界,可以用until替代to:
- scala> for (i < - 1 to 4)
- println("Iteration " + i)
- Iteration 1
- Iteration 2
- Iteration 3
- Iteration 4
像這樣枚舉整數(shù)在Scala里是很平常的,但在其他語(yǔ)言中就不是這么回事。其它語(yǔ)言中,你或許要采用如下方式遍歷數(shù)組:
- scala> for (i < - 1 until 4)
- println("Iteration " + i)
- Iteration 1
- Iteration 2
- Iteration 3
- // Scala中不常見(jiàn)……
- for (i < - 0 to filesHere.length - 1)
- println(filesHere(i))
這個(gè)for表達(dá)式引入了變量i,依次把它設(shè)成從0到filesHere.length - 1的整數(shù)值,然后對(duì)i的每個(gè)設(shè)置執(zhí)行一次for表達(dá)式的循環(huán)體。對(duì)應(yīng)于每一個(gè)i的值,filesHere的第i個(gè)元素被取出并處理。
這種類(lèi)型的枚舉在Scala里不常見(jiàn)的原因是直接枚舉集合類(lèi)也做得同樣好。這樣做,你的代碼變得更短并規(guī)避了許多枚舉數(shù)組時(shí)頻繁出現(xiàn)的超位溢出:off-by-one error。該從0開(kāi)始還是從1開(kāi)始?應(yīng)該加-1,+1,還是什么都不用直到最后一個(gè)索引?這些問(wèn)題很容易回答,但也很容易答錯(cuò)。還是避免碰到為佳。
過(guò)濾
有些時(shí)候你不想枚舉一個(gè)集合類(lèi)的全部元素。而是想過(guò)濾出一個(gè)子集。你可以通過(guò)把過(guò)濾器:filter:一個(gè)if子句加到for的括號(hào)里做到。如代碼7.6的代碼僅對(duì)當(dāng)前目錄中以“.scala”結(jié)尾的文件名做列表:
- val filesHere = (new java.io.File(".")).listFiles
- for (file < - filesHere if file.getName.endsWith(".scala"))
- println(file)
代碼 7.6 用帶過(guò)濾器的for發(fā)現(xiàn).scala文件
或者你也可以這么寫(xiě):
- for (file < - filesHere)
- if (file.getName.endsWith(".scala"))
- println(file)
這段代碼可以產(chǎn)生與前一段代碼同樣的輸出,而且對(duì)于指令式背景的程序員來(lái)說(shuō)看上去更熟悉一些。然而指令式格式只是一個(gè)可選項(xiàng),因?yàn)檫@個(gè)for表達(dá)式的運(yùn)用執(zhí)行的目的是為了它的打印這個(gè)副作用并產(chǎn)生unit值()。正如在本節(jié)后面將展示的,for表達(dá)式之所以被稱(chēng)為“表達(dá)式”是因?yàn)樗墚a(chǎn)生令人感興趣的值,一個(gè)其類(lèi)型取決于for表達(dá)式< -子句的集合。
如果愿意的話(huà),你可以包含更多的過(guò)濾器。只要不斷加到子句里即可。例如,為了加強(qiáng)防衛(wèi),代碼7.7中的代碼僅僅打印文件而不是目錄。通過(guò)增加過(guò)濾器檢查file的isFile方法做到:
- for (
- file < - filesHere
- if file.isFile;
- if file.getName.endsWith(".scala")
- ) println(file)
代碼 7.7 在for表達(dá)式中使用多個(gè)過(guò)濾器
注意
如果在發(fā)生器中加入超過(guò)一個(gè)過(guò)濾器,if子句必須用分號(hào)分隔。這是代碼7.7中的“if file.isFile”過(guò)濾器之后帶著分號(hào)的原因。
嵌套枚舉
如果加入多個(gè)< -子句,你就得到了嵌套的“循環(huán)”。比如,代碼7.8展示的for表達(dá)式有兩個(gè)嵌套循環(huán)。外層的循環(huán)枚舉filesHere,內(nèi)層的枚舉所有以.scala結(jié)尾文件的fileLines(file)。
- def fileLines(file: java.io.File) =
- scala.io.Source.fromFile(file).getLines.toList
- def grep(pattern: String) =
- for {
- file < - filesHere
- if file.getName.endsWith(".scala")
- line < - fileLines(file)
- if line.trim.matches(pattern)
- } println(file + ": " + line.trim)
- grep(".*gcd.*")
代碼 7.8 在for表達(dá)式中使用多個(gè)發(fā)生器
如果愿意的話(huà),你可以使用大括號(hào)代替小括號(hào)環(huán)繞發(fā)生器和過(guò)濾器。使用大括號(hào)的一個(gè)好處是你可以省略一些使用小括號(hào)必須加的分號(hào)。
mid-stream(流間)變量綁定
請(qǐng)注意前面的代碼段中重復(fù)出現(xiàn)的表達(dá)式line.trim。這不是個(gè)可忽略的計(jì)算,因此你或許想每次只算一遍。通過(guò)用等號(hào)(=)把結(jié)果綁定到新變量可以做到這點(diǎn)。綁定的變量被當(dāng)作val引入和使用,不過(guò)不用帶關(guān)鍵字val。代碼7.9展示了一個(gè)例子。
- def grep(pattern: String) =
- for {
- file < - filesHere
- if file.getName.endsWith(".scala")
- line < - fileLines(file)
- trimmed = line.trim
- if trimmed.matches(pattern)
- } println(file + ": " + trimmed)
- grep(".*gcd.*")
代碼 7.9 在for表達(dá)式里的流間賦值
代碼中,名為trimmed的變量被從半當(dāng)中引入for表達(dá)式,并被初始化為line.trim的結(jié)果值。之后的for表達(dá)式就可以在兩個(gè)地方使用這個(gè)新變量,一次在if中,一次在println中。
制造新集合
到現(xiàn)在為止所有的例子都只是對(duì)枚舉值進(jìn)行操作然后就放過(guò),除此之外,你還可以創(chuàng)建一個(gè)值去記住每一次的迭代。只要在for表達(dá)式之前加上關(guān)鍵字yield。比如,下面的函數(shù)鑒別出.scala文件并保存在數(shù)組里:
- def scalaFiles =
- for {
- file < - filesHere
- if file.getName.endsWith(".scala")
- } yield file
for表達(dá)式在每次執(zhí)行的時(shí)候都會(huì)制造一個(gè)值,本例中是file。當(dāng)for表達(dá)式完成的時(shí)候,結(jié)果將是一個(gè)包含了所有產(chǎn)生的值的集合。結(jié)果集合的類(lèi)型基于枚舉子句處理的集合類(lèi)型。本例中結(jié)果為Array[File],因?yàn)閒ilesHere是數(shù)組并且產(chǎn)生的表達(dá)式類(lèi)型是File。
另外,請(qǐng)注意放置yield關(guān)鍵字的地方。對(duì)于for-yield表達(dá)式的語(yǔ)法是這樣的:
- for {子句} yield {循環(huán)體}
yield在整個(gè)循環(huán)體之前。即使循環(huán)體是一個(gè)被大括號(hào)包圍的代碼塊,也一定把yield放在左括號(hào)之前,而不是代碼塊的最后一個(gè)表達(dá)式之前。請(qǐng)抵擋住寫(xiě)成如下方式的誘惑:
- for (file < -filesHere if file.getName.endsWith(".scala")) {
- yield file // 語(yǔ)法錯(cuò)誤!
- }
例如,代碼7.10展示的for表達(dá)式首先把包含了所有當(dāng)前目錄的文件的名為filesHere的Array[File],轉(zhuǎn)換成一個(gè)僅包含.scala文件的數(shù)組。對(duì)于每一個(gè)對(duì)象,產(chǎn)生一個(gè)Iterator[String](fileLines方法的結(jié)果,定義展示在代碼7.8中),提供方法next和hasNext讓你枚舉集合的每個(gè)元素。這個(gè)原始的枚舉器又被轉(zhuǎn)換為另一個(gè)Iterator[String]僅包含含有子字串"for"的修剪過(guò)的行。最終,對(duì)每一行產(chǎn)生整數(shù)長(zhǎng)度。這個(gè)for表達(dá)式的結(jié)果就是一個(gè)包含了這些長(zhǎng)度的Array[Int]數(shù)組。
- val forLineLengths =
- for {
- file < - filesHere
- if file.getName.endsWith(".scala")
- line < - fileLines(file)
- trimmed = line.trim
- if trimmed.matches(".*for.*")
- } yield trimmed.length
代碼 7.10 用for把Array[File]轉(zhuǎn)換為Array[Int]
【相關(guān)閱讀】