Scala代碼編寫中常見的十大陷阱
原創(chuàng)【51CTO精選譯文】對于支持并發(fā)和分布式處理、高可擴展、基于組件的應用程序來說,Scala的功能是很強大的。它利用了面向對象和函數(shù)式程序設計的優(yōu)點。這種基于Java虛擬機的語言在宣布Twitter正使用它時受到了最多的沖擊(相關51CTO評論:從Scala進駐Twitter看多語言混雜系統(tǒng)的前景)。如果使用正確,Scala可以大量減少應用程序對代碼的需求。
對于Scala編程, 我們收集了這些常見代碼編寫中的陷阱。這些技巧來自于Daniel Sobral,一個曾參加過FreeBSD項目和Java軟件開發(fā)工程的Scala狂熱愛好者。
1. 語法錯誤
認為 “yield” 像 ”return” 一樣。有人會這樣寫:
- for(i <- 0 to 10) {
- if (i % 2 == 0)
- yield i
- else
- yield -i
- }
正確的表示應該是:
- for(i <- 0 to 10)
- yield {
- if (i % 2 == 0)
- i
- else
- -i
- }
2. 誤用和語法錯誤
濫用scala.xml.XML.loadXXX。這個的語法分析器試圖訪問外部的DTD、strip組件或類似的東西。在scala.xml.parsing.ConstructingParser.fromXXX中有另一個可選的語法分析器。同時,在處理XML時忘記了等號兩端的空格。比如:
- val xml=<root/>
這段代碼真正的意思是:
- val xml.$equal$less(root).$slash$greater
這種情況的發(fā)生是由于操作符相當隨意,而且scala采用這樣一種事實:字母數(shù)字字符與非字母數(shù)字字符通過下劃線可以結合成為一個有效的標識符。這也使得“x+y”這樣的表達式不會被當成一個標識符。而應該注意 “x_+”是一個有效的標識符。所以,賦值標識符的寫法應該是:
- val xml = <root/>
3. 用法錯誤
為那些根本不是無關緊要的應用加入Application特征。
- object MyScalaApp extends Application {
- // ... body ...
- }
#t#示例部分的問題在于,body部分在單元對象初始化時執(zhí)行。首先,單元初始化的執(zhí)行是異步的,因此你的整個程序不能與其它線程交互;其次,即時編譯器(JIT)不會優(yōu)化它,因此你的程序速度慢下來,這是沒有必要的。
另外,不能與其它線程的交互也意味著你會忘記測試應用程序的GUI或者Actors。
4. 用法錯誤
試圖模式匹配一個字符串的正則表達式,而又假定該正則表達式是無界的:
- val r = """(\d+)""".r
- val s = "--> 5 <---"
- s match {
- case r(n) => println("This won't match")
- case _ => println("This will")
- }
此處的問題在于, 當模式模式匹配時, Scala的正則表達式表現(xiàn)為如同開始于”^”,結束于”$”。使之工作的正確寫法是:
- val r = """(\d+)""".r
- val s = "--> 5 <---"
- r findFirstIn s match {
- case Some(n) => println("Matches 5 to "+n)
- case _ => println("Won't match")
- }
或者確保模式能匹配任意前綴和后綴:
- val r = """.*(\d+).*""".r
- val s = "--> 5 <---"
- s match {
- case r(n) => println("This will match the first group of r, "+n+", to 5")
- case _ => println("Won't match")
- }
#p#
5. 用法錯誤
把var和val認為是字段(fields):
Scala強制使用統(tǒng)一訪問準則(Uniform Access Principle),這使得我們無法直接引用一個字段。所有對任意字段的訪問只能通過getters和setters。val和var事實上只是定義一個字段,getter作為val字段,對于var則定義一個setter。
#t#Java程序員通常認為var和val是字段,而當發(fā)現(xiàn)在他們的方法中它們共享相同的命名空間時,常常覺得驚訝。因此,不能重復使用它們的名字。共享命名空間的是自動定義的getter和setter而不是字段本身。通常程序員們會試圖尋找一種訪問字段的方法,從而可以繞過限制——但這只是徒勞,統(tǒng)一訪問準則是無法違背的。它的另一個后果是,當進行子類化時val會覆蓋def。其它方法是行不通的,因為val增加了不變性保證,而def沒有。
當你需要重載時,沒有任何準則會指導你如何使用私有的getters和setters。Scala編譯器和庫代碼常使用私有值的別名和縮寫,反之公有的getters和setters則使用fullyCamelNamingConventions(一種命名規(guī)范)。其它的建議包括:重命名、實例中的單元化,甚至子類化。這些建議的例子如下:
重命名
- class User(val name: String, initialPassword: String) {
- private lazy var encryptedPassword = encrypt(initialPassword, salt)
- private lazy var salt = scala.util.Random.nextInt
- private def encrypt(plainText: String, salt: Int): String = { ... }
- private def decrypt(encryptedText: String, salt: Int): String = { ... }
- def password = decrypt(encryptedPassword, salt)
- def password_=(newPassword: String) = encrypt(newPassword, salt)
- }
單例模式(Singleton)
- class User(initialName: String, initialPassword: String) {
- private object fields {
- var name: String = initialName;
- var password: String = initialPassword;
- }
- def name = fields.name
- def name_=(newName: String) = fields.name = newName
- def password = fields.password
- def password_=(newPassword: String) = fields.password = newPassword
- }
或者,對于一個類來說,可以為相等關系或hashCode自動定義可被重用的方法
- class User(name0: String, password0: String) {
- private case class Fields(var name: String, var password0: String)
- private object fields extends Fields(name0, password0)
- def name = fields.name
- def name_=(newName: String) = fields.name = newName
- def password = fields.password
- def password_=(newPassword: String) = fields.password = newPassword
- }
子類化
- case class Customer(name: String)
- class ValidatingCustomer(name0: String) extends Customer(name0) {
- require(name0.length < 5)
- def name_=(newName : String) =
- if (newName.length < 5) error("too short")
- else super.name_=(newName)
- }
- val cust = new ValidatingCustomer("xyz123")
6. 用法錯誤
忘記類型擦除(type erasure)。當你聲明了一個類C[A]、一個泛型T[A]或者一個函數(shù)或者方法m[A]后,A在運行時并不存在。這意味著,對于實例來講,任何參數(shù)都將被編譯成AnyRef,即使編譯器能夠保證在編譯過程中類型不會被忽略掉。
這也意味著在編譯時你不能使用類型參數(shù)A。例如,下面這些代碼將不會工作:
- def checkList[A](l: List[A]) = l match {
- case _ : List[Int] => println("List of Ints")
- case _ : List[String] => println("List of Strings")
- case _ => println("Something else")
- }
在運行時,被傳遞的List沒有類型參數(shù)。 而List[Int]和List[String]都將會變成List[_]. 因此只有第一種情況會被調用。
你也可以在一定范圍內不使用這種方法,而采用實驗性的特性Manifest, 像這樣:
- def checkList[A](l: List[A])(implicit m: scala.reflect.Manifest[A]) = m.toString match {
- case "int" => println("List of Ints")
- case "java.lang.String" => println("List of Strings")
- case _ => println("Something else")
- }
#p#
7. 設計錯誤
Implicit關鍵字的使用不小心。Implicits非常強大,但要小心,普通類型不能使用隱式參數(shù)或者進行隱匿轉換。
例如,下面一個implicit表達式:
- implicit def string2Int(s: String): Int = s.toInt
這是一個不好的做法,因為有人可能錯誤的使用了一個字符串來代替Int。對于上面的這種情況,更好的方法是使用一個類。
- case class Age(n: Int)
- implicit def string2Age(s: String) = Age(s.toInt)
- implicit def int2Age(n: Int) = new Age(n)
- implicit def age2Int(a: Age) = a.n
這將會使你很自由的將Age與String或者Int結合起來,而不是讓String和Int結合。類似的,當使用隱式參數(shù)時,不要像這樣做:
- case class Person(name: String)(implicit age: Int)
這不僅因為它容易在隱式參數(shù)間產生沖突,而且可能導致在毫無提示情況下傳遞一個隱式的age, 而接收者需要的只是隱式的Int或者其它類型。同樣,解決辦法是使用一個特定的類。
另一種可能導致implicit用法出問題的情況是有偏好的使用操作符。你可能認為”~”是字符串匹配時最好的操作符,而其他人可能會使用矩陣等價(matrix equivalence),分析器連接等(符號)。因此,如果你使用它們,請確保你能夠很容易的分離其作用域。
8. 設計錯誤
設計不佳的等價方法。尤其是:
◆試著使用“==”代替“equals”(這讓你可以使用“!=”)
◆使用這樣的定義:
- def equals(other: MyClass): Boolean
而不是這樣的:
- override def equals(other: Any): Boolean
◆忘記重載hashCode,以確保當a==b時a.hashCode==b.hashCode(反之不一定成立)。
◆不可以這樣做交換: if a==b then b==a。特別地,當考慮子類化時,超類是否知道如何與一個子類進行對比,即使它不知道該子類是否存在。如果需要請查看canEquals的用法。
◆不可以這樣做傳遞: if a==b and b ==c then a==c。
9. 用法錯誤
在Unix/Linux/*BSD的系統(tǒng)中,對你的主機進行了命名卻沒有在主機文件中聲明。特別的,下面這條指令不會工作:
- ping `hostname`
#t#在這種情況下,fsc和scala都不會工作,而scalac則可以。這是因為fsc運行在背景模式下,通過TCP套接字監(jiān)聽連接來加速編譯,而scala卻用它來加快腳本的執(zhí)行速度。
10.風格錯誤
使用while。雖然它有自己的用處,但大多數(shù)時候使用for往往更好。在談到for時,用它們來產生索引不是一個好的做法。
避免這樣的使用:
- def matchingChars(string: String, characters: String) = {
- var m = ""
- for(i <- 0 until string.length)
- if ((characters contains string(i)) && !(m contains string(i)))
- m += string(i)
- m
- }
而應該使用:
- def matchingChars(string: String, characters: String) = {
- var m = ""
- for(c <- string)
- if ((characters contains c) && !(m contains c))
- m += c
- m
- }
如果有人需要返回一個索引,可以使用下面的形式來代替按索引迭代的方法。如果對性能有要求,它可以較好的應用在投影(projection)(Scala 2.7)和視圖(Scala 2.8)中。
- def indicesOf(s: String, c: Char) = for {
- (sc, index) <- s.zipWithIndex
- if c == sc
- } yield index
【51CTO.com譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com,且不得修改原文內容?!?/p>
原文:10 Scala Programming Pitfalls 作者:mitchp