自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

關(guān)于equals和hashCode,看這一篇真的夠了!

開發(fā) 后端
但是隨著工作的深入,我發(fā)現(xiàn)其實自己對于equals()和hashCode()的理解,也處在一個很低級的階段。因此痛定思痛,進行了一番深入學習,才敢來寫這篇博客。

 這幾天在嘗試手擼一個類似Lombok的注解式代碼生成工具,用過Lombok的小伙伴知道,Lombok可以通過注解自動幫我們生產(chǎn)equals()和hashCode()方法,因此我也想實現(xiàn)這個功能,但是隨著工作的深入,我發(fā)現(xiàn)其實自己對于equals()和hashCode()的理解,也處在一個很低級的階段。

因此痛定思痛,進行了一番深入學習,才敢來寫這篇博客。

1、equals在Java中含義

首先要解釋清楚這個,equals方法在Java中代表邏輯上的相等,什么叫邏輯上的相等?這個就涉及到Java本身的語法特性。

我們知道,Java中存在著==來判斷基本數(shù)據(jù)類型的相等,但是對于對象,==只能判斷內(nèi)存地址是否相等,也就是說是否是同一個對象: 

  1. int a = 10000 
  2. int b = 10000 
  3. // 對于基本數(shù)據(jù)類型, == 可以判斷邏輯上的相等  
  4. System.out.println(a == b);  
  5. Integer objA = 10000 
  6. Integer objB = 10000 
  7. Integer objAobjA1 = objA;  
  8. // 對于類實例, == 只能判斷是否為同一個實例(可以視為內(nèi)存地址是否相等)  
  9. System.out.println(objA == objB);  
  10. System.out.println(objA == objA1); 

注:這里我們不討論Integer對于-128~127的緩存機制。

結(jié)果顯而易見:

但是明明 objA和objB邏輯上是相等的,憑什么你就返回false?這時就誕生了一種需求,對于Java中的對象,要判斷邏輯相等,該怎么實現(xiàn)呢,于是就出現(xiàn)了equals()方法。 

  1. Integer objA = 10000 
  2. Integer objB = 10000 
  3. Integer objAobjA1 = objA;  
  4. // 對于對象實例, equals 可以判斷兩個對象是否邏輯相等  
  5.        System.out.println(objA.equals(objB)); 

Integer類已經(jīng)重寫了equals()方法,所以結(jié)果也顯而易見:

因此如果我們自己創(chuàng)建一個類的話, 要實現(xiàn)判斷兩個實例邏輯上是否相等,就需要重寫他的equals()方法。 

  1. // 重寫了equals方法的類  
  2. static class GoodExample {  
  3.     private String name;  
  4.     private int age;  
  5.     public GoodExample(String name, int age) {  
  6.         this.name = name;  
  7.         this.age = age;  
  8.     }  
  9.     @Override  
  10.     public boolean equals(Object o) {  
  11.         if (this == o) return true;  
  12.         if (o == null || getClass() != o.getClass()) return false;  
  13.         GoodExample that = (GoodExample) o;  
  14.         return age == that.age &&  
  15.                 Objects.equals(name, that.name);  
  16.     }  
  17.  
  18. // 沒有重寫euqals方法的類  
  19. static class BadExample {  
  20.     private String nakeName; 
  21.      private int age;  
  22.     public BadExample(String nakeName, int age) {  
  23.         this.nakeName = nakeName;  
  24.         this.age = age;  
  25.     } 
  26.  
  27. public static void main(String[] args) {  
  28.     System.out.println(new GoodExample("Richard", 36). 
  29.             equals(new GoodExample("Richard", 36)));  
  30.     System.out.println(new BadExample("Richard", 36).  
  31.             equals(new BadExample("Richard", 36)));  

相信你已經(jīng)知道結(jié)果是什么了:

2、hashCode在Java中的作用

網(wǎng)上有很多博客都把hashCode()和equals()混為一談,但實際上hashCode()就是他的字面意思,代表這個對象的哈希碼。

但是為什么JavaDoc明確的告訴我們,hashCode()和equals()要一起重寫呢?原因是因為,在Java自帶的容器HashMap和HashSet中,都需同時要用到對象的hashCode()和equals()方法來進行判斷,然后再插入刪除元素,這點我們一會再談。

那么我們還是單獨來看hashCode(),為什么HashMap需要用到hashCode?這個就涉及到HashMap底層的數(shù)據(jù)結(jié)構(gòu) – 散列表的原理:

HashMap底層用于存儲數(shù)據(jù)的結(jié)構(gòu)其實是散列表(也叫哈希表),散列表是通過哈希函數(shù)將元素映射到數(shù)組指定下標位置,在Java中,這個哈希函數(shù)其實就是hashCode()方法。

舉個例子: 

  1. HashMap<String,GoodExample> map = new HashMap<>();  
  2. map.put("cringkong",new GoodExample("jack",10));  
  3. map.put("cricy",new GoodExample("lisa",12));  
  4. System.out.println(map.get("cricy")); 

在存入HashMap的時候,HashMap會用字符串"cringkong"和"cricy"的hashCode()去映射到數(shù)組指定下標位置,至于怎么去映射,我們一會再說。

好了,現(xiàn)在我們明白了hashCode()為什么被設(shè)計出來,那么我們來進行一個實驗: 

  1. // 科學設(shè)計了hashCode的類  
  2. static class GoodExample {  
  3.     private String name;  
  4.     private int age;  
  5.     public GoodExample(String name, int age) {  
  6.         this.name = name;  
  7.         this.age = age;  
  8.     }  
  9.     @Override  
  10.     public int hashCode() {  
  11.         return Objects.hash(name, age);  
  12.     }  
  13.  
  14. // 不科學的hashCode寫法  
  15. static class BadExample {  
  16.     private String nakeName;  
  17.     private int age;  
  18.     public BadExample(String nakeName, int age) {  
  19.         this.nakeName = nakeName;  
  20.         this.age = age;  
  21.     }  
  22.     @Override  
  23.     public int hashCode() {  
  24.         // 這里我們沒有用  
  25.         return nakeName.hashCode();  
  26.     }  

這里我們存在兩個類,GoodExample類通過類全部字段進行hash運算得到hashCode,而BadExample只通過類的一個字段進行hash運算,我們來看一下得到的結(jié)果: 

  1. System.out.println(new GoodExample("李老三", 22).hashCode());  
  2. System.out.println(new GoodExample("李老三", 42).hashCode()); 
  3. System.out.println(new BadExample("王老五", 50).hashCode());  
  4. System.out.println(new BadExample("王老五", 25).hashCode()); 

可以看到,GoodExample的hashCode()標明了22歲和42歲的李老三是不同的,而BadExample卻認為50歲和25歲的王老五沒什么區(qū)別。

那么也就是說在HashMap中,兩個李老三會被放到不同的數(shù)組下標位置中,而兩個王老五會被放到同一個數(shù)組下標位置上。

PS : hashCode相等的兩個對象不一定邏輯相等,邏輯相等的兩個對象hashCode必須相等!

3、為什么hashCode和equals要一起重寫

剛剛我們知道,equals()是用來判斷對象是否邏輯相等,hashCode()就是獲得一個對象的hash值,同時再HashMap中用來得到數(shù)組下標位置。

那么為什么很多地方都說到,hashCode()和equals()要一起重寫呢?明明通過對象hashCode就可以定位數(shù)組下標了啊,那我們直接用把對象存進去取出來不就行了嗎?

答案是這樣的:設(shè)計再良好的哈希函數(shù),也會出現(xiàn)哈希沖突的情況,什么是哈希沖突呢?舉個例子來說,我設(shè)計了這樣一種哈希函數(shù):    

  1. /**  
  2.          * 硬核哈希函數(shù),哈希規(guī)則是 傳入的字符串的首位字符轉(zhuǎn)換成ASCII值  
  3.          *  
  4.          * @param string 需要哈希的字符串  
  5.          * @return 字符串的哈希值  
  6.          */  
  7.         private static int hardCoreHash(String string) {  
  8.             return string.charAt(0);  
  9.         } 

我們來測試一下硬核哈希函數(shù)的哈希效果: 

  1. System.out.println(hardCoreHash("fish"));  
  2. System.out.println(hardCoreHash("cat")); 
  3. System.out.println(hardCoreHash("fuck")); 

可以看到, "fish" 和 "fuck"出現(xiàn)了哈希沖突,這是我們不想看到的,一旦出現(xiàn)了哈希沖突,我們的哈希表就需要解決哈希沖突,一般解方式有:

  •  開發(fā)定址法(線性探測再散列,二次探測再散列,偽隨機探測再散列)
  •  再哈希法
  •  鏈地址法
  •  建立一個公共溢出區(qū)

這都是數(shù)據(jù)結(jié)構(gòu)課本上的東西,我就不再細講了,不懂的同學自行搜索!

就像我之前說的,設(shè)計再精良的哈希函數(shù),也會有哈希沖突的情況出現(xiàn),Java中的hashCode()本身就是一種哈希函數(shù),必然會出現(xiàn)哈希沖突,更怕一些程序員寫出某些硬核哈希函數(shù)。

既然存在哈希沖突,我們就得解決,HashMap采用的是鏈地址法來解決:(偷張圖…

這里就存在一種極端情況,如何判斷是究竟是兩個 邏輯相等的對象重復(fù)寫入,還是兩個邏輯不等的對象出現(xiàn)了哈希沖突呢?

很簡單,用equals()方法判斷不就完事了嗎,我們之前說了,equals()方法就是用來設(shè)計判斷兩個對象是否邏輯相等的啊!

我們來看一段HashCode簡單的取出key對應(yīng)value的源碼:

意思很簡單,先判斷這key的 hashCode是否相等,如果不相等,說明key和數(shù)組中對象一定邏輯不相等,就不用再判斷了,如果相等,就繼續(xù)判斷是否邏輯相等,從而確定究竟是出現(xiàn)了哈希沖突,還是確實就是要取這個key的對應(yīng)的值。

所以說到這里,你應(yīng)該明白為什么千叮嚀萬囑咐equals()和hashCode()要一塊重寫了吧。如果這個類的對象要作為HashMap的key,或者要存入HashSet,是必兩個方法都要重寫的,其他情況可以自行斟酌,但是為了安全方便不出錯,就直接一塊重寫了吧。

4、擴展:實現(xiàn)科學的哈希函數(shù)

說的科學的哈希函數(shù),就不得不說經(jīng)典的字符串哈希函數(shù):DJB hash function俗稱Times33的哈希函數(shù): 

  1. unsigned int time33(char *str){  
  2.     unsigned int hash = 5381 
  3.     while(*str){  
  4.         hash += (hash << 5 ) + (*str++);  
  5.     }  
  6.     return (hash & 0x7FFFFFFF);  

這個函數(shù)的實現(xiàn)思路,就是不斷地讓當前的哈希值乘33(左移5位相當于乘上32,然后加上原值相當于乘上33),再加上字符串當前位置的值(ASCII),然后哈希值進入下一輪迭代,直到字符串的最后一位,迭代完成返回哈希值。

為什么說他科學?因為根據(jù)實驗,這種方式的出來哈希值分布比較均勻,就是最小可能性出現(xiàn)哈希沖突,同時計算速度也比較快。

至于初始值5381怎么來的?也是實驗找到的比較科學的一個數(shù)。(怎么感覺說的跟廢話一樣?)

那么Java中的hashCode()有沒有默認實現(xiàn)呢?當然有: 

  1. // Object類中的hashCode函數(shù),是一個native方法,JVM實現(xiàn)  
  2. public native int hashCode(); 

Object類作為所有類的父類,實現(xiàn)了native方法,是一個本地方法,JVM實現(xiàn)我們看不到。

而String類,則默認重寫了hashCode方法,我們看一下實現(xiàn):  

  1. public int hashCode() {  
  2.     // 初始值是0  
  3.      int h = hash 
  4.      if (h == 0 && value.length > 0) {  
  5.          char val[] = value;  
  6.         // 31作為乘子,是不是應(yīng)該叫Timers31呢?  
  7.          for (int i = 0; i < value.length; i++) {  
  8.              h = 31 * h + val[i];  
  9.          }  
  10.          hhash = h;  
  11.      }  
  12.      return h;  
  13.  } 

可以看到,Java選擇了31作為乘子,這也是有他的道理的,根據(jù) Effective Java所說:

選擇數(shù)字31是因為它是一個奇質(zhì)數(shù),如果選擇一個偶數(shù)會在乘法運算中產(chǎn)生溢出,導(dǎo)致數(shù)值信息丟失,因為乘二相當于移位運算。選擇質(zhì)數(shù)的優(yōu)勢并不是特別的明顯,但以往的哈希算法都這樣做。同時,數(shù)字31有一個很好的特性,即乘法運算可以被移位和減法運算取代,來獲取更好的性能:31 * i == (i << 5) - i,現(xiàn)代的 Java 虛擬機可以自動的完成這個優(yōu)化。

總結(jié)一下其實就是兩點原因:

  1.  奇質(zhì)數(shù)作為哈希運算中的乘法因子,得到的哈希值效果比較好(分布均勻)
  2.  JVM對于位運算的優(yōu)化,最后選擇31是因為速度比較快

說這么多,還是實驗出來的結(jié)果,Java開發(fā)人員認為這個數(shù)比較適合JVM平臺。

當然也有大哥做了實驗:科普:為什么 String hashCode 方法選擇數(shù)字31作為乘子

有興趣的小伙伴可以去看看。

而且Java本身也提供了一個工具類,就是之前我用到的java.util.Objects.hash()方法,我們來下他的實現(xiàn)方式: 

  1. public static int hashCode(Object a[]) {  
  2.     if (a == null)  
  3.         return 0;  
  4.     int result = 1 
  5.     // 對于傳入的所有對象都進行一次Timers31  
  6.     for (Object element : a)  
  7.         // 同時用到了每個對象的hashCode()方法  
  8.         result = 31 * result + (element == null ? 0 : element.hashCode());  
  9.     return result;  

總體思路還是一樣的。 

 

責任編輯:龐桂玉 來源: Java技術(shù)棧
相關(guān)推薦

2017-03-11 22:19:09

深度學習

2020-07-06 08:06:00

Java模塊系統(tǒng)

2020-12-10 15:25:51

Docker容器工具

2023-02-10 09:04:27

2020-02-18 16:20:03

Redis ANSI C語言日志型

2022-06-20 09:01:23

Git插件項目

2022-08-01 11:33:09

用戶分析標簽策略

2021-04-08 07:37:39

隊列數(shù)據(jù)結(jié)構(gòu)算法

2023-09-11 08:13:03

分布式跟蹤工具

2019-09-15 19:43:58

邊緣計算邊云協(xié)同物聯(lián)網(wǎng)

2018-05-22 08:24:50

PythonPyMongoMongoDB

2023-10-17 08:15:28

API前后端分離

2024-09-23 08:00:00

消息隊列MQ分布式系統(tǒng)

2020-07-03 08:21:57

Java集合框架

2019-05-14 09:31:16

架構(gòu)整潔軟件編程范式

2020-11-22 08:32:29

人工智能AI

2022-04-07 10:39:21

反射Java安全

2023-11-18 09:30:42

模型AI

2022-07-06 12:07:06

Python函數(shù)式編程

2019-04-01 10:43:59

Linux問題故障
點贊
收藏

51CTO技術(shù)棧公眾號