自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

面試官:HashSet如何保證元素不重復(fù)?

開發(fā) 前端
HashSet 實(shí)現(xiàn)了 Set 接口,由哈希表(實(shí)際是 HashMap)提供支持。HashSet 不保證集合的迭代順序,但允許插入 null 值。也就是說 HashSet 不能保證元素插入順序和迭代順序相同。

[[441322]]

HashSet 實(shí)現(xiàn)了 Set 接口,由哈希表(實(shí)際是 HashMap)提供支持。HashSet 不保證集合的迭代順序,但允許插入 null 值。也就是說 HashSet 不能保證元素插入順序和迭代順序相同。HashSet 具備去重的特性,也就是說它可以將集合中的重復(fù)元素自動過濾掉,保存存儲在 HashSet 中的元素都是唯一的。

1.HashSet 基本用法

HashSet 基本操作方法有:add(添加)、remove(刪除)、contains(判斷某個元素是否存在)和 size(集合數(shù)量)。這些方法的性能都是固定操作時間,如果哈希函數(shù)是將元素分散在桶中的正確位置。HashSet 基本使用如下:

  1. // 創(chuàng)建 HashSet 集合 
  2. HashSet<String> strSet = new HashSet<>(); 
  3. // 給 HashSet 添加數(shù)據(jù) 
  4. strSet.add("Java"); 
  5. strSet.add("MySQL"); 
  6. strSet.add("Redis"); 
  7. // 循環(huán)打印 HashSet 中的所有元素 
  8. strSet.forEach(s -> System.out.println(s)); 

2.HashSet 無序性

HashSet 不能保證插入元素的順序和循環(huán)輸出元素的順序一定相同,也就是說 HashSet 其實(shí)是無序的集合,具體代碼示例如下:

  1. HashSet<String> mapSet = new HashSet<>(); 
  2. mapSet.add("深圳"); 
  3. mapSet.add("北京"); 
  4. mapSet.add("西安"); 
  5. // 循環(huán)打印 HashSet 中的所有元素 
  6. mapSet.forEach(m -> System.out.println(m)); 

以上程序的執(zhí)行結(jié)果如下:

從上述代碼和執(zhí)行結(jié)果可以看出,HashSet 插入的順序是:深圳 -> 北京 -> 西安,而循環(huán)打印的順序卻是:西安 -> 深圳 -> 北京,所以 HashSet 是無序的,不能保證插入和迭代的順序一致。

PS:如果要保證插入順序和迭代順序一致,可使用 LinkedHashSet 來替換 HashSet。

3.HashSet 錯誤用法

有人說 HashSet 只能保證基礎(chǔ)數(shù)據(jù)類型不重復(fù),卻不能保證自定義對象不重復(fù)?這樣說對嗎?我們通過以下示例來說明此問題。

3.1 HashSet 與基本數(shù)據(jù)類型

使用 HashSet 存儲基本數(shù)據(jù)類型,實(shí)現(xiàn)代碼如下:

  1. HashSet<Long> longSet = new HashSet<>(); 
  2. longSet.add(666l); 
  3. longSet.add(777l); 
  4. longSet.add(999l); 
  5. longSet.add(666l); 
  6. // 循環(huán)打印 HashSet 中的所有元素 
  7. longSet.forEach(l -> System.out.println(l)); 

以上程序的執(zhí)行結(jié)果如下:

從上述結(jié)果可以看出,使用 HashSet 可以保證基礎(chǔ)數(shù)據(jù)類型不重復(fù)。

3.2 HashSet 與自定義對象類型

接下來,將自定義對象存儲到 HashSet 中,實(shí)現(xiàn)代碼如下:

  1. public class HashSetExample { 
  2.     public static void main(String[] args) { 
  3.         HashSet<Person> personSet = new HashSet<>(); 
  4.         personSet.add(new Person("曹操""123")); 
  5.         personSet.add(new Person("孫權(quán)""123")); 
  6.         personSet.add(new Person("曹操""123")); 
  7.         // 循環(huán)打印 HashSet 中的所有元素 
  8.         personSet.forEach(p -> System.out.println(p)); 
  9.     } 
  10. @Getter 
  11. @Setter 
  12. @ToString 
  13. class Person { 
  14.     private String name
  15.     private String password
  16.  
  17.     public Person(String name, String password) { 
  18.         this.name = name
  19.         this.password = password
  20.     } 

以上程序的執(zhí)行結(jié)果如下:

從上述結(jié)果可以看出,自定義對象類型確實(shí)沒有被去重,那也就是說 HashSet 不能實(shí)現(xiàn)自定義對象類型的去重咯?其實(shí)并不是,HashSet 去重功能是依賴元素的 hashCode 和 equals 方法判斷的,通過這兩個方法返回的都是 true 那就是相同對象,否則就是不同對象。而前面的 Long 類型元素之所以能實(shí)現(xiàn)去重,正是因?yàn)?Long 類型中已經(jīng)重寫了 hashCode 和 equals 方法,具體實(shí)現(xiàn)源碼如下:

  1. @Override 
  2. public int hashCode() { 
  3.     return Long.hashCode(value); 
  4. public boolean equals(Object obj) { 
  5.     if (obj instanceof Long) { 
  6.         return value == ((Long)obj).longValue(); 
  7.     } 
  8.     return false
  9. //省略其他源碼...... 

更多關(guān)于 hashCode 和 equals 的內(nèi)容,詳見:https://mp.weixin.qq.com/s/40zaEJEkQYM3Awk2EwIrWA

那么,想讓 HashSet 支持自定義對象去重,只需要在自定義對象中重寫 hashCode 和 equals 方法即可,具體實(shí)現(xiàn)代碼如下:

  1. @Setter 
  2. @Getter 
  3. @ToString 
  4. class Person { 
  5.     private String name
  6.     private String password
  7.     public Person(String name, String password) { 
  8.         this.name = name
  9.         this.password = password
  10.     } 
  11.     @Override 
  12.     public boolean equals(Object o) { 
  13.         if (this == o) return true; // 引用相等返回 true 
  14.         // 如果等于 null,或者對象類型不同返回 false 
  15.         if (o == null || getClass() != o.getClass()) return false
  16.         // 強(qiáng)轉(zhuǎn)為自定義 Person 類型 
  17.         Person persion = (Person) o; 
  18.         // 如果 name 和 password 都相等,就返回 true 
  19.         return Objects.equals(name, persion.name) && 
  20.                 Objects.equals(password, persion.password); 
  21.     } 
  22.     @Override 
  23.     public int hashCode() { 
  24.         // 對比 name 和 password 是否相等 
  25.         return Objects.hash(namepassword); 
  26.     } 

重新運(yùn)行以上代碼,執(zhí)行結(jié)果如下圖所示:圖片從上述結(jié)果可以看出,之前的重復(fù)項(xiàng)“曹操”已經(jīng)被去重了。

4.HashSet 如何保證元素不重復(fù)?

我們只要了解了 HashSet 執(zhí)行添加元素的流程,就能知道為什么 HashSet 能保證元素不重復(fù)了?HashSet 添加元素的執(zhí)行流程是:當(dāng)把對象加入 HashSet 時,HashSet 會先計(jì)算對象的 hashcode 值來判斷對象加入的位置,同時也會與其他加入的對象的 hashcode 值作比較,如果沒有相符的 hashcode,HashSet 會假設(shè)對象沒有重復(fù)出現(xiàn),會將對象插入到相應(yīng)的位置中。但是如果發(fā)現(xiàn)有相同 hashcode 值的對象,這時會調(diào)用對象的 equals() 方法來檢查對象是否真的相同,如果相同,則 HashSet 就不會讓重復(fù)的對象加入到 HashSet 中,這樣就保證了元素的不重復(fù)。

為了更清楚的了解 HashSet 的添加流程,我們可以嘗試閱讀 HashSet 的具體實(shí)現(xiàn)源碼,HashSet 添加方法的實(shí)現(xiàn)源碼如下(以下源碼基于 JDK 8):

  1. // hashmap 中 put() 返回 null 時,表示操作成功 
  2. public boolean add(E e) { 
  3.     return map.put(e, PRESENT)==null

從上述源碼可以看出 HashSet 中的 add 方法,實(shí)際調(diào)用的是 HashMap 中的 put,那么我們繼續(xù)看 HashMap 中的 put 實(shí)現(xiàn):

  1. final V putVal(int hash, K key, V value, boolean onlyIfAbsent, 
  2.                 boolean evict) { 
  3.      Node<K, V>[] tab; 
  4.      Node<K, V> p; 
  5.      int n, i; 
  6.      //如果哈希表為空,調(diào)用 resize() 創(chuàng)建一個哈希表,并用變量 n 記錄哈希表長度 
  7.      if ((tab = table) == null || (n = tab.length) == 0) 
  8.          n = (tab = resize()).length; 
  9.      /** 
  10.       * 如果指定參數(shù) hash 在表中沒有對應(yīng)的桶,即為沒有碰撞 
  11.       * Hash函數(shù),(n - 1) & hash 計(jì)算 key 將被放置的槽位 
  12.       * (n - 1) & hash 本質(zhì)上是 hash % n 位運(yùn)算更快 
  13.       */ 
  14.      if ((p = tab[i = (n - 1) & hash]) == null
  15.          // 直接將鍵值對插入到 map 中即可 
  16.          tab[i] = newNode(hash, key, value, null); 
  17.      else {// 桶中已經(jīng)存在元素 
  18.          Node<K, V> e; 
  19.          K k; 
  20.          // 比較桶中第一個元素(數(shù)組中的結(jié)點(diǎn))的 hash 值相等,key 相等 
  21.          if (p.hash == hash && 
  22.                  ((k = p.key) == key || (key != null && key.equals(k)))) 
  23.              // 將第一個元素賦值給 e,用 e 來記錄 
  24.              e = p; 
  25.              // 當(dāng)前桶中無該鍵值對,且桶是紅黑樹結(jié)構(gòu),按照紅黑樹結(jié)構(gòu)插入 
  26.          else if (p instanceof TreeNode) 
  27.              e = ((TreeNode<K, V>) p).putTreeVal(this, tab, hash, key, value); 
  28.              // 當(dāng)前桶中無該鍵值對,且桶是鏈表結(jié)構(gòu),按照鏈表結(jié)構(gòu)插入到尾部 
  29.          else { 
  30.              for (int binCount = 0; ; ++binCount) { 
  31.                  // 遍歷到鏈表尾部 
  32.                  if ((e = p.next) == null) { 
  33.                      p.next = newNode(hash, key, value, null); 
  34.                      // 檢查鏈表長度是否達(dá)到閾值,達(dá)到將該槽位節(jié)點(diǎn)組織形式轉(zhuǎn)為紅黑樹 
  35.                      if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st 
  36.                          treeifyBin(tab, hash); 
  37.                      break; 
  38.                  } 
  39.                  // 鏈表節(jié)點(diǎn)的<key, value>與 put 操作<key, value> 
  40.                  // 相同時,不做重復(fù)操作,跳出循環(huán) 
  41.                  if (e.hash == hash && 
  42.                          ((k = e.key) == key || (key != null && key.equals(k)))) 
  43.                      break; 
  44.                  p = e; 
  45.              } 
  46.          } 
  47.          // 找到或新建一個 key 和 hashCode 與插入元素相等的鍵值對,進(jìn)行 put 操作 
  48.          if (e != null) { // existing mapping for key 
  49.              // 記錄 e 的 value 
  50.              V oldValue = e.value; 
  51.              /** 
  52.               * onlyIfAbsent 為 false 或舊值為 null 時,允許替換舊值 
  53.               * 否則無需替換 
  54.               */ 
  55.              if (!onlyIfAbsent || oldValue == null
  56.                  e.value = value; 
  57.              // 訪問后回調(diào) 
  58.              afterNodeAccess(e); 
  59.              // 返回舊值 
  60.              return oldValue; 
  61.          } 
  62.      } 
  63.      // 更新結(jié)構(gòu)化修改信息 
  64.      ++modCount; 
  65.      // 鍵值對數(shù)目超過閾值時,進(jìn)行 rehash 
  66.      if (++size > threshold) 
  67.          resize(); 
  68.      // 插入后回調(diào) 
  69.      afterNodeInsertion(evict); 
  70.      return null
  71.  } 

從上述源碼可以看出,當(dāng)將一個鍵值對放入 HashMap 時,首先根據(jù) key 的 hashCode() 返回值決定該 Entry 的存儲位置。如果有兩個 key 的 hash 值相同,則會判斷這兩個元素 key 的 equals() 是否相同,如果相同就返回 true,說明是重復(fù)鍵值對,那么 HashSet 中 add() 方法的返回值會是 false,表示 HashSet 添加元素失敗。因此,如果向 HashSet 中添加一個已經(jīng)存在的元素,新添加的集合元素不會覆蓋已有元素,從而保證了元素的不重復(fù)。如果不是重復(fù)元素,put 方法最終會返回 null,傳遞到 HashSet 的 add 方法就是添加成功。

總結(jié)

HashSet 底層是由 HashMap 實(shí)現(xiàn)的,它可以實(shí)現(xiàn)重復(fù)元素的去重功能,如果存儲的是自定義對象必須重寫 hashCode 和 equals 方法。HashSet 保證元素不重復(fù)是利用 HashMap 的 put 方法實(shí)現(xiàn)的,在存儲之前先根據(jù) key 的 hashCode 和 equals 判斷是否已存在,如果存在就不在重復(fù)插入了,這樣就保證了元素的不重復(fù)。

 

責(zé)任編輯:武曉燕 來源: Java面試真題解析
相關(guān)推薦

2024-02-28 10:14:47

Redis數(shù)據(jù)硬盤

2023-09-01 15:27:31

2020-08-06 07:49:57

List元素集合

2021-10-22 08:37:13

消息不丟失rocketmq消息隊(duì)列

2023-11-27 08:32:02

元素HashMap

2024-10-29 08:17:43

2025-03-10 11:48:22

項(xiàng)目服務(wù)設(shè)計(jì)

2015-08-13 10:29:12

面試面試官

2023-02-16 08:10:40

死鎖線程

2020-09-30 06:49:25

MySQL查詢刪除

2024-01-15 10:38:20

多級緩存數(shù)據(jù)一致性分布式緩存

2023-01-26 02:07:51

HashSet線程安全

2024-06-18 08:26:22

2024-03-18 14:06:00

停機(jī)Spring服務(wù)器

2024-02-20 14:10:55

系統(tǒng)緩存冗余

2021-07-06 07:08:18

管控數(shù)據(jù)數(shù)倉

2024-09-11 22:51:19

線程通訊Object

2010-08-12 16:28:35

面試官

2024-04-03 00:00:00

Redis集群代碼

2023-11-20 10:09:59

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號