自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

HashMap的負(fù)載因子初始值為什么是0.75?這篇文章以最通俗的方式告訴你答案

開發(fā) 前端
對(duì)于HashMap的研究,我之前一直停留在考慮源碼是如何實(shí)現(xiàn)的,現(xiàn)在當(dāng)我重新再來看的時(shí)候,才發(fā)現(xiàn),系統(tǒng)默認(rèn)的各種參數(shù)值,才是HashMap的精華所在。

 [[387428]]

之前寫過一篇專門介紹HashMap的文章,反響很不錯(cuò),不過在留言區(qū)問的最多的問題就是HashMap的負(fù)載因子初始值為什么是0.75,私下又好好地研究了一番,總結(jié)了這篇文章。

本篇文章基于JDK1.8,特在此說明。

HashMap(基于jdk1.8源碼分析,也是我反響最好的一篇了,不要錯(cuò)過)

OK。下面我們就開始進(jìn)行分析。

一、負(fù)載因子的作用

對(duì)于HashMap的研究,我之前一直停留在考慮源碼是如何實(shí)現(xiàn)的,現(xiàn)在當(dāng)我重新再來看的時(shí)候,才發(fā)現(xiàn),系統(tǒng)默認(rèn)的各種參數(shù)值,才是HashMap的精華所在。

負(fù)載因子是和擴(kuò)容機(jī)制有關(guān)的,意思是如果當(dāng)前容器的容量,達(dá)到了我們?cè)O(shè)定的最大值,就要開始執(zhí)行擴(kuò)容操作。舉個(gè)例子來解釋,避免小白聽不懂:

比如說當(dāng)前的容器容量是16,負(fù)載因子是0.75,16*0.75=12,也就是說,當(dāng)容量達(dá)到了12的時(shí)候就會(huì)進(jìn)行擴(kuò)容操作。

他的作用很簡(jiǎn)單,相當(dāng)于是一個(gè)擴(kuò)容機(jī)制的閾值。當(dāng)超過了這個(gè)閾值,就會(huì)觸發(fā)擴(kuò)容機(jī)制。HashMap源碼已經(jīng)為我們默認(rèn)指定了負(fù)載因子是0.75。

  1. public class HashMap<K,V> extends AbstractMap<K,V> 
  2.     implements Map<K,V>, Cloneable, Serializable { 
  3.     //略 
  4.     static final float DEFAULT_LOAD_FACTOR = 0.75f; 
  5.     //略 
  6.     public HashMap(int initialCapacity, float loadFactor) { 
  7.         if (initialCapacity < 0) 
  8.             throw new IllegalArgumentException("Illegal initial capacity: " + 
  9.                                                initialCapacity); 
  10.         if (initialCapacity > MAXIMUM_CAPACITY) 
  11.             initialCapacity = MAXIMUM_CAPACITY; 
  12.         if (loadFactor <= 0 || Float.isNaN(loadFactor)) 
  13.             throw new IllegalArgumentException("Illegal load factor: " + 
  14.                                                loadFactor); 
  15.         this.loadFactor = loadFactor; 
  16.         this.threshold = tableSizeFor(initialCapacity); 
  17.     } 
  18.     //略 

我截取了部分源碼,從這里可以看出,系統(tǒng)默認(rèn)的負(fù)載因子值就是0.75,而且我們還可以在構(gòu)造方法中去指定。下面我們就正式來分析一下為什么是默認(rèn)的0.75。

二、原因解釋(重點(diǎn))

我們?cè)诳紤]HashMap的時(shí)候,首先要想到的是HashMap只是一個(gè)數(shù)據(jù)結(jié)構(gòu),既然是數(shù)據(jù)結(jié)構(gòu)最主要的就是節(jié)省時(shí)間和空間。負(fù)載因子的作用肯定也是節(jié)省時(shí)間和空間。為什么節(jié)省呢?我們考慮兩種極端情況。

1、負(fù)載因子是1.0

我們先看HashMap的底層數(shù)據(jù)結(jié)構(gòu)

我們的數(shù)據(jù)一開始是保存在數(shù)組里面的,當(dāng)發(fā)生了Hash碰撞的時(shí)候,就是在這個(gè)數(shù)據(jù)節(jié)點(diǎn)上,生出一個(gè)鏈表,當(dāng)鏈表長(zhǎng)度達(dá)到一定長(zhǎng)度的時(shí)候,就會(huì)把鏈表轉(zhuǎn)化為紅黑樹。

當(dāng)負(fù)載因子是1.0的時(shí)候,也就意味著,只有當(dāng)數(shù)組的8個(gè)值(這個(gè)圖表示了8個(gè))全部填充了,才會(huì)發(fā)生擴(kuò)容。這就帶來了很大的問題,因?yàn)镠ash沖突時(shí)避免不了的。當(dāng)負(fù)載因子是1.0的時(shí)候,意味著會(huì)出現(xiàn)大量的Hash的沖突,底層的紅黑樹變得異常復(fù)雜。對(duì)于查詢效率極其不利。這種情況就是犧牲了時(shí)間來保證空間的利用率。

因此一句話總結(jié)就是負(fù)載因子過大,雖然空間利用率上去了,但是時(shí)間效率降低了。

2、負(fù)載因子是0.5

負(fù)載因子是0.5的時(shí)候,這也就意味著,當(dāng)數(shù)組中的元素達(dá)到了一半就開始擴(kuò)容,既然填充的元素少了,Hash沖突也會(huì)減少,那么底層的鏈表長(zhǎng)度或者是紅黑樹的高度就會(huì)降低。查詢效率就會(huì)增加。

但是,兄弟們,這時(shí)候空間利用率就會(huì)大大的降低,原本存儲(chǔ)1M的數(shù)據(jù),現(xiàn)在就意味著需要2M的空間。

一句話總結(jié)就是負(fù)載因子太小,雖然時(shí)間效率提升了,但是空間利用率降低了。

3、負(fù)載因子0.75

經(jīng)過前面的分析,基本上為什么是0.75的答案也就出來了,這是時(shí)間和空間的權(quán)衡。當(dāng)然這個(gè)答案不是我自己想出來的。答案就在源碼上,我們可以看看:

  1. /* <p>As a general rule, the default load factor (.75) offers a good 
  2.  * tradeoff between time and space costs.  Higher values decrease the 
  3.  * space overhead but increase the lookup cost (reflected in most of 
  4.  * the operations of the <tt>HashMap</tt> class, including 
  5.  * <tt>get</tt> and <tt>put</tt>).  The expected number of entries in 
  6.  * the map and its load factor should be taken into account when 
  7.  * setting its initial capacity, so as to minimize the number of 
  8.  * rehash operations.  If the initial capacity is greater than the 
  9.  * maximum number of entries divided by the load factor, no rehash 
  10.  * operations will ever occur.*/ 

大致意思就是說負(fù)載因子是0.75的時(shí)候,空間利用率比較高,而且避免了相當(dāng)多的Hash沖突,使得底層的鏈表或者是紅黑樹的高度比較低,提升了空間效率。

OK,寫到這答案基本上就出來了,一句話能總結(jié)的寫成了一篇文章。如有問題,還請(qǐng)批評(píng)指正。

本文轉(zhuǎn)載自微信公眾號(hào)「愚公要移山」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系愚公要移山公眾號(hào)。

 

責(zé)任編輯:武曉燕 來源: 愚公要移山
相關(guān)推薦

2020-02-12 18:55:24

負(fù)載因子初始值為什么

2023-11-30 08:27:38

泛化調(diào)用架構(gòu)

2020-08-19 16:36:53

HashMap紅黑樹閾值

2020-07-09 10:21:03

網(wǎng)絡(luò)排錯(cuò)TCPIP

2018-02-08 18:16:39

數(shù)據(jù)庫MySQL鎖定機(jī)制

2017-07-12 16:56:42

卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)CNN

2017-07-05 15:42:58

卷積神經(jīng)網(wǎng)絡(luò)Non-Euclide計(jì)算機(jī)視覺

2019-01-08 07:43:53

路由器調(diào)制解調(diào)器

2023-04-06 11:10:31

閉包JavaScript

2020-09-18 10:18:08

MySQL數(shù)據(jù)插入數(shù)據(jù)庫

2023-09-22 07:52:16

HDMI 2.14K HDR游戲

2018-03-07 17:47:16

藍(lán)屏計(jì)算機(jī)死機(jī)

2024-04-12 00:00:00

localhost計(jì)算機(jī)機(jī)制

2016-12-19 15:30:16

安全框架信息安全

2017-07-10 13:45:33

自動(dòng)編碼數(shù)據(jù)生成GAN

2023-12-24 22:42:57

數(shù)據(jù)庫分片中間件

2020-04-28 09:15:58

HashMapJava數(shù)組

2019-09-02 09:06:04

無線路由器光貓WiFi

2020-12-10 13:46:35

人工智能

2020-05-06 19:47:15

人工智能AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)