自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Redis數據結構之簡單動態(tài)字符串SDS

存儲 存儲軟件 Redis
Redis的底層數據結構非常多,其中包括SDS、ZipList、SkipList、LinkedList、HashTable、Intset等。如果你對Redis的理解還只停留在get、set的水平的話,是遠遠不足以應對面試提問的。本文簡單介紹了Redis底層最重要的數據結構 - 簡單動態(tài)字符串(SDS)。

 Redis的底層數據結構非常多,其中包括SDS、ZipList、SkipList、LinkedList、HashTable、Intset等。如果你對Redis的理解還只停留在get、set的水平的話,是遠遠不足以應對面試提問的。本文簡單介紹了Redis底層最重要的數據結構 - 簡單動態(tài)字符串(SDS)。

[[258985]]

Redis使用C語言開發(fā),但并沒有使用C語言傳統(tǒng)的字符串表示(以空字符結尾的字節(jié)數組,以下簡稱C字符串),而是自己構建了一種名為簡單動態(tài)字符串的(simple dynamic string,SDS)的抽象類型,并將SDS用作Redis的默認字符串表示。

在Redis里面,C字符串只會作為字符串字面量(static literal)用在一些無須對字符串值進行修改的地方。當Redis需要的不僅僅是一個字符串字面量,而是一個可以被修改的字符串值時,Redis就會使用SDS來表示字符串值,比如在Redis的數據庫里面,包含字符串的鍵值對在底層都是由SDS實現的。

咱們來舉個例子,如果在客戶端執(zhí)行命令:

  1. redis> SET msg "hello world" 
  2. ok 

那么Redis將在數據庫中創(chuàng)建一個新的鍵值對,其中:

鍵值對的鍵是一個字符串對象,對象的底層實現是一個保存著字符串“msg”的SDS。

鍵值對的值也是一個字符串對象,對象的底層實現是一個保存著字符串“hello world”的SDS。

除了用來保存數據庫中的字符串值之外,SDS還被用作緩沖區(qū):AOF模塊中的AOF緩沖區(qū),以及客戶端狀態(tài)中的輸入緩沖區(qū),都是由SDS實現的??傊?,SDS是Redis的最基礎也是最重要的數據結構。

1.SDS的定義

每個 sds.h/sdshdr 結構表示一個SDS值:

  1. struct sdshdr{ 
  2.     // 記錄buf數組中已使用字節(jié)的數量 
  3.     // 等于SDS所保存字符串的長度 
  4.     int len; 
  5.      
  6.     // 記錄buf數組中未使用字節(jié)的數量 
  7.     int free
  8.     //字節(jié)數組,用于保存字符串 
  9.     char buf[]; 

 

用一張圖來表示:

 

SDS 遵循 C 字符串以空字符結尾的慣例, 保存空字符的 1字節(jié)空間不計算在 SDS 的 len 屬性里面, 并且為空字符分配額外的 1 字節(jié)空間, 以及添加空字符到字符串末尾等操作都是由 SDS 函數自動完成的, 所以這個空字符對于 SDS 的使用者來說是完全透明的。

2.SDS與C字符串的區(qū)別

現在來說,C語言使用長度為N+1的字符數組來表示長度為N的字符串,并且字符數組的***一個元素總是空字符“”。

C的這種簡單的字符串表達方式,并不能滿足Redis對字符串在安全性、效率以及功能方面的要求。具體有以下幾個方面。

2.1 常數復雜度獲取字符串長度

因為C字符串并不記錄字符串的長度信息,所以為了獲取一個C字符串的長度,程序必須遍歷整個字符串,對遇到的每個字符進行計數,直到遇到空字符為止,這個操作的復雜度為O(n)。而在Redis的SDS中,這個時間復雜度只有O(1)。

2.2 杜絕緩沖區(qū)溢出

除了獲取字符串長度的復雜度高之外,C字符不記錄自身長度帶來的另一個問題就是緩沖區(qū)溢出。舉個例子,C語言的 strcat 函數可以將字符串中的內容拼接到 dest 字符串的末尾,但是當字符串的容量不夠就會產生緩存區(qū)溢出,因為字符串也是基于數組實現的,也是有大小限制的。

Redis的SDS已經杜絕了這個問題,那它是如何解決的呢?

當API要對SDS進行修改時,API會先檢查SDS的空間是否滿足修改所需的空間,如果不夠的話,API會自動將SDS的空間進行擴容,然后才執(zhí)行實際的修改操作。這就避免了緩沖區(qū)內存溢出。

2.3 減少修改字符串時帶來的內存重分配次數

上面說到了API會在修改SDS字符串時自動擴容,如果每次修改都伴隨著對字符串內的數組的內存重分配,那效率可想而知。所以Redis實現了空間預分配和惰性空間釋放兩種優(yōu)化策略。

空間預分配

空間預分配用于優(yōu)化SDS的字符串增長操作:當SDS的API對一個SDS進行修改,并且需要對SDS進行空間擴展的時候,程序不僅會為SDS分配修改所需要的空間,還會為SDS分配額外的未使用空間。

總的來說,額外分配的未使用空間數量大小有兩種可能:

如果對SDS修改之后,SDS的長度將小于1MB,那么程序分配和len 屬性同樣大小的未使用空間,這時候SDS的 free 屬性的值將和 len 屬性的值相同。也就是說,該SDS字符串修改完后還有近一半的容量。

如果對SDS修改之后,SDS的長度大于等于1MB,那么程序會分配1MB的未使用空間。這個是固定的。

通過空間預分配,Redis可以減少連續(xù)執(zhí)行字符串操作所需的內存重分配次數。

惰性空間釋放

惰性空間釋放用于優(yōu)化SDS的字符串縮短操作:當SDS的API需要縮短SDS保存的字符串時,程序并不立即使用內存重分配來回收縮短后多出來的字節(jié),而是使用 free 屬性將這些字節(jié)的數量記錄起來,并等待將來使用。

2.4 二進制安全

在C語言中,字符串的存儲必須符合某種編碼(ASCII),并且字符串不能包含空字符,否則會被認為是字符串結尾。這些限制使得C字符串只能保存文本數據,而不能保存像圖片、音頻、視頻、壓縮文件這樣的二進制數據。

所以,為了解決C字符串的不足,Redis的 buf 數組保存的是二進制數據,這也就是把SDS的 buf 數組稱為字節(jié)數組的原因。

2.5 兼容部分C字符串函數

雖然 Redis 的API都是二進制安全的,但它們一樣遵循C字符串以空字符串結尾的慣例,這些API總會將SDS保存的數據的末尾設置為空字符,并且總會在為 buf 數組分配空間時多分配一個字節(jié)來容納這個空字符,這是為了讓那些保存文本數據的SDS可以重用一部分C的函數。

舉個例子, 如果我們有一個 SDS 的指針 s , 那么我們可以直接使用 stdio.h/printf 函數, 通過執(zhí)行以下語句:

  1. printf("%s", s->buf); 

來打印出 SDS 保存的字符串值 "Redis" , 而無須為 SDS 編寫專門的打印函數。

責任編輯:武曉燕 來源: 博客園
相關推薦

2020-06-29 07:44:36

Redis

2021-12-21 11:39:01

數據結構算法同構字符串

2023-10-19 15:11:48

Redis

2022-02-10 09:04:18

RediSDS數據結構

2021-12-24 11:59:47

數據結構算法字符串

2023-03-28 07:44:23

數據結構數組

2020-07-07 07:34:29

RedisSDS數據結構

2024-02-20 20:12:09

C語言字符串Redis

2020-05-13 12:17:33

RedisC字符C語言

2021-04-27 10:53:58

Redis數據庫SDS

2021-02-23 09:35:33

redis字符串數據庫

2021-02-18 07:45:09

redis 字符串SDS

2021-12-23 14:09:43

數據結構算法字符串

2023-01-09 08:42:04

String數據類型

2023-11-12 21:49:10

Redis數據庫

2021-12-27 11:30:51

數據結構算法動態(tài)規(guī)劃

2020-12-16 07:36:46

Redis字符串數據

2009-08-26 13:24:54

C#字符串

2021-07-16 07:57:34

Python數據結構

2024-04-01 08:41:39

字符串.NET
點贊
收藏

51CTO技術棧公眾號