自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

為什么Redis不直接使用C語言的字符串?

開發(fā) 前端
Redis的字符串使用len記錄了字符串的長度,使用alloc記錄整個數(shù)組的長度,(alloc - len)表示未使用的空間長度。

眾所周知Redis有以下幾種常見的數(shù)據(jù)類型 String(字符串)、List(列表)、Set(集合)、Hash(哈希)、Sorted set(有序集合)、Stream(流)、Geo(地理空間索引)、Bitmap(位圖)、HyperLogLog(基數(shù)統(tǒng)計)等。

我們最常用的就是String(字符串)類型,String類型既可以存儲字符串,也可以存儲數(shù)字,甚至可以直接進行數(shù)值運算。

redis> set key1 value1
OK

redis> get key1
"value1"

redis> set key 1
Ok

redis> INCR key
(integer) 2

Redis是使用標準C語言編寫的,而Redis String類型底層使用SDS(Simple Dynamic String 簡單動態(tài)字符串),但是卻沒有使用C語言字符串使用,這到底是為什么呢?

Redis的優(yōu)點是快、安全、節(jié)省內存,在設計Redis String實現(xiàn)的時候,也深刻的體現(xiàn)了Redis的這三個優(yōu)點。

提到Redis字符串的優(yōu)點,需要先看一下C語言字符串的缺點,畢竟沒有對比就沒有傷害。

1. C語言字符串實現(xiàn)原理

C語言字符串是使用char數(shù)組存儲,以'\0'作為字符串結束,比如字符串”Redis“在C語言中存儲結構就是下面這樣:

圖片

那么這種存儲方式有什么缺點呢?

1.1 不安全

C語言字符串這種特殊規(guī)定,就導致無法存儲特殊字符。如果某個字符串中間包含'\0'字符,讀取字符串的時候就無法讀取到完整字符,遇到'\0'就結束了,像下面這樣,只能讀取到前半部分“Red”。

圖片

如果存儲到C語言的字符串,無法完整讀取,肯定是不安全的,所以C語言無法存儲包含特殊字符的字符串(例如二進制數(shù)據(jù))。

1.2 查詢性能較低

如果想要獲取字符串的長度,需要遍歷整個字符串,時間復雜度是O(n),查詢效率較低。

1.3 存在緩存區(qū)溢出風險

開發(fā)中最常用的功能是拼接字符串,每次拼接字符串的時候,都要提前進行擴容。如果忘記擴容了,就會出現(xiàn)緩存區(qū)溢出。

1.4 擴容性能較差

擴容過程是非常耗時的,而且每次拼接字符串的時候都需要提交擴容。想象一下,如果使用HashMap的時候,每次put操作都需要進行擴容,性能將會差到什么程度。

由于C語言字符串有這么多缺點,而Redis又追求極致性能,所以只能自己實現(xiàn)一套,看一下Redis字符串底層是怎么實現(xiàn)的?

2. SDS底層實現(xiàn)原理

Redis3.0版本之前的底層結構是這樣的:

struct sdshdr {
// 記錄buf數(shù)組中已使用字節(jié)的數(shù)量
// 等于SDS所保存字符串的長度
int len;

// 記錄buf數(shù)組中未使用字節(jié)的數(shù)量
int free;

// 字節(jié)數(shù)組,用于保存字符串
char buf[];
};

圖片

而最新Redis7.0版本,sds底層結構是這樣的,分成5個實現(xiàn):

圖片

為什么會有5種實現(xiàn)呢?

看一下每種實現(xiàn)的len和alloc的類型就明白了,sdshdr8里面的類型是uint8_t,sdshdr16里面的類型是uint16_t,sdshdr32里面的類型是uint32_t,sdshdr64里面的類型是uint64_t,用來存儲不同長度的字符串。使用合適的類型,可以節(jié)約大量內存。

Redis自己實現(xiàn)的字符串解決了C語言字符串遇到的問題,并且有以下幾個優(yōu)點:

2.1 存儲安全

sds簡化版的存儲結構是這樣的:

struct sdshdr {
// 已經(jīng)使用的字節(jié)數(shù)量
int len;

// char數(shù)組總字節(jié)數(shù)量
int alloc;

// 字節(jié)數(shù)組,用于保存字符串
char buf[];
};


圖片

可以看出,Redis的字符串并不是用'\0'表示結尾,而是使用len記錄了字符串的長度。想要取出完整的字符串,只需要遍歷len長度即可。

2.2 查詢性能較高

Redis的字符串使用len記錄了字符串的長度,想要獲取整個字符串的長度,無需遍歷字符串,只需要查詢len值即可,時間復雜度是O(1)。

Redis采用空間換時間的做法,增加了存儲空間,加快了查詢性能。

2.3 避免緩存區(qū)溢出

Redis的字符串使用len記錄了字符串的長度,使用alloc記錄整個數(shù)組的長度,(alloc - len)表示未使用的空間長度。

如果新增的拼接字符串長度小于未使用空間,就不用擴容了。

2.4 擴容性能較好

Redis字符串還實現(xiàn)空間預分配和惰性空間釋放的優(yōu)化策略,減少擴容次數(shù)。

簡單理解就是拼接字符串導致擴容的時候會多增加一些空閑空間,縮短字符串的時候并不立即釋放這些空閑空間。

責任編輯:武曉燕 來源: 一燈架構
相關推薦

2020-05-13 12:17:33

RedisC字符C語言

2024-06-04 16:01:39

2024-02-20 20:12:09

C語言字符串Redis

2024-05-30 12:17:25

2023-05-29 08:03:41

代碼Go語言

2021-10-14 15:34:48

C語言字符串函數(shù)

2025-02-27 08:18:40

2011-07-15 11:07:41

C語言字符串函數(shù)

2011-07-15 12:41:53

C語言

2019-01-29 10:30:32

阿里巴巴Java字符串

2019-02-27 09:00:13

阿里巴巴for循環(huán)Java

2009-08-07 15:49:46

使用C#字符串

2023-01-03 08:07:33

Go字符串指針

2021-08-04 17:20:30

阿里巴巴AsyncJava

2015-05-25 15:31:56

C語言學習和使用 C 語言

2015-03-19 15:04:06

2023-12-11 07:33:05

Go語言字符技巧

2023-12-11 15:18:03

C++字符串Unicode

2021-04-27 10:53:58

Redis數(shù)據(jù)庫SDS

2021-02-23 09:35:33

redis字符串數(shù)據(jù)庫
點贊
收藏

51CTO技術棧公眾號