你可能聽(tīng)說(shuō)過(guò)雪花算法
雪花算法介紹
雪花算法(Snowflake)是一種分布式唯一ID生成算法,用于生成全局唯一的ID。它的設(shè)計(jì)目標(biāo)是在分布式系統(tǒng)中生成ID,保證ID的唯一性、有序性和趨勢(shì)遞增。雪花算法的核心思想是將一個(gè)64位的ID分成多個(gè)部分,分別表示不同的信息。
雪花算法的優(yōu)點(diǎn)是生成的ID具有趨勢(shì)遞增的特性,可以保證在分布式系統(tǒng)中生成的ID的有序性。同時(shí),由于使用了時(shí)間戳,可以根據(jù)ID的時(shí)間戳信息進(jìn)行排序和查詢(xún)。
使用雪花算法生成的ID通常是一個(gè)64位的整數(shù),可以根據(jù)需要進(jìn)行轉(zhuǎn)換和展示。在Java等編程語(yǔ)言中,可以使用相應(yīng)的庫(kù)或工具來(lái)生成雪花算法的ID。
雪花算法組成
- 時(shí)間戳(Timestamp):使用41位來(lái)表示,精確到毫秒級(jí)別。可以使用一個(gè)起始時(shí)間,然后每個(gè)毫秒自增生成唯一的時(shí)間戳。
- 機(jī)器ID(Machine ID):使用10位來(lái)表示,可以根據(jù)需要分配給不同的機(jī)器或節(jié)點(diǎn)。這樣可以保證每個(gè)節(jié)點(diǎn)生成的ID都是唯一的。
- 序列號(hào)(Sequence Number):使用12位來(lái)表示,每個(gè)節(jié)點(diǎn)每毫秒可以生成4096個(gè)不同的序列號(hào)。當(dāng)同一毫秒內(nèi)生成的序列號(hào)超過(guò)4096時(shí),會(huì)等待下一毫秒再繼續(xù)生成。
通過(guò)將時(shí)間戳、機(jī)器ID和序列號(hào)組合在一起,就可以生成一個(gè)全局唯一的ID。這種算法可以在分布式系統(tǒng)中生成唯一的ID,保證了高并發(fā)環(huán)境下的唯一性和有序性。
雪花算法實(shí)現(xiàn)
雪花算法(Snowflake)是一種分布式唯一ID生成算法,它可以在分布式系統(tǒng)中生成全局唯一的ID。Snowflake算法的核心思想是將一個(gè)64位的ID分成多個(gè)部分,每個(gè)部分表示不同的信息。
Snowflake算法的ID結(jié)構(gòu)如下:
0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000
其中,第一部分是1位的標(biāo)識(shí)位,表示正負(fù)數(shù),一般為0。接下來(lái)的41位是時(shí)間戳,表示生成ID的時(shí)間戳(毫秒級(jí)),可以使用當(dāng)前時(shí)間減去一個(gè)固定的起始時(shí)間戳。然后是10位的工作機(jī)器ID,表示機(jī)器的唯一標(biāo)識(shí),可以根據(jù)機(jī)器的IP地址或其他方式生成。最后是12位的序列號(hào),表示同一毫秒內(nèi)生成的多個(gè)ID的序號(hào)。
Snowflake算法Java實(shí)現(xiàn):
public class SnowflakeIdGenerator {
// 起始的時(shí)間戳
private final static long START_TIMESTAMP = 1609459200000L; // 2021-01-01 00:00:00
// 每部分占用的位數(shù)
private final static long SEQUENCE_BIT = 12; // 序列號(hào)占用的位數(shù)
private final static long WORKER_BIT = 10; // 工作機(jī)器ID占用的位數(shù)
private final static long TIMESTAMP_BIT = 41; // 時(shí)間戳占用的位數(shù)
// 每部分的最大值
private final static long MAX_SEQUENCE = ~(-1L << SEQUENCE_BIT);
private final static long MAX_WORKER_ID = ~(-1L << WORKER_BIT);
// 每部分向左的位移
private final static long WORKER_LEFT = SEQUENCE_BIT;
private final static long TIMESTAMP_LEFT = SEQUENCE_BIT + WORKER_BIT;
private long workerId; // 工作機(jī)器ID
private long sequence = 0L; // 序列號(hào)
private long lastTimestamp = -1L; // 上次生成ID的時(shí)間戳
public SnowflakeIdGenerator(long workerId) {
if (workerId > MAX_WORKER_ID || workerId < 0) {
throw new IllegalArgumentException("Worker ID can't be greater than " + MAX_WORKER_ID + " or less than 0");
}
this.workerId = workerId;
}
public synchronized long nextId() {
long timestamp = System.currentTimeMillis();
if (timestamp < lastTimestamp) {
throw new RuntimeException("Clock moved backwards. Refusing to generate ID");
}
if (timestamp == lastTimestamp) {
sequence = (sequence + 1) & MAX_SEQUENCE;
if (sequence == 0) {
timestamp = tilNextMillis(lastTimestamp);
}
} else {
sequence = 0L;
}
lastTimestamp = timestamp;
return ((timestamp - START_TIMESTAMP) << TIMESTAMP_LEFT)
| (workerId << WORKER_LEFT)
| sequence;
}
private long tilNextMillis(long lastTimestamp) {
long timestamp = System.currentTimeMillis();
while (timestamp <= lastTimestamp) {
timestamp = System.currentTimeMillis();
}
return timestamp;
}
}
使用SnowflakeIdGenerator類(lèi)生成唯一的ID,示例代碼如下:
public class Main {
public static void main(String[] args) {
SnowflakeIdGenerator idGenerator = new SnowflakeIdGenerator(1);
long id = idGenerator.nextId();
System.out.println("Generated ID: " + id);
}
}
雪花算法優(yōu)缺點(diǎn)
「優(yōu)點(diǎn)」
- 唯一性:雪花算法可以生成全局唯一的ID,每個(gè)ID都是獨(dú)一無(wú)二的,不會(huì)重復(fù)。
- 高性能:雪花算法生成ID的速度非??欤梢栽诙虝r(shí)間內(nèi)生成大量的ID。
- 可排序:雪花算法生成的ID是按照時(shí)間順序遞增的,可以根據(jù)ID的大小來(lái)判斷生成的時(shí)間先后順序。
- 分布式:雪花算法可以在分布式系統(tǒng)中使用,不同的節(jié)點(diǎn)可以獨(dú)立生成ID,不會(huì)產(chǎn)生沖突。
「缺點(diǎn)」
- 依賴(lài)系統(tǒng)時(shí)鐘:雪花算法的唯一性依賴(lài)于系統(tǒng)時(shí)鐘的準(zhǔn)確性,如果系統(tǒng)時(shí)鐘發(fā)生回?fù)芑蛘卟煌?,可能?huì)導(dǎo)致生成的ID重復(fù)。
- 時(shí)鐘回?fù)軉?wèn)題:如果系統(tǒng)時(shí)鐘發(fā)生回?fù)?,可能?huì)導(dǎo)致生成的ID比之前生成的ID小,這會(huì)破壞ID的遞增順序。
- 時(shí)鐘同步問(wèn)題:在分布式系統(tǒng)中,不同節(jié)點(diǎn)的系統(tǒng)時(shí)鐘可能存在不同步的情況,這可能會(huì)導(dǎo)致生成的ID不是全局唯一的。
- 有限的并發(fā)性:雪花算法中的每個(gè)部分(時(shí)間戳、機(jī)器ID、序列號(hào))都有一定的位數(shù)限制,這限制了并發(fā)生成ID的數(shù)量。
雪花算法是一種簡(jiǎn)單高效的分布式唯一ID生成算法,但在特定情況下可能會(huì)存在一些問(wèn)題,需要根據(jù)具體的應(yīng)用場(chǎng)景來(lái)選擇合適的ID生成算法。