分布式ID生成器

基本要求

  • 全局唯一
  • 趋势递增
  • 效率高(生成、使用、索引)
  • 控制并发

常用策略

Twitter雪花算法SnowFlake

  • 1) 1位,不用。二进制中最高位为1的都是负数,但是我们生成的id一般都使用整数,所以这个最高位固定是0

  • 2) 41位,用来记录时间戳(毫秒)。

  • 3) 41位可以表示2^41−1个数字,如果只用来表示正整数(计算机中正数包含0),可以表示的数值范围是:0 至 2^41−1,减1是因为可表示的数值范围是从0开始算的,而不是1。
    也就是说41位可以表示2^41−1个毫秒的值,转化成单位年则是(2^41−1)/(1000∗60∗60∗24∗365)=69年

  • 4) 10位,用来记录工作机器id。
    可以部署在2^10=1024个节点,包括5位datacenterId和5位workerId

  • 5) 5位(bit)可以表示的最大正整数是2^5−1=31,即可以用0、1、2、3、….31这32个数字,来表示不同的datecenterId或workerId

  • 6) 12位,序列号,用来记录同毫秒内产生的不同id。
    12位(bit)可以表示的最大正整数是2^12−1=4095,即可以用0、1、2、3、….4094这4095个数字,来表示同一机器同一时间截(毫秒)内产生的4095个ID序号
    由于在Java中64bit的整数是long类型,所以在Java中SnowFlake算法生成的id就是long来存储的。