分布式自增ID算法Snowflake简介

时间：2022-09-28 16:00:24浏览次数：62

标签：datacenter 自增 max Snowflake 算法 ID id

背景

过去的项目开发中，我们常常选用的数据库是mysql，mysql以其体积小、速度快等优势，备受中小型项目的青睐。随着项目数据量的迅速增长，mysql已无法满足我们的项目需求，数据迁移迫在眉睫。经多方对比综合考虑，我们选择了tidb分布式数据库。但是数据迁移后我们遇到一个问题，之前mysql数据库中，我们采用的是自增id主键，可选用的tidb又对自增主键不是很友好，所以我们选用了另一种主键生成方式：Snowflake算法。

算法原理

SnowFlake算法是Twitter设计的一个可以在分布式系统中生成唯一的ID的算法，它可以满足每秒上万条消息ID分配的请求，这些消息ID是唯一的且有大致的递增顺序。

SnowFlake算法产生的ID是一个64位的整型，结构如下：

分布式自增ID算法Snowflake简介_主键

第一位是标识位，一般不使用，接下来的41位为毫秒级时间差（以1970年为起始时间，41位的长度可以使用69年，从1970-01-01 08:00:00，年 = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69），然后是5位datacenterId（最大支持2^5＝32个，二进制表示从00000-11111，也即是十进制0-31），和5位workerId（最大支持2^5＝32个，原理同datacenterId），所以datacenterId*workerId最多支持部署1024个节点，最后12位是毫秒内的计数（12位的计数顺序号支持每个节点每毫秒产生2^12＝4096个ID序号）。

所有位数加起来共64位，恰好是一个Long型。

当然，实际使用过程中，时间戳、工作机id、序列号的位数是可以根据需要调整的。

优缺点

优点：

趋势递增：毫秒数在高位，序列号在低位

性能高无单点：本地计算不依赖数据库等第三方

使用灵活：三个组成部分的位数可按需求调整

缺点：

序列不连续

无法控制生成规则（比如序列起始等）

强依赖机器时钟，如果时钟回拨，会导致序列重复或者系统不可用

实现代码

#coding: utf-8
import datetime
# 起始时间, 不能改变, 2020-04-10
twepoch = 1586448000000
datacenter_id_bits = 5
worker_id_bits = 15
sequence_id_bits = 2
max_datacenter_id = 1 << datacenter_id_bits
max_worker_id = 1 << worker_id_bits
max_sequence_id = 1 << sequence_id_bits
max_timestamp = 1 << (64 - datacenter_id_bits - worker_id_bits - sequence_id_bits)

def make_snowflake(timestamp_ms, datacenter_id, worker_id, sequence_id, twepoch=twepoch):
    """generate a twitter-snowflake id, based on
    :param timestamp_ms: time since UNIX epoch in milliseconds
    :param datacenter_id: exec ip
    :param worker_id: process id,max is 32767, min is 0
    :param sequence_id: thread id, max is 3, min is 0
    :param twepoch: start time stamp
    :return:
    """
    sid = ((int(timestamp_ms) - twepoch) % max_timestamp) << datacenter_id_bits << worker_id_bits << sequence_id_bits
    sid += (datacenter_id % max_datacenter_id) << worker_id_bits << sequence_id_bits
    sid += (worker_id % max_worker_id) << sequence_id_bits

效果

采用Snowflake算法后，数据id可以保持时间递增并且全局唯一。

分布式自增ID算法Snowflake简介_测试_02

总结

Snowflake是分布式系统中，用来生成全局唯一ID的一种常用算法。和UUID相比，Snowflake具有简单、占用空间小、有序等优点。但Snowflake算法也有它的弊端，时钟回拨、时钟错乱问题，将是我们程序中需要考虑的问题。

标签：datacenter,自增,max,Snowflake,算法,ID,id
From： https://blog.51cto.com/u_15649298/5719667

vue3中inject无法获取provide传递的最新的值
//爷组件 import{defineComponent,reactive,toRefs,onMounted,provide,computed}from'vue'; conststate=reactive({ tableData:[], });......
idea 从数据库快速生成Spring Data JPA实体类
idea从数据库快速生成SpringDataJPA实体类第一步,调出Persistence窗口.File—>ProjectStructure—>model—>+—>JPA第二步:打开Persistence窗口配置生成实体类的......
SOLIDWORKS 2023新功能亮点揭秘：欠约束几何体
今天和大家分享另一个亮点新功能：欠约束几何体。欠约束几何体SOLIDWORKS Simulation初学者最常见的问题之一是软件提示模型不稳定或约束不恰当，导致分析失败。此时如果有工具......
postgresql uuid模糊搜索 uuid string 类型转换 SQL Error [42883] explicit type cas
问题描述在postgresql的使用过程中，你可能有以下几种需求：要对uuid类型的列进行过滤，但是需要手动输入整个uuid太麻烦容易出错，如果uuid列也能像字符串一样模糊匹配就......
11、Android Studio的ARM Neon学习笔记
基本思想：先深入的学习一下ARMNeon的基本原理，在开始测试NCNN大佬&ZZ大佬贡献的源码~学习大佬博客：https://www.yuque.com/docs/share/3eff70c4-c70f-40df-b0af-df9fa7365......
AndroidStudio新版本Logcat
我一直使用的是预览版的AndroidStudio，今天更新到2021.3.1Canary6,发现logcat变样子了。你瞧，现在是这个鸟样子了。嗯，就是这样子，外观到是好看多了，不过对于使用习惯的我......
关于UE4 C++项目编译rapidxml库并运行时报错问题
新建了一个UE4的C++项目，想使用第三方的rapidxml库对我以前作cocos2d-x的游戏配置数据进行解析，因为以前就用的是这个库。发现在UEEditer里编译C++的时候不会出错，但在xc......
7、在Android Studio中调用腾讯开源框架NCNN去实现Yolo-fastest（CPU+GPU）
基本思想：想测试一下yolo-fast在Android的运行时间，因为不太喜欢（https://github.com/dog-qiuqiu/Yolo-Fastest)的源码移植，使用腾讯企鹅的第三方包https://gith......
17、嵌入式中将（Android）手机转作为嵌入式的摄像头和终端使用（Opencv和C++Python支持）
因为囊中羞涩，所以想把手机转换成摄像头和屏幕作为嵌入式的数据采集模块和终端显示界面；首先PC端需要安装opencv，自行百度～～～Android手机需要安装APP链接：https://pan.baidu.com/s......
1、Android 移植C++ 开发的第三方.so包和.a包
基本思想：因为本人不会写android，所以android主要以JNI学习为主方案一：首先搭建一个Android的最基本工程，完成Android调用c++的代码；方案二：然后本地写一个c++的子模块，使用......

分布式自增ID算法Snowflake简介

相关文章

赞助商

阅读排行