首页 > 编程语言 >(转)基于.NET Standard的分布式自增ID算法--Snowflake

(转)基于.NET Standard的分布式自增ID算法--Snowflake

时间:2022-09-07 12:13:50浏览次数:97  
标签:自增 Id -- 生成 id ID Standard 主键 分布式

转自:https://www.lmlphp.com/user/1222/article/item/15683/

概述

本篇文章主要讲述分布式ID生成算法中最出名的Snowflake算法。搞.NET开发的,数据库主键最常见的就是int类型的自增主键和GUID类型的uniqueidentifier。
那么为何还要引入snowflake呢?

 

INT自增主键

自增主键是解决主键生成的最简单方案,它有如下优势:

  1. 数据库本身负责主键生成,效率高
  2. 数据库本身保证主键顺序递增,方便存储和检索

相对应的,它也有如下缺点:

  1. 严重依赖数据库服务
  2. 强顺序递增,不易横向扩展
  3. 分库分表很难处理
  4. 不方便导入数据
  5. 上层应用在插入数据时,如果需要获知主键,必须再次查询

总结来说,INT自增主键在单机性能和主键严格递增上由很大的优势,但是在扩展性和分布式数据库上有较大限制

GUID主键

GUID(全局唯一标识符,Globally Unique Identifier)为128位(16字节),它使用太网卡地址、纳秒级时间、芯片ID码和许多可能的数字根据算法动态生成,理论上可以有2^128个结果,
所以产生2个相同的ID的几率非常小。

它的优点如下:

  1. 应用生成,解放服务器压力
  2. 生成的ID可以做到全库唯一,方便数据库分库分表、数据导入

缺点也很明显:

  1. 16字节太长,浪费空间
  2. 非顺序递增,增加数据库存储和检索开销

在做数据库主键选则时,如果系统较小,业务逻辑相对简单,可以考虑使用自增主键;如果业务复杂,涉及到分库分表分布式等,建议考虑GUID。如果认为GUID的缺点太影响使用,
可以考虑马上开始重点介绍的分布式ID生成算法 Snowflake

Snowflake是由Twitter提出并首先使用的分布式ID生成算法,使用它来生成分布式趋势递增的Id。

  1. 分布式
    Id有分布式系统的节点自己生成

  2. 趋势递增
    主键非严格顺序递增的,而是根数时间顺序递增,这在一定程度上保证了数据存储和索引的效率

算法讲解

总长度为64位长整型(8字节)

1位:首字节固定为0,来保证所有生成的数据都是正数

41位:第2到第42位工41字节,用于生成毫秒级时间戳,计算大概(2^41−1)/(1000∗60∗60∗24∗365)=69 年,对于一般系统来说绝对够用。

10位: 第43位到第52位为工作机ID,可表示2^10=1024台设备,一般高5位表示机房Id(datacenterId),低5位表示工作节点ID(workid)

12位:第53位到第64位表示序列号,2^12-1=4095

综上算法,表示单机每毫秒可以提供4095个Id,所有机器每毫秒可生成4095*1024=4194304个Id。

它的优点如下:

  1. 应用生成,解放服务器压力
  2. 生成的ID可以做到全库唯一,方便数据库分库分表、数据导入
  3. 8字节,长整型,节省空间
  4. 趋势递增,方便数据存储和查询

基于.NET Standard的分布式自增ID算法--美团点评LeafSegment

概述

前一篇文章讲述了最流行的分布式ID生成算法snowflake,本篇文章根据美团点评分布式ID生成系统文章,介绍另一种相对更容易理解和编写的分布式ID生成方式。

 

 

实现原理

 

Leaf这个名字是来自德国哲学家、数学家莱布尼茨的一句话:

设置数据表主键自增是最简单的方案,缺点也很明显:

  • 强依赖数据库,无法提供高可用

  • ID生成强依赖单台服务,无法横向扩展

很容易想到,如果我的应用每次申请一批id,插入数据时顺序取一个使用,即将耗尽时再去获取一批新的id,如此即可在一定程度上减弱与数据库的关系,同时将单台扩展延伸为获取id的步长。

负责发放ID的服务既可以使用MySQL服务,也可以使用Redis等服务。

基于.NET Standard的分布式自增ID算法--美团点评LeafSegment-LMLPHP

 

基于MySQL实现

首先我们建立一张数据库表

DROP TABLE IF EXISTS `leafsegment`;
CREATE TABLE `leafsegment`  (
  `biz_tag` varchar(255) NULL DEFAULT NULL,
  `max_id` bigint(20) NULL DEFAULT 0,
  `step` int(11) NULL DEFAULT 5000,
  `desc` varchar(255)  NULL DEFAULT NULL,
  `update_time` datetime(0) NULL DEFAULT now()
);

-- 添加一条初始化数据
INSERT INTO `leafsegment` VALUES ('test', 0, 5000, '测试', '2018-12-06 23:32:11');

数据库表如下图

基于.NET Standard的分布式自增ID算法--美团点评LeafSegment-LMLPHP

biz_tag:业务标记,不同业务使用不同的值,可以最大限度地利用ID

max_id:当前已经被申请走的最大Id

step:每次申请Id的步长

desc:业务内容描述

update_time:最新一次申请时间

 

应用如何获取一批有效ID呢?

Begin
UPDATE leafsegment SET max_id=max_id+step,update_time=now() WHERE biz_tag='test'
SELECT biz_tag, max_id, step FROM leafsegment WHERE biz_tag='test'
Commit

在一个事务周期内完成max_id的更新,和最新数据的获取,天然解决了资源竞争问题。

而后,我们就可以在应用中将[max_id-step+1,max_id]闭区间的所有值作为ID来使用了。

 

基于Redis实现

Redis的实现更为简单,基本原理是利用了Redis的IncrBy命令实现原子加N,具体实现流程无须赘述。

 

代码实现

首先我们定义一个传递Step(步长)和MaxId(最大值)的DTO

    /// <summary>
    /// 数据单元
    /// </summary>
    public class DataVal
    {
        /// <summary>
        /// 当前最大Id
        /// </summary>
        public long MaxId { get; set; } = 1;
        /// <summary>
        /// 当前步长
        /// </summary>
        public int Step { get; set; } = 1000;
    }

这个类仅负责将ID生发器的数据传入核心类LeafSegment中。核心类的具体实现如下代码:

    /// <summary>
    /// 美团的Leaf Segment 方案
    /// </summary>
    public class LeafSegment
    {
        private long _currentStep = long.MaxValue >> 1;
        private readonly Func<DataVal> _idGetAction;
        private readonly ConcurrentQueue<long> _data = new ConcurrentQueue<long>();
        private readonly AutoResetEvent _autoReset = new AutoResetEvent(false);

        /// <summary>
        /// 美团的Leaf Segment 方案
        /// </summary>
        /// <param name="idGetAction">Id生成策略</param>
        /// <param name="prefill">是否立即初始化数据</param>
        public LeafSegment(Func<DataVal> idGetAction,bool prefill=false)
        {
            _idGetAction = idGetAction;
            if (prefill)
            {
                FillData();
            }
            Loop();
        }

        /// <summary>
        /// 获取下一个Id
        /// </summary>
        /// <returns></returns>
        public long NextId()
        {
            _autoReset.Set();
            if (_data.TryDequeue(out var result))
            {
                return result;
            }

            throw new Exception("Resource not enough");
        }

        private void Loop()
        {
            (new Thread(_ =>
            {
                while (true)
                {
                    _autoReset.WaitOne();
                    FillData();
                }
            }) {IsBackground = true}).Start();


        }

        private void FillData()
        {
            //数量小于步长一半时触发拉新
            while (_data.Count < (_currentStep >> 1))
            {
                var tmp = _idGetAction.Invoke();
                _currentStep = tmp.Step;
                for (var i = tmp.MaxId - tmp.Step + 1; i <= tmp.MaxId; i++)
                {
                    _data.Enqueue(i);
                }
            }
        }
    }

此处需要注意的是LeafSegment构造函数的第一个入参IdGetAction是一个返回DataVal的回调函数,因此外部实现中可以在该回调函数中返回所需ID序列;

第二个参数prefill,该参数控制实例化LeafSegment对象时,是否同步调用获取ID区段,如该值为false,将会由启动的线程稍后补充数据。

 

完整实现、使用Demo以及benchmark测试请参见源代码:https://github.com/sampsonye/nice

标签:自增,Id,--,生成,id,ID,Standard,主键,分布式
From: https://www.cnblogs.com/wangdongying/p/16664930.html

相关文章

  • 上传图片
    上传图片的方法在上传文件的时候需要知道其原理,因为我们的数据库是无法存储数据的,所以我们只能使用地址来找,所以数据库中应该村的是文件路径其次上传图片是属于上传文件的......
  • leetcode 1385. 两个数组间的距离值
    给你两个整数数组 arr1 , arr2 和一个整数 d ,请你返回两个数组之间的 距离值 。「距离值」 定义为符合此距离要求的元素数目:对于元素 arr1[i] ,不存在任何元素 ......
  • K3Cloudmanager服务没有了
    "C:\Windows\Microsoft.NET\Framework\v4.0.30319\InstallUtil.exe"/i"C:\ProgramFiles(x86)\Kingdee\K3Cloud\Services\ManagementService\Kingdee.BOS.Management.M......
  • Vben Admin 源码学习:状态管理-角色权限
    前言本文将对Vue-Vben-Admin角色权限的状态管理进行源码解读,耐心读完,相信您一定会有所收获!更多系列文章详见专栏......
  • API 调试工具 All In One
    API调试工具AllInOne接口调试工具ApifoxApifox是API文档、API调试、APIMock、API自动化测试一体化协作平台,定位Postman+Swagger+Mock+JMeter。htt......
  • 模板语法之继承
    什么是模板继承模板继承就是指可以使父模板的内容重用,子模板直接继承父模板的全部内容,并可以覆盖父模板中相应的块继承的语法父模板中:1.用block标签标识中哪些在子模板......
  • "蔚来杯"2022牛客暑期多校训练营7
    A.FloorTilesinaPark给定\(W\timesH\)的矩阵,问将其分为\(k(k\leqslant5)\)个子矩阵的方案数。两个方案不同,当且仅当其切割方式不同手玩,画出所有\(k\leqslant5\)......
  • EFLGE对加减法的影响
    概述:加减法指令:INC和DEC指令:操作数加一或减一ADD指令  格式:ADD目的操作数,源操作数SUB指令 格式:SUB目的操作数,源操作数NEG求补指令: 指令通过将数字转换为对应的......
  • 技术分享 | Jenkins job 机制该如何使用?
    本文节选自霍格沃兹测试开发学社内部教材Jenkins像老板一样管理各种job。job是Jenkins的一个执行计划,是一系列操作的集合,Jenkins里的最常用的功能就是job的构......
  • 10.10 斐波那契数列_本章总结
      #斐波那契数列 计算  1,1,2,3,5,8  后面的数为前面两数相加deffib(n):ifn==1:return1elifn==2:return1else:......