Redis数据结构8：REDIS_HASH

时间：2023-12-16 17:31:54浏览次数：34

标签：rehash HASH 哈希 Redis REDIS key 操作 dictEntry

REDIS_HASH

Hash本质上就是一个保存若干键值对的数据结构，类似于Java中的HashMap。

同样的，hash中只能存在一个独一无二的key，所有的操作都围绕key展开。

hash的最大优点在于其可以提供最佳O(1)的查询时间复杂度。

通过一段原始数据key，通过特定算法将其哈希值转化为数组下标，通过相同的算法处理相同的值可以计算相同的索引，所以只需要O(1)时间复杂度就可以查询到key。

但有一片阴云一直笼罩在哈希表之上：哈希冲突。

哈希冲突

前文提到，哈希表通过算法将key转化为下标，可以做到相同key，一定能有相同的下标值。

但key是无限的，下标值是有限的。无限对有限的映射，则必定有不同的key指向相同的下标，两个key抢占一个下标，就造成了哈希冲突。

哈希冲突一般有多重解决方法，Redis采用链式哈希解决。

简单来说，链式哈希遇到哈希冲突，则将数组元素转化为一个链表，通过链表将冲突的元素连接起来。

在链表中，查询时间复杂度为O(n)，这也是为什么要说hash最佳时间复杂度为O(1)。

结构设计

typedef struct dictht {
    // hash数组
    dictEntry **table;
    // hash大小
    unsigned long size;  
    // 大小掩码，用于计算索引值
    unsigned long sizemask;
    // 已有的节点数量
    unsigned long used;
} dictht;

typedef struct dictEntry {
    // 键值对中的键
    void *key;
  
    // 键值对中的值
    union {
        void *val;
        uint64_t u64;
        int64_t s64;
        double d;
    } v;
    // 指向下一个哈希表节点
    struct dictEntry *next;
} dictEntry;

在dictEntry的v中，是一个联合体union，里面存放一个指针，int和double。

这样的好处是如果值是一个整数或者小数，可以直接嵌入在dictEntry中而不需要指针。

rehash操作

typedef struct dict {
    …
    // 两个Hash表，交替使用，用于rehash操作
    dictht ht[2]; 
    …
} dict;

在正常服务请求阶段，插入的数据，都会写入到哈希表 1，此时的哈希表 2 并没有被分配空间。

随着数据逐步增多，触发了 rehash 操作，这个过程分为三步：

给表 2 分配空间，一般会是表 1 的 2 倍；
将表 1 的数据迁移到表 2 中；
迁移完成后，释放表 1 的空间，并把表 2设置为表 1，然后在表 2 新创建一个空白的表，为下次 rehash 做准备。

但如果表 1 中数据量非常大，那么在迁移操作时会耗费大量计算资源，可能会阻塞Redis正常业务。

为了避免这种情况，Redis提出 渐进式哈希 作为解决方案。

渐进式哈希的核心是将数据迁移操作分步进行，而不是一口气完成。

在给表 2 分配空间后，每次哈希表的元素进行操作(增删改查)时，Redis会将被操作元素索引上的所有元素(因为可能是链表)迁移到表2上。

随着操作越来越多，终有一刻表 1 能把所有数据都迁移到表 2 上，完成渐进式哈希操作。

何时处罚rehash

我们首先要明白一个概念：Load Factor(负载因子)。

负载因子 = 哈希表已存节点数 / 哈希表大小

以下两种条件满足一种，哈希表就会进行rehash操作：

当负载因子大于等于 1 ，并且 Redis 没有执行 RDB 快照或没有进行 AOF 重写的时候，就会进行 rehash 操作。
当负载因子大于等于 5 时，此时说明哈希冲突非常严重了，不管有没有有在执行 RDB 快照或 AOF 重写，都会强制进行 rehash 操作。

标签：rehash,HASH,哈希,Redis,REDIS,key,操作,dictEntry
From： https://blog.51cto.com/ErickRen/8853299

Redis集群
集群由于数据量过大，单个Master复制集难以承担，因此需要对多个复制集进行集群，形成水平扩展每个复制集只负责存储整个数据集的一部分，这就是Redis的集群，其作用是提供在多个Redis节点间共享数据的程序集。Redis集群是一个提供在多个Redis节点间共享数据的数据集Redis集群可以......
Docker部署Redis
1、拉取redis镜像dockerpullredis2、创建redis配置文件mkdir-p/mydata/redis/conftouch/mydata/redis/conf/redis.conf3、启动redis镜像dockerrun-p6379:6379--nameredis\-v/mydata/redis/data:/data\-v/mydata/redis/conf/redis.conf:/etc/redis/redis.......
Redis远程字典服务
1介绍Redis（RemoteDictionaryServer）是一个开源的内存数据存储系统，可以用作数据库、缓存和消息中间件。它支持多种数据结构，包括字符串（strings）、哈希表（hashes）、列表（lists）、集合（sets）、有序集合（sortedsets）等。2使用场景相对于使用数据库，它读取更方便，时间更短相对于存储在硬盘上，它可......
Django-redis 常见错误
Django-redis是一个Django缓存模块，用于连接Redis数据库。在使用Django-redis异步操作时，可能会遇到一些常见的错误。以下是一些可能出现的错误及其解决方法：Redis连接错误：原因：无法连接到Redis数据库。解决方法：检查Redis数据库是否已启动，并确保在Django设置中正确配置了......
Redis集群
1.描述集群，即是RedisCluster。其由多个redis节点组成，redis数据保存在这些节点中。这些节点分为主节点和从节点：只有主节点负责读写请求和集群信息的维护，从节点只负责主节点数据和状态的复制。2.作用数据分区：redis集群是将数据分散存到多个节点中的。具体存到哪个节点是根绝数......
哈希表(HashMap)与字符串哈希
哈希表哈希表是一种通过映射来快速查找的数据结构。其通过键值对(key-value)来存储。一个数据通过哈希函数的运算来生成一个属于他自己的键值，尔后将其与键值绑定。当我们想查找这个数据时，就可以直接通过键来访问对应的值，时间复杂度近似为O(1)。哈希表适用于这样一种场景，当数据......
Redis基础命令操作
一、基础命令1.ping（心跳检查）ping//输入ping命令，看到PONG响应，说明客户端与Redis的连接正常。 2.get/set（读写键值）setnamexiaoHong//setkeyvalue会将指定key-value写入到DB。getname//getkey则会读取指定key的value值。 3.select（切换数据库）sel......
docker部署redis主从集群
1、创建数据目录（logs目录要给权限，要不然会报错）mkdir-pv/data/redis/(data,logs}chmod777/data/redis/logs2、redis.conf配置文件-—-主从配置master节点配置cd/data/redisvimredis.confport6379bind0.0.0.0daemonizenoprotected-modenorequirepass123......
Redis分布式锁的扩展方法
分布式锁代码#region秒杀业务测试privatestaticreadonlystringredisConnectionStr="127.0.0.1:6379,connectTimeout=5000,allowAdmin=false,defaultDatabase=1";///<summary>///秒杀业务///</summary>priv......
redis
开启redis进程 redis-serverredis.windows.confredis对字符串的常用命令set 设置 get 获取 del 删除mset mget设置获取多个key/valincr incrby decr decrby 加/减setnx msetnx 设置新的key/val key必须是原来不存......