首页 > 数据库 >Redis从入门到放弃(4):3种新数据类型

Redis从入门到放弃(4):3种新数据类型

时间:2023-07-29 13:56:43浏览次数:68  
标签:HyperLogLog 地理位置 数据类型 Redis 用户 Bitmaps jedis 种新 查询

1、介绍

前面的文章已经介绍了redis的5种基本数据类型,redis6中另外还有3种特殊的数据类型,分别是 Bitmaps (位图)、HyperLogLogs(基数统计)和 geospatial (地理位置)。本文将继续探讨它们的特性、原理以及应用场景。

2、 Bitmaps(位图)

Bitmaps是一种位图数据结构,用于存储位的集合。在Redis中,Bitmaps通常用于表示一系列元素的状态,每个元素用一个位来表示,位的值为0或1。

2.1、特性

  • 空间效率:Bitmaps使用非常少的内存来存储数据,适用于大规模数据的位集合操作。
  • 高效的位运算:Bitmaps支持位运算,如AND、OR、XOR等,可以快速地对位集合进行操作。

2.2、原理

Bitmaps的底层数据结构是一个二进制位数组,其中的每一个位都只能存储0或1。通过对位数组进行操作,可以实现集合成员的添加、删除和查询。

示例:假设我们有一个用户状态的Bitmaps,每个用户用一个位表示,1表示在线,0表示离线。

SETBIT key offset value

#设置offset偏移位的值为value,offset的值是从0开始的,n代表第n+1个bit位置的。
#offset 参数必须大于或等于 0 ,小于 2^32 (bit 映射被限制在 512 MB 之内)。
#value 的值只能为0或1
#返回值:指定偏移量原来储存的位。
# 设置用户1为在线状态
SETBIT online_users 1 1

# 设置用户2为离线状态
SETBIT online_users 2 0

# 查询用户1的状态
GETBIT online_users 1   # 返回 1 (在线)

# 查询用户3的状态
GETBIT online_users 3   # 返回 0 (离线)

# 获取在线用户数量
BITCOUNT online_users    # 返回 2 (有两个用户在线)

2.3、应用场景

  • 用户在线状态:可以用Bitmaps来表示用户是否在线,每个位代表一个用户,1表示在线,0表示离线。
  • 统计功能:通过位运算可以实现多个集合的交集、并集等操作,适用于一些统计功能的实现。

2.4、代码

import redis.clients.jedis.Jedis;

public class RedisBitmapsDemo {

    public static void main(String[] args) {
        // 连接到Redis服务器
        Jedis jedis = new Jedis("localhost");

        // 设置用户1为在线状态
        jedis.setbit("online_users", 1, true);

        // 设置用户2为在线状态
        jedis.setbit("online_users", 2, true);

        // 查询用户1的状态
        boolean isUser1Online = jedis.getbit("online_users", 1);
        System.out.println("用户1是否在线:" + isUser1Online);

        // 查询用户3的状态
        boolean isUser3Online = jedis.getbit("online_users", 3);
        System.out.println("用户3是否在线:" + isUser3Online);

        // 获取在线用户数量
        long onlineUserCount = jedis.bitcount("online_users");
        System.out.println("在线用户数量:" + onlineUserCount);

        // 关闭连接
        jedis.close();
    }
}

3、 HyperLogLog(基数统计)

什么是基数?

举个例子,A = {1, 2, 3, 4, 5}, B = {3, 5, 6, 7, 9};那么基数(不重复的元素)= 1, 2, 4, 6, 7, 9; (允许容错,即可以接受一定误差)

HyperLogLog是一种用于基数统计(即集合中不同元素的数量)的数据结构。它可以用来估计一个集合中不同元素的数量,而不需要存储每个元素的具体值。HyperLogLog的优势在于其内存占用非常小,同时可以提供较高的近似精确度。

3.1、特性

  • 高效的内存利用:HyperLogLog使用固定大小的内存来存储集合的近似基数,无论集合大小如何,内存占用都相对固定。
  • 近似精确度:HyperLogLog虽然是近似计数,但对于大部分数据集合,可以提供较高的准确度。

3.2、原理

HyperLogLog通过使用一组哈希函数来统计集合中不同元素的数量。对于每个元素,首先使用哈希函数对其进行哈希,然后找到哈希值中最高位的1所在的位置。最后根据最高位1的位置来估计集合的基数。

示例:统计一组用户的唯一访问次数。

# 添加用户的访问记录
PFADD user_visits user1
PFADD user_visits user2
PFADD user_visits user1

# 查询唯一访问次数
PFCOUNT user_visits    # 返回 2 (有两个用户的唯一访问记录)

3.3、应用场景

  • 统计UV:在网站统计中,如果需要统计不同用户(UV)的数量,可以使用HyperLogLog来估计UV的数量,从而减少内存占用。
  • 数据流中的去重:在数据流中,如果需要实时去重并统计不同元素的数量,可以使用HyperLogLog来估计去重后的元素数量。

但是,因为 HyperLogLog 只会根据输入元素来计算基数,而不会储存输入元素本身,所以HyperLogLog 不能像集合那样,返回输入的各个元素。

3.4、代码

import redis.clients.jedis.Jedis;

public class RedisHyperLogLogDemo {

    public static void main(String[] args) {
        // 连接到Redis服务器
        Jedis jedis = new Jedis("localhost");

        // 添加用户的访问记录
        jedis.pfadd("user_visits", "user1");
        jedis.pfadd("user_visits", "user2");
        jedis.pfadd("user_visits", "user1");

        // 查询唯一访问次数
        long uniqueVisits = jedis.pfcount("user_visits");
        System.out.println("唯一访问次数:" + uniqueVisits);

        // 关闭连接
        jedis.close();
    }
}

4、Geospatial(地理位置)

Geospatial是一种地理空间数据结构,用于存储地理位置的信息。在Redis中,Geospatial使用了基于Z字形扫描的算法,可以高效地存储和查询地理位置信息。

4.1、特性

  • 高效的地理位置查询:Geospatial支持在给定的地理位置半径范围内查询其他地理位置点,例如查询附近的商店、用户等。
  • 可以存储附加信息:除了地理位置信息,Geospatial还可以存储附加的信息,如商店的名称、用户的ID等。

4.2、原理

Geospatial使用一个二维空间索引来存储地理位置信息,利用Z字形扫描算法可以快速地查询附近的地理位置点。

示例:存储商店的地理位置信息和名称。

# 添加商店的地理位置信息和名称
GEOADD stores 116.4039 39.9149 "Shop A"
GEOADD stores 116.3372 39.9218 "Shop B"
GEOADD stores 116.3525 39.9138 "Shop C"

# 查询附近的商店
GEORADIUS stores 116.4000 39.9100 500 m WITHCOORD COUNT 2

4.3、应用场景

  • 附近的人:在社交应用中,可以使用Geospatial来查找附近的用户,以实现附近的人功能。
  • 地理位置签到:可以使用Geospatial来实现地理位置签到功能,记录用户在特定地点的签到信息。

4.4、代码

import redis.clients.jedis.GeoCoordinate;
import redis.clients.jedis.GeoRadiusResponse;
import redis.clients.jedis.GeoUnit;
import redis.clients.jedis.Jedis;

import java.util.List;

public class RedisGeospatialDemo {

    public static void main(String[] args) {
        // 连接到Redis服务器
        Jedis jedis = new Jedis("localhost");

        // 添加商店的地理位置信息和名称
        jedis.geoadd("stores", 116.4039, 39.9149, "Shop A");
        jedis.geoadd("stores", 116.3372, 39.9218, "Shop B");
        jedis.geoadd("stores", 116.3525, 39.9138, "Shop C");

        // 查询附近的商店
        double longitude = 116.4000;
        double latitude = 39.9100;
        double radius = 500; // 半径500米
        List<GeoRadiusResponse> nearbyStores = jedis.georadius("stores", longitude, latitude, radius, GeoUnit.M);
        for (GeoRadiusResponse store : nearbyStores) {
            String storeName = store.getMemberByString();
            GeoCoordinate coordinates = store.getCoordinate();
            double distance = store.getDistance();
            System.out.println("附近商店:" + storeName + ",经度:" + coordinates.getLongitude() + ",纬度:" + coordinates.getLatitude() + ",距离:" + distance + "米");
        }

        // 关闭连接
        jedis.close();
    }
}

5、总结

Redis6引入了三种新的数据类型:Bitmaps、HyperLogLog和Geospatial,这些新数据类型为Redis提供了更多灵活的功能和应用场景。Bitmaps适用于大规模数据的位集合操作,HyperLogLog用于近似统计集合的基数,而Geospatial则用于高效存储和查询地理位置信息。通过合理的使用这些新数据类型,可以让Redis在更多场景下发挥出强大的性能和功能。

标签:HyperLogLog,地理位置,数据类型,Redis,用户,Bitmaps,jedis,种新,查询
From: https://www.cnblogs.com/myshare/p/17589711.html

相关文章

  • Redis持久化二
    混合持久化因为RDB持久化无法实时保存数据,数据库或者主机down机时,会丢失数据。AOF持久化虽然可以提高数据的安全性,但是在恢复数据时需要大量时间。因此Redis4.0推出RDB-AOF混合持久化。持久化时,可以根据AOF的落盘策略实时刷盘。恢复时先加载AOF文件中的RDB部分,然后再加载AOF......
  • Redis持久化
    大家都知道Redis一个内存数据库,它支持2种持久化方式:RDB(Snapshot内存快照),AOF(appendonlyfile)。持久化功能将内存中的数据同步到磁盘来避免Redis发生异常导致数据丢失的情况。当Redis实例重启时,即可利用之前持久化的文件实现数据恢复。接下来,本文介绍两种持久化的运行机制......
  • 使用prometheus监控redis
    下载redis_exporter插件官方没提供专门的redis_exporter,github上有人开发了https://github.com/oliver006/redis_exporter安装步骤:gitclonehttps://github.com/oliver006/redis_exporter.gitcdredis_exportergobuild../redis_exporter--version编译时遇到报错......
  • redis sentinel 工作原理
    二工作原理2.1Sentinel构成一个完整的sentinel集群包括两个部分:哨兵节点(sentinel):负责监控redis和sentinel节点的运行情况。数据节点:即redis节点,包含主从节点。2.2Sentinel机制redis使用(sentinel)的工作原理是:redis使用一组sentinel节点来监控主从redis服务......
  • javascript数据类型详解
    文章和代码已经归档至【Github仓库:https://github.com/timerring/front-end-tutorial】或者公众号【AIShareLab】回复javascript也可获取。数据类型JavaScript是一种弱类型或者说动态语言。不用提前声明变量的类型,在程序运行过程中,类型会被自动确定。varage=10;//数字型v......
  • 配置Redis远程和密码
    配置Redis远程和密码Redis配置文件所在位置关闭防火墙Windows系统Redis配置文件位于Redis安装目录下文件名为redis.conf注意:Windows系统下名为redis.windows.conf修改文件配置windows是redis.windows.conf查看本地ipwin+r输入cmdipconfig查看IPredis.windows.co......
  • Redis了解一下
    redis的数据类型包含:String、List、hash、set、zset.缓存雪崩产生原因:缓存大面积失效,导致所有的查询都落到数据库上。解决方式:均匀的设置失效时间,防止大面积数据同一时间失效。缓存击穿产生原因:热点数据失效,大量数据查询落到数据库上。解决方式:不给热点数据设置失效时间。缓存穿透......
  • Python-2-Python数据类型
    第二章:Python数据类型2-1字符串简单介绍'A'+'B'字符串连接输出'AB';'Hello'*3多次连接3次。'Hello'[0]取第一个字符;'Hello'[1]取第二个字符;'Hello'[-1]取最后一个字符;'Hello'[1:3]从e开始取取2个字符el,1+2=3所以是[1:3];'H......
  • 利用Redis实现向量相似度搜索:解决文本、图像和音频之间的相似度匹配问题
    在自然语言处理领域,有一个常见且重要的任务就是文本相似度搜索。文本相似度搜索是指根据用户输入的一段文本,从数据库中找出与之最相似或最相关的一段或多段文本。它可以应用在很多场景中,例如问答系统、推荐系统、搜索引擎等。比如,当用户在知乎上提出一个问题时,系统就可以从知乎上......
  • javaScript判断数据类型的几种方法
    1:typeof返回数据类型,包含这7种:number、boolean、symbol、string、object、undefined、function。typeofnull返回类型错误,返回object。引用类型,除了function返回function类型外,其他均返回object。其中,null有属于自己的数据类型Null,引用类型中的数组、日期、正则也都有......