首页 > 编程语言 >openGauss 支持HyperLogLog

openGauss 支持HyperLogLog

时间:2024-04-09 09:58:40浏览次数:25  
标签:HyperLogLog 支持 算法 HLL 特性 openGauss 存储空间

支持HyperLogLog

可获得性

本特性自openGauss 1.1.0版本开始引入。

特性简介

通过使用HyperLogLog相关函数,计算唯一值个数Count(Distinct),提升性能。

客户价值

提升AP/TP类查询的性能。

特性描述

HLL(HyperLogLog)是统计数据集中唯一值个数的高效近似算法。它有着计算速度快、节省空间的特点,不需要直接存储集合本身,而是存储一种名为HLL的数据结构。每当有新数据加入进行统计时,只需要把数据经过哈希计算并插入到HLL中,最后根据HLL就可以得到结果。

HLL在计算速度和所占存储空间上都占优势。在时间复杂度上,Sort算法需要排序至少O(nlogn)的时间,虽说Hash算法和HLL一样扫描一次全表O(n)的时间就可以得出结果,但是存储空间上,Sort算法和Hash算法都需要先把原始数据存起来再进行统计,会导致存储空间消耗巨大。而对HLL来说不需要存原始数据,只需要维护HLL数据结构,所以占用空间始终是1280字节常数级别。

特性增强

无。

特性约束

无。

依赖关系

无。

标签:HyperLogLog,支持,算法,HLL,特性,openGauss,存储空间
From: https://www.cnblogs.com/renxyz/p/18123193

相关文章

  • openGauss 支持I层高时延逃生能力
    支持I层高时延逃生能力可获得性本特性自openGauss3.0.0版本开始引入。特性简介I层异常会导致数据库SQL执行时延升高,进而导致内存或者线程池出现过载问题,针对此场景openGauss支持自动逃生能力。客户价值当数据库由于I层异常导致SQL执行时延升高,会话堆积,内存或线程池过载无法......
  • openGauss 支持LLVM
    支持LLVM可获得性本特性自openGauss1.0.0版本开始引入。特性简介openGauss的LLVM(LowLevelVirtualMachine)技术,提供了查询动态编译执行的能力。客户价值通过对查询动态编译执行,大幅提高重查询性能。特性描述openGauss借助LLVM提供的库函数,依据查询执行计划树,将原本在执......
  • openGauss 增量迁移gs_replicate
    增量迁移gs_replicate可获得性本特性自openGauss5.0.0版本开始引入。特性简介增量迁移gs_replicate是指将mysql数据迁移期间(包括全量和增量迁移)产生的增量数据迁移至openGauss端。客户价值通过使用gs_replicate工具,可完成增量数据从MySQL搬迁至openGauss数据库。特性描述......
  • openGauss 账本数据库机制
    账本数据库机制可获得性本特性自openGauss2.1.0版本开始引入。特性简介账本数据库特性,对用户指定的防篡改表增加校验信息,并记录用户对其数据的操作历史,通过数据和操作历史的一致性校验来保证用户数据无法被恶意篡改。在用户对防篡改表执行DML操作时,系统对防篡改表增加少量额......
  • openGauss 支持global-syscache
    支持GlobalSysCache可获得性本特性自openGauss3.0.0版本开始引入。特性简介全局系统缓存(GlobalSysCache)是系统表数据的全局缓存和本地缓存。原理如图1所示。图1GlobalSysCache原理图客户价值全局系统缓存特性可以降低数据库进程的缓存内存占用,提升数据库的并发扩展......
  • openGauss 运行环境
    运行环境支持的硬件平台openGauss支持运行在ARM服务器和通用的x86服务器上:支持ARM服务器和基于x86_64的通用PC服务器。支持本地存储(SATA、SAS、SSD)。支持千兆、万兆Ethernet网络。支持的操作系统ARM:openEuler20.03LTS(推荐采用此操作系统)openEuler22.03LTS统信V......
  • openGauss 在线添加索引
    在线添加索引可获得性本特性自openGauss1.1.0版本开始引入。特性简介通过createindexconcurrently语法,以不阻塞DML的方式在线创建索引。客户价值创建索引时指定concurrently关键字,可以实现创建过程中不阻塞DML,不阻塞用户在线业务。特性描述创建索引时,一般会阻塞其他语......
  • openGauss 用户口令强度校验机制
    用户口令强度校验机制可获得性本特性自openGauss1.1.0版本开始引入。特性简介对用户访问数据库所设置的口令强度进行校验。客户价值用户无法设置过低强度的口令,加固客户数据安全。特性描述初始化数据库、创建用户、修改用户时需要指定密码。密码必须满足强度校验,否则会提......
  • openGauss 智能基数估计
    智能基数估计可获得性本特性自openGauss3.1.0版本开始引入。特性简介智能基数估计利用库内轻量级算法进行多列数据分布建模,并且提供多列等值基数估计的能力。在数据分布倾斜并且列之间相关性强的数据场景下能够提供更准确的估计结果,从而给优化器提供准确的代价参考,提高计划生......
  • 吴恩达机器学习笔记:第 7 周-12支持向量机(Support Vector Machines)12.1-12.3
    目录第7周12、支持向量机(SupportVectorMachines)12.1优化目标第7周12、支持向量机(SupportVectorMachines)12.1优化目标到目前为止,你已经见过一系列不同的学习算法。在监督学习中,许多学习算法的性能都非常类似,因此,重要的不是你该选择使用学习算法......