首页 > 其他分享 >openGauss-智能基数估计

openGauss-智能基数估计

时间:2024-08-29 09:25:20浏览次数:11  
标签:创建 数据库 智能 估计 openGauss 基数

openGauss- 智能基数估计

可获得性

本特性自openGauss 3.1.0版本开始引入。

特性简介

智能基数估计利用库内轻量级算法进行多列数据分布建模,并且提供多列等值基数估计的能力。在数据分布倾斜并且列之间相关性强的数据场景下能够提供更准确的估计结果,从而给优化器提供准确的代价参考,提高计划生成准确率,提高数据库查询执行效率。

客户价值

通过本功能,用户可以通过创建智能统计信息改善多列统计的准确率,从而提升查询优化性能。

特性描述

智能估计基数首先利用数据库内数据样本进行数据分布建模,并且将模型压缩存储在数据库中。优化器在执行计划生成阶段触发智能估计,实现对代价更精确的估计,并且生成更优的计划。

特性增强

特性约束

  • 数据库运行状态良好,无资源紧张状况。
  • 仅支持FLOAT8,Double Precision,FlOAT4,REAL,INT16,BIGINT,INTEGER,VARCHAR,CHARACTER VARYING,CHAR,CHARACTER,NUMERIC数据类型。
  • 仅支持不超过64列的查询基数估计。
  • 为了保证系统性能,模型创建只利用一定量的数据样本(最多200,000),如果数据过于稀疏,估计结果可能不准确。
  • 为了能够充分利用有限的内存进行模型访问加速,建议创建AI统计列数量不超过30个,否则可能会触发内存替换。
  • 如果出现过长的变长字符串类型数据,可能会影响基数估计模型创建和估计的性能。
  • 当前版本同时创建MCV和贝叶斯网络情况下,基数估计性能较低,不建议统计创建。

依赖关系

依赖于数据库内的多列统计信息创建语法和数据采样算法。

详情查看:https://opengauss.org

详情查看:https://docs-opengauss.osinfra.cn

标签:创建,数据库,智能,估计,openGauss,基数
From: https://www.cnblogs.com/xiaoxu0211/p/18385861

相关文章

  • 拥挤聚集智能监测系统 CNN
    拥挤聚集智能监测系统可以通过对人员数量、密度等进行实时监测,拥挤聚集智能监测系统识别出拥挤聚集的情况,并及时发出预警。拥挤聚集智能监测系统可以通过对人员进车间的人数等进行监测,识别出是否存在人员拥堵、挤压等安全隐患,及时发出警报,提醒工作人员采取措施疏散人群。在人员......
  • 【人工智能时代】- 大模型技术的发展与实践
    一、大模型的概念大型语言模型,也称大语言模型、大模型(LargeLanguageModel,LLM;LargeLanguageModels,LLMs)。大语言模型是一种深度学习模型,特别是属于自然语言处理(NLP)的领域,一般是指包含数干亿(或更多)参数的语言模型,这些参数是在大量文本数据上训练的,例如模型GPT-3,PaLM,LLaMA......
  • 聚焦深圳(国际)通用人工智能大会:遨游通讯带来AI“中国风”
    深圳,这座被誉为“中国硅谷”的城市,再次成为全球科技创新的焦点。2024AGIC深圳(国际)通用人工智能大会暨深圳(国际)通用人工智能产业博览会,以“魅力AI·无限未来”为主题,于2024年8月28-30日在深圳国际会展中心举办。展会首日上午,遨游通讯创始人印海林先生荣任全国首批首席人工智能......
  • 【专题】2024年中国AI人工智能基础数据服务研究报告合集PDF分享(附原数据表)
    原文链接:https://tecdat.cn/?p=37516随着人工智能技术的迅猛发展,AI基础数据服务行业迎来了前所未有的发展机遇。报告合集显示,2023年中国AI基础数据服务市场规模达到45亿元,且未来五年复合增长率有望达到30.4%。多模态大模型、长文本处理能力提升以及大模型小型化技术成为A......
  • OpenGauss中循环语句
    在OpenGauss(以及很多其他的SQL数据库系统中),循环语句不是SQL的一部分,因为SQL主要被设计为处理数据的查询、更新、插入和删除等操作,而不包括传统编程语言中的控制流语句(如循环和条件语句)。然而,OpenGauss提供了PL/pgSQL(PostgreSQL的过程语言的一个变种,也被OpenGauss......
  • AI大模型智能体技术在企业商业展示中的应用方案
    企业AI大模型智能体展厅解决方案旨在为企业展厅大屏或在线网站引入AI数字员工,通过全方位、互动性强、深度展示的方式,向来访者展示企业的战略、品牌、产品和服务,并突出展示企业所取得的成就和成果。数字员工可智能化处理不同访客的需求,实现语音交互和个性化介绍,提升企业展厅的互......
  • 用Python爬取地图信息被捕了?Python主要有哪些用途:Web开发、数据科学和人工智能、科学
    近日,一起关于导航电子地图“拥堵延时指数”数据权益的不正当竞争纠纷案在北京市朝阳区人民法院落下帷幕,引发热议。 爬虫确实是学习Python最有意思的一件事情,也是Python很擅长的事情之一。很多铁铁日常使用Python爬天爬地,也还有很多想学爬虫来自动获取数据。如果你正在学习......
  • openGauss-Anomaly_detection_数据库指标采集_预测与异常监控
    Anomaly-detection:数据库指标采集、预测与异常监控可获得性本特性自openGauss1.1.0版本开始引入。特性简介anomaly_detection是openGauss集成的、可以用于数据库指标采集、预测以及异常监控与诊断的AI工具,是dbmind套间中的一个组件。支持采集的信息包括IO_Read、IO_Write、CPU......
  • openGauss-CBO优化器
    openGauss-CBO优化器可获得性本特性自openGauss1.0.0版本开始引入。特性简介openGauss优化器是基于代价的优化(Cost-BasedOptimization,简称CBO)。客户价值openGaussCBO优化器能够在众多计划中依据代价选出最高效的执行计划,最大限度的满足客户业务要求。特性描述在CBO优......
  • openGauss-CM
    openGauss-CM可获得性本特性自openGauss3.0.0版本开始引入。特性简介CM(ClusterManager)是一款数据库管理软件,由cm_server和cm_agent组成。cm_agent是部署在数据库每个主机上,用来启停和监控各个数据库实例进程的数据库管理组件。cm_server是用来进行数据库实例管理和实例......