首页 > 其他分享 >Amazon Science 团队计划于VLDB 2024 (August 26-30 2024) 发布 redset 数据集

Amazon Science 团队计划于VLDB 2024 (August 26-30 2024) 发布 redset 数据集

时间:2024-07-18 13:58:30浏览次数:20  
标签:tables 26 August was 2024 table query 数据 Schema

数据集介绍

        Redset是一个数据集,包含了三个月的AWS Redshift fleet 中选定实例样本上运行的用户查询元数据。

数据集用途

        Amazon Science 团队打算在VLDB2024 期间开放该部分数据, 虽然目前数据集还没有开放,但是从数据集的Schema 来看,和在VLDB 2024 会议期间公开该数据集。 可以大胆猜测Redshift 开发团队会在VLDB 上有重要论文发布,同时公布其真实用户的提升数据。 

        研究数据集的Schema ,从另外一方面看,顶级数据库大厂,对数据库的核心指标的描述,或者监控维度在这个Schema 里面已经得到应有的表达。该数据集未来一段时间应该会成为数据库领域优化的benchmark 数据集,值得大家关注 。  数据集链接请看https://www.selectdataset.com/dataset/1dfe70fc50251057041a91e5a882eb57。 

        后续数据集公开后,数据库领域感兴趣的小伙伴,可以第一时间去看看。

数据集 Schema

ColumnName Description
instance_idUniquely identifies a redshift cluster
cluster_sizeSize of the cluster (only available for provisioned)
user_idIdentifies the user that issued the query
database_idIdentifies the database that was queried
query_idUnique per instance
arrival_timeTimestamp when the query arrived on the system
compile_duration_msTime the query spent compiling in milliseconds
queue_duration_msTime the query spent queueing in milliseconds
execution_duration_msTime the query spent executing in milliseconds
feature_fingerprintHash value of the query fingerprint. A proxy for query-likeness, though not based on text. Will overestimate repetition.
was_abortedWhether the query was aborted during its lifetime
was_cachedWhether the query was answered from result cache
cache_source_query_idIf query was answered from result cache, this is the query id for the query which populated the cache
query_typeType of query, e.g.., selectcopy, ...
num_permanent_tables_accessedNumber of permanent table accesses by the query (regular database table)
num_external_tables_accessedNumber of external tables accessed by the query
num_system_tables_accessedNumber of system tables accessed by the query
read_table_idsComma separated list of unique permanent table ids read by the query
write_table_idsComma separated list of unique table ids written to by the query
mbytes_scannedTotal number of megabytes scanned by the query
mbytes_spilledTotal number of megabytes spilled by the query
num_joinsNumber of joins in the query plan
num_scansNumber of scans in the query plan
num_aggregationsNumber of aggregations in the query plan

标签:tables,26,August,was,2024,table,query,数据,Schema
From: https://blog.csdn.net/hellolifei1985/article/details/140520594

相关文章

  • |行业洞察·汽车|《2024智能不是中国购车用户的主要关注点-购车关注度洞察报告》
    主要内容包括以下几个方面:价格战影响:2023年,中国车市价格战激烈,整体优惠幅度上升,价格成为购车用户最关注的因素。购车用户关注度TOP10:价格、品牌、品质、安全、口碑、能耗、空间、服务、配置、舒适是购车用户关注度前十的因素,智能化不在其中。|趋势洞察库|关注我......
  • Origin2024如何绘制误差棒图?直观看出每个数据点的误差
    误差棒图,是一种体现实验数据误差以及不确定性的统计图,在视觉上辅助读者直观地看到每个数据点的误差范围。下面通过均值和标准差两个指标绘制误差棒图,它由折线和误差棒组成,均值决定了折线趋势,标准差的大小决定了误差棒的长短(高低)。操作步骤:1、先打开Origin2024软件,然后在Book1......
  • 2024年7月中国数据库排行榜:PolarDB独领云风骚,达梦跨越新巅峰
    在7月发布的中国数据库流行度排行榜中,各大国产数据库厂商在不同领域表现势如破竹,PolarDB以800分刷新记录,并在SIGMOD2024上获得“最佳论文奖”;OceanBase通过商业模式调整,展现了更加独立的市场竞争力;openGauss在开发者大会上推出“结队计划”,加强社区合作,推动技术进步…但最引人瞩......
  • 2024 最新域名价格查询 All In One
    2024最新域名价格查询AllInOne域名注册价格/域名续费价格产品名称注册1年\3年\5年\10年续费1年\3年\5年\10年转入赎回.xyz域名14元172元330元725元79元237元395元790元79元500元demoshttps://xgqfrms.xyz/https://cdn.xgq......
  • 【2024最新】4000字搞懂sora!一张脑图贯穿!
    话不多说,上图!下面就是对sora的具体阐释:Sora是OpenAI推出的一款革命性的视频生成模型,能够根据文本指令、静态图像或视频生成长达60秒的完整视频。这一模型基于扩散式模型和自注意力深度学习机制,通过将视频片段转换为静态图像并去除噪音以达到清晰效果。核心技术与功能技术架构......
  • 2024年还能入局网络安全吗?
    2024年:网络安全的黄金时代随着数字时代的迅猛发展,网络安全已经成为全球关注的焦点。2024年,我们站在了一个全新的起点,网络安全不再是一个可有可无的选项,而是企业和个人都必须严肃对待的课题。1.网络安全的现状网络安全是一个持续变化的领域。随着物联网(IoT)、云计算、大......
  • NOI2024游记
    DAY-1昨天晚上熬夜有点晚了,今天上午睡了俩小时。下午午觉又睡了一个小时。啥?笔试和试机?太平凡了不想去考。笔试前几天考了一下,考了640.5分,比全场任何人笔试成绩都高。试机不想试,因为电脑上没有冰与火之舞。晚上又熬夜到十二点才睡觉,舒服。DAY1早上七点起的床,然后回笼觉......
  • 2024-07-18 给vue项目添加自定义路由守卫
    要配置路由守卫要使用到vue-router,它是Vue.js官方的路由管理器,主要用于帮助开发者构建单页面应用(SinglePageApplication,简称SPA)。步骤一:新建路由文件,文件名随意,建议叫router.ts,规范一点//router.tsimport{createRouter,createWebHashHistory}from"vue-router";i......
  • [会议投稿|SPIE 出版|EI检索]第六届无线通信与智能电网国际会议(ICWCSG 2024)
    一、会议信息:1、会议名称:第六届无线通信与智能电网国际会议(ICWCSG2024)20246th InternationalConferenceonWirelessCommunicationsandSmartGrid2、会议官网:www.icwcsg.net3、会议时间:2024年7月26日-28日4、三轮截稿日期:2024年7月22日23:595、会议地点:中国·大理......
  • 【漏洞复现】SuiteCRM SQL注入漏洞(CVE-2024-36412)
    0x01产品简介SuiteCRM是一款屡获殊荣的企业级开源客户关系管理系统,它具有强大的功能和高度的可定制性,且完全免费。0x02漏洞概述SuiteCRM存在SQL注入漏洞,未经身份验证的远程攻击者可以通过该漏洞拼接执行SQL注入语句,从而获取数据库敏感信息。0x03搜索引擎title="Suit......