首页 > 其他分享 >QUERY EXECUTION

QUERY EXECUTION

时间:2022-12-01 23:22:36浏览次数:31  
标签:std const tuple 一个 table QUERY EXECUTION schema

QUERY EXECUTION

再开始这个实验之前首先要搞懂几个类的定义和方法

Catalog.h

Catalog用来维护一个数据库的元信息,包括表的信息,列的信息,索引的信息,用户和许可权等。在catalog.h文件中主要包含一下几点信息:

std::unordered_map<table_oid_t, std::unique_ptr<TableInfo>> tables_;	//用来维持一个table_id 到 TableInfo 之间的映射
/** 用来表示table的名字到table_id的映射 */
std::unordered_map<std::string, table_oid_t> table_names_;
/** 创建一个table_id */
std::atomic<table_oid_t> next_table_oid_{0};
/** 用来维持一个index_id 到 indexinfo的映射**/
std::unordered_map<index_oid_t, std::unique_ptr<IndexInfo>> indexes_;
/** Map table name -> index names -> index identifiers. */
std::unordered_map<std::string, std::unordered_map<std::string, index_oid_t>> index_names_;
std::atomic<index_oid_t> next_index_oid_{0};

其中TableInfo类用来维持一个表的基本信息:

Schema schema_;	//一个表的schema
const std::string name_;	//一个表的名字
std::unique_ptr<TableHeap> table_;	//一个表的迭代器
const table_oid_t oid_;		//一个表的id

IndexInfo类用来维持一个索引的基本信息:

Schema key_schema_;	//一个key对应的schema
std::string name_;	//一个索引的名字
std::unique_ptr<Index> index_;	// 一个指向索引的指针
index_oid_t index_oid_;			//索引的id
std::string table_name_;		//拥有这个索引的表名
const size_t key_size_;			//索引的大小

Catalog类中我们通过:

TableInfo *CreateTable();	//创建一个表
TableInfo *GetTable();	//获取一个表
IndexInfo *CreateIndex();	//创建一个索引
IndexInfo *GetIndex();		//获取索引

Column.h

用来表示一个表格的一个列的信息。

std::string column_name_;	//列的名字
TypeId column_type_;	//该列所存储的值的类型
uint32_t fixed_length_;
uint32_t variable_length_{0};
uint32_t column_offset_{0};	//column在一个tuple中的偏移量
const AbstractExpression *expr_;	//用来创建这个列的表达式

Schema.h

schema.h类用来存储一个表格中所有的列。

/** All the columns in the schema, inlined and uninlined. */
std::vector<Column> columns_;	// 一个shcema对应的全部列
/** @return all the columns in the schema */
const std::vector<Column> &GetColumns() const { return columns_; }
const Column &GetColumn(const uint32_t col_idx) const { return columns_[col_idx]; }

AbstractExpression.h

AbstractExpression.h类表达式类是一个虚基类,用来提供各个类的接口。

  • Value Evaluate 用来返回一个tuple对应schemavalue
  • Value EvaluateJoin 返回一个join过后的value
  • Value EvaluateAggregate(const std::vector<Value> &group_bys, const std::vector<Value> &aggregates) 返回一个按照group_bys分组聚合之后的value

表达式类,用来存储一个表达式树中的节点。这个类派生出了一下几个子类:

  • ComparisonExpression : 用于比较,实例化用作一个predicate_谓词或者是一个having
  • ColumnValueExpression : 列元素的的表达值,Evalute函数用来返回当前tuple的哪一个value用来对应要求的coloumn.
  • AggregateValueExpression : EvaluateAggregate函数根据是操作时group_by操作还是aggrate操作,返回对应操作的value

AbstractExecutor

当SQL语句拆分成一个执行数,每个节点的功能承担者。是所有执行算子的虚基类,主要包含一下两个方法:

  • void Init()用来初始化一个算子
  • bool Next(Tuple *tuple, RID *rid) 因为我们采用的是火山模型一次只能返回一个tuple
  • Schema *GetOutputSchema() 用来表明该节点执行需要输出哪些列

ExecutorContext

用来维护一个ExecutorJ节点执行所需要的上下文信息。主要包含一下信息:

/** 当前执行当前executor的事务 */
Transaction *transaction_;
/** 当前executor执行的database的catalog */
Catalog *catalog_;
/** 相关的bufferpoolmanager */
BufferPoolManager *bpm_;
/** 和当前事务有关的事务管理器 */
TransactionManager *txn_mgr_;
/** 执行executor所需要的锁管理器 */
LockManager *lock_mgr_;

AbstractPlanNode

所有执行的PlanNode的虚基类,用来维护每一个存储节点有关的信息。主要包含一下信息:

const Schema *output_schema_;	//当前节点输出的schema
/** 当前节点的子节点 */
std::vector<const AbstractPlanNode *> children_;

比如一个seq_plan包含:

  • const AbstractExpression *predicate_ : 扫描满足条件的谓词
  • table_oid_t table_oid_, 用来扫描的表格的table_id

Value

最小的存储单位,用来表示每一个tuple对应的列的存储数据。

Tuple

元组,代表一个表里面的一行,存储了一行的value, 每一个tuple的长度由表格对应的schema决定,也就是有多少个列tuple就有多长。每个tuple根据其所在的page和对应的slot都有一个rid用来标识每一个tuple

// 就是将数据二进制化或者反过来,用于存储
void SerializeTo(char *storage) const;
void DeserializeFrom(const char *storage);
inline RID GetRid();	//获取一个tuple的rid
// 返回数据指针
inline char *GetData();//获取一个tuple的全部数据
// 返回tuple的长度(bits)
inline uint32_t GetLength();
// 返回指定colum_idx位置的值
Value GetValue(const Schema *schema, uint32_t column_idx)
// 根据schema , key_schema,构建当前tuple的一个Key主要用来插入到hash table中
Tuple KeyFromTuple(const Schema &schema, const Schema &key_schema, const std::vector<uint32_t> &key_attrs);

TableHeap

代表一个磁盘中存储的一张表的本身

page_id_t first_page_id_{};	//用来存储当前表的第一个page的pageid
/*一个事务,用来插入一个tuple*/
bool InsertTuple(const Tuple &tuple, RID *rid, Transaction *txn);
bool MarkDelete(const RID &rid, Transaction *txn);  // 根据rid删除一个tuple
bool UpdateTuple(const Tuple &tuple, const RID &rid, Transaction *txn);	//更新对应的tuple
void ApplyDelete(const RID &rid, Transaction *txn);	// 执行删除操作
void RollbackDelete(const RID &rid, Transaction *txn);	//txn回滚,回滚删除操作
TableIterator Begin(Transaction *txn);	//当前table第一个tuple的位置,通过Page_id迭代查找第一个tuple的位置
TableIterator End();	//最后一个位置的下一个位置

Table_page

在底层的tuple存储到page里面的存储方式采用sloted_page的存储方式,分为一个slot_array里面存储每一个tuple的指针用来指向tuple的位置,slot_array按照从前往后的次序依次递增,tuple从后往前依次存储,当两者相遇的时候说明一个page存满了。

/**

** Slotted page format:*

** ---------------------------------------------------------*

** | HEADER | ... FREE SPACE ... | ... INSERTED TUPLES ... |*

** ---------------------------------------------------------*

** ^*

** free space pointer*


** Header format (size in bytes)

标签:std,const,tuple,一个,table,QUERY,EXECUTION,schema
From: https://www.cnblogs.com/gxsoar/p/16943108.html

相关文章

  • day28-jQuery01
    jQuery01参考文档1:jQueryAPI中文文档|jQueryAPI中文在线手册|jqueryapi下载|jqueryapichm(cuishifeng.cn)参考文档2:jQuery教程(w3school.com.cn),jQuery......
  • js,jQuery获取html5的data-*属性
    js,jQuery获取html5的data-*属性  今天做项目的时候发现一个坑,关于jQuery获取data-*属性的方法data(),特写此篇来记录。data-*自定义数据属性HTML5规定可以为元......
  • 由querywrapper使用不当导致的两个错误
    QueryWrapper<Invoice>queryWrapper=newQueryWrapper<>(invoice);Page<Invoice>page=newPage<Invoice>(invoice.getPageNo(),invoice.getPageSize());queryWrap......
  • Jquery
    是一个封装好的js库函数,注意用jq前要看文档加载好了没有: $(document).ready(function(){//jQueryfunctionsgohere});文档加载好的函数$(this)......
  • body传参和query传参
    get请求只能传query参数,query参数都是拼接在请求地址上的。post可以传body和query两种形式的参数。get请求在url中传送的参数是有长度限制的,而post没有限制。get比post更......
  • python性能调优之key-query
    近期接触到一个性能调优的问题,需要在mongodb中比对大约100G的csv文件的key在mongodb中是否存在baseline首先做一个什么优化都没有的情况下的基准测试:bat......
  • [CSS3] Container query
    https://developer.mozilla.org/en-US/docs/Web/CSS/CSS_Container_Queries Usethecontainer-type propertyavalueof size, inline-size,or normal.Theseva......
  • jQuery Core
    jQueryCDN-providedby(mt)MediaTemplejQueryCoreCurrentversion(canbehotlinked)​​jquery-1.10.0.min.js​​-latestversion,minifiedforproduction......
  • jquery中如何以逗号分割字符串_百度知道
    jquery中如何以逗号分割字符串_百度知道javascript本身就是带split方法的定义和用法split()方法用于把一个字符串分割成字符串数组。语法stringObject.split(separator,how......
  • Lazy Load, 延迟加载图片的 jQuery 插件 - NeoEase
    LazyLoad,延迟加载图片的jQuery插件-NeoEaseLazyLoad是一个用JavaScript编写的jQuery插件.它可以延迟加载长页面中的图片.在浏览器可视区域外的图片不会被......