分区适用于例如日志记录,查询少。一般用于后台的数据报表分析。对于这些数据汇总需求,需要很多日志表去做数据聚合,我们能够容忍1s到2s的延迟,只要数据准确能够满足需求就可以。
一、MySQL创建表分区
MySQL主要支持4种模式的分区:range分区、list预定义列表分区,hash 分区,key键值分区。
录入使用key键值分区:
CREATE TABLE `test2` ( `id` int(20) NOT NULL AUTO_INCREMENT COMMENT 'ID', `name` varchar(100) DEFAULT NULL COMMENT '名称', `state` int(1) DEFAULT NULL COMMENT '状态', PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 PARTITION BY KEY (id) PARTITIONS 10;
二、Oracle创建表分区
表空间及分区表的概念
表空间:是一个或多个数据文件的集合,所有的数据对象都存放在指定的表空间中,但主要存放的是表, 所以称作表空间。
分区表:当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个表空间(物理文件上),这样查询数据时,不至于每次都扫描整张表。
表分区的具体作用
通常,分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务,分区是构建千兆字节数据系统或超高可用性系统的关键工具。
什么时候使用分区表?
• 表的大小超过2GB。
• 表中包含历史数据,新的数据被增加都新的分区中。
表分区的优缺点
优点:
- 改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。
- 增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;
- 维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;
- 均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能。
缺点:
- 已经存在的表没有方法可以直接转化为分区表。但是有几种方式可以间接完成这个操作,大家可以参考:oracle分区表的建立方法(包含已经存在的表要分区):http://blog.csdn.net/wanglilin/article/details/7177338
表分区的几种类型及操作方法
范围分区:
范围分区将数据基于范围映射到每一个分区,这个范围是你在创建分区时指定的分区键决定的。这种分区方式是最为常用的,并且分区键经常采用日期。
举个例子:你可能会将销售数据按照月份进行分区。
当使用范围分区时,请考虑以下几个规则:
1、每一个分区都必须有一个VALUES LESS THEN子句,它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。
2、所有分区,除了第一个,都会有一个隐式的下限值,这个值就是此分区的前一个分区的上限值。
3、在最高的分区中,MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值,也可以理解为高于任何分区中指定的VALUE LESS THEN的值,同时包括空值。
例一:按ID划分
假设有一个CUSTOMER表,表中有数据200000行,我们将此表通过CUSTOMER_ID进行分区,每个分区存储100000行,我们将每个分区保存到单独的表空间中,这样数据文件就可以跨越多个物理磁盘。下面是创建表和分区的代码,如下:
CREATE TABLE CUSTOMER ( CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY, FIRST_NAME VARCHAR2(30) NOT NULL, LAST_NAME VARCHAR2(30) NOT NULL, PHONE VARCHAR2(15) NOT NULL, EMAIL VARCHAR2(80), STATUS CHAR(1) ) PARTITION BY RANGE (CUSTOMER_ID) ( PARTITION CUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01, PARTITION CUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02 )
例二:按时间划分
CREATE TABLE ORDER_ACTIVITIES ( ORDER_ID NUMBER(7) NOT NULL, ORDER_DATE DATE, TOTAL_AMOUNT NUMBER, CUSTOTMER_ID NUMBER(7), PAID CHAR(1) ) PARTITION BY RANGE (ORDER_DATE) ( PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE('01-MAY-2003','DD-MON-YYYY')) TABLESPACE ORD_TS01, PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUN-2003','DD-MON-YYYY')) TABLESPACE ORD_TS02, PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUL-2003','DD-MON-YYYY')) TABLESPACE ORD_TS03 )
例三:MAXVALUE
CREATE TABLE RangeTable ( idd INT PRIMARY KEY , iNAME VARCHAR(10), grade INT ) PARTITION BY RANGE (grade) ( PARTITION part1 VALUES LESS THEN (1000) TABLESPACE Part1_tb, PARTITION part2 VALUES LESS THEN (MAXVALUE) TABLESPACE Part2_tb );
示例:
create table EXTERNAL_USER_LOG( ID number(20,0) not null primary key, request_ip nvarchar2(100), request_user nvarchar2(100), request_data nvarchar2(1000), response_data nvarchar2(1000), app_key nvarchar2(100), reqeust_time timestamp, request_year number(4,0) not null, request_month number(2,0) not null, request_day number(2,0) not null, request_file_path varchar2(100), response_file_path varchar2(100), request_url varchar2(100)
)
PARTITION BY RANGE(reqeust_time) ( PARTITION part01 VALUES LESS THAN (to_date('2021-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part02 VALUES LESS THAN (to_date('2022-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part03 VALUES LESS THAN (to_date('2023-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part04 VALUES LESS THAN (to_date('2024-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part05 VALUES LESS THAN (to_date('2025-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part06 VALUES LESS THAN (to_date('2026-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part07 VALUES LESS THAN (to_date('2027-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part08 VALUES LESS THAN (to_date('2028-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part09 VALUES LESS THAN (to_date('2029-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part10 VALUES LESS THAN (to_date('2030-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part11 VALUES LESS THAN (to_date('2031-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part12 VALUES LESS THAN (to_date('2032-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part13 VALUES LESS THAN (to_date('2033-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part14 VALUES LESS THAN (to_date('2034-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part15 VALUES LESS THAN (to_date('2035-12-31 23:59:59','yyyy-MM-dd hh24:mi:ss')), PARTITION part16 VALUES LESS THAN (to_date('2036-12-31 23:59:59','yyyy-MM-dd hh24:mi:s
有关表分区的一些维护性操作:
添加分区
以下代码给SALES表添加了一个P3分区
ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN(TO_DATE('2003-06-01','YYYY-MM-DD'));
注意:以上添加的分区界限应该高于最后一个分区界限。
以下代码给SALES表的P3分区添加了一个P3SUB1子分区
ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES('COMPLETE');
删除分区
以下代码删除了P3表分区:
ALTER TABLE SALES DROP PARTITION P3;
在以下代码删除了P4SUB1子分区:
ALTER TABLE SALES DROP SUBPARTITION P4SUB1;
注意:如果删除的分区是表中唯一的分区,那么此分区将不能被删除,要想删除此分区,必须删除表。
截断分区
截断某个分区是指删除某个分区中的数据,并不会删除分区,也不会删除其它分区中的数据。当表中即使只有一个分区时,也可以截断该分区。通过以下代码截断分区:
ALTER TABLE SALES TRUNCATE PARTITION P2;
通过以下代码截断子分区:
ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2;
合并分区
合并分区是将相邻的分区合并成一个分区,结果分区将采用较高分区的界限,值得注意的是,不能将分区合并到界限较低的分区。以下代码实现了P1 P2分区的合并:
ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2;
拆分分区
拆分分区将一个分区拆分两个新分区,拆分后原来分区不再存在。注意不能对HASH类型的分区进行拆分。
ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE('2003-02-01','YYYY-MM-DD')) INTO (PARTITION P21,PARTITION P22);
接合分区(coalesca)
结合分区是将散列分区中的数据接合到其它分区中,当散列分区中的数据比较大时,可以增加散列分区,然后进行接合,值得注意的是,接合分区只能用于散列分区中。通过以下代码进行接合分区:
ALTER TABLE SALES COALESCA PARTITION;
重命名表分区
以下代码将P21更改为P2
ALTER TABLE SALES RENAME PARTITION P21 TO P2;
参考文章:https://cloud.tencent.com/developer/article/1033836
标签:59,LESS,创建,分区,PARTITION,分区表,VALUES,THAN From: https://www.cnblogs.com/zwh0910/p/15507138.html