MySQL大表设计

时间：2023-11-21 18:45:04浏览次数：55

标签：索引查询 field MySQL 设计 main data id 大表

存储大规模数据集需要仔细设计数据库模式和索引，以便能够高效地支持各种查询操作。在面对数亿条数据，每条数据包含数百个字段的情况下，以下是我能想到的在设计数据库的时候需要注意的内容，不足之处欢迎各位在评论区批评指正：

1. 数据库设计

表结构设计

垂直分割：将大的表分割成多个相关性较小的表，以减少单个表的字段数量。这有助于提高查询效率和降低冗余。
规范化：合理使用规范化，将重复数据抽取成独立的表，以减小数据冗余。

-- 例子：主表
CREATE TABLE main_data (
    id INT PRIMARY KEY,
    field_1 VARCHAR(255),
    field_2 INT,
    -- 其他字段
);

-- 例子：关联表
CREATE TABLE additional_data (
    id INT PRIMARY KEY,
    main_data_id INT,
    field_201 VARCHAR(255),
    -- 其他字段
    FOREIGN KEY (main_data_id) REFERENCES main_data(id)
);

数据类型选择

根据字段的性质选择适当的数据类型，以减小存储空间和提高查询效率。

2. 索引设计

主键索引：对主键字段创建索引，以提高检索速度。
```
CREATE INDEX idx_main_data_id ON main_data(id);
```
唯一索引：对经常被查询的唯一性字段创建索引，例如，用户名或邮箱。
```
CREATE UNIQUE INDEX idx_unique_field ON main_data(field_1);
```
组合索引：根据查询需求创建组合索引，以提高联合查询的效率。
```
CREATE INDEX idx_combination ON main_data(field_1, field_2);
```
全文索引：对需要进行全文搜索的字段创建全文索引，例如，文本内容。
```
CREATE FULLTEXT INDEX idx_fulltext ON main_data(text_field);
```

3. 分库分表

如果数据量仍然巨大，可以考虑分库分表策略，将数据划分到不同的数据库或表中。

4. 数据分区

根据时间、范围等条件对数据进行分区，以提高查询效率。

5. 垂直分割

对于一些很少使用的字段，可以考虑将其垂直分割到其他表中，只在需要时进行关联查询。

6. 数据库参数调优

调整数据库的参数，如缓冲池大小、连接池大小等，以适应大规模数据的存储和查询需求。

-- 例子：设置缓冲池大小
SET GLOBAL innodb_buffer_pool_size = 2G;

设计大规模数据集的数据库是一个综合性的任务，需要考虑到数据结构、索引、查询需求以及数据库引擎的特性。在设计时，充分了解数据的访问模式，根据查询的特点合理设计索引，通过适当的规范化和分区来优化存储结构，最终达到高效的查询和存储效果。

声明：本作品采用署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)进行许可，使用时请注明出处。
Author: mengbin
blog: mengbin
Github: mengbin92
cnblogs: 恋水无意
腾讯云开发者社区：孟斯特

标签：索引,查询,field,MySQL,设计,main,data,id,大表
From： https://www.cnblogs.com/lianshuiwuyi/p/17847284.html

软件设计模式学习每日总结-第九天
第九天组合模式：组合多个对象形成树形结构，使得叶子和容器的使用具有一致性。透明组合模式：声明了对象的所有的方法。安全组合模式：不声明对象的方法。 ......
领域驱动设计之银行转账：Wow框架实战
银行账户转账案例银行账户转账案例是一个经典的领域驱动设计（DDD）应用场景。接下来我们通过一个简单的银行账户转账案例，来了解如何使用Wow进行领域驱动设计以及服务开发。银行转账流程准备转账（Prepare）：用户发起转账请求，触发Prepare步骤。这个步骤会向源账户发送准备转账的请......
针对苜蓿草青贮打捆包膜一体化机械的设计-文档
摘要当前，企业的发展朝着智能化和自动化的方向发展，操作简单的机械设备受到众多厂家的青睐，引起了研究人员的普遍关注。本次毕业设计是针对苜蓿草青贮打捆包膜一体化机械的设计，包括捡拾器、输送机构、喂入切割结构和缠网包膜机构。拾取器主要由电机驱动螺旋机构进行旋转，将苜蓿不断......
[Flink] Flink(CDC/SQL)Job在启动时，报“ConnectException: Error reading MySQL varia
1问题描述1.1基本信息所属环境：CN-PT问题时间：2023-11-21所属程序:FlinkJob(XXXPT_dimDeviceLogEventRi)作业类型：FlinkSQLJob数据流:业务MySQL==>FlinkJob(FlinkCdcConnector(mysql)+FlinkSQL)==>BigdataKafka==>BigdataOLAP==>业务系统作业......
04MYSQL
查询关键字之having过滤having与where的功能是一模一样的都是对数据进行筛选where用在分组之前的筛选having用在分组之后的筛选为了更好的区分所以将where说成筛选having说成过滤#统计每个部门年龄在30岁以上的员工的平均薪资并且保留平均薪资大于10000的部门......
使用docker 搭建xtrabackup服务，实现mysql全量和增量备份
根据前面的mysql备份调研得知，mysql的备份重头戏就是xtrabackup，mysqldump只能算开胃菜本篇就着重讨论下xtrabackup的使用，由于考虑到维持虚拟机环境的整洁，和搭建使用的通用和便利性，这里选择基于docker环境使用照惯例，学习任何一个工具最佳途径就是研读官方文档，这里贴出官方文档：http......
mysql数据库死锁
转载自：https://zhuanlan.zhihu.com/p/506662991?utm_id=0============== 什么是死锁说到死锁，还是先来复习下什么是死锁吧。死锁是指两个或两个以上的进程在执行过程中，由于竞争资源或者由于彼此通信而造成的一种阻塞的现象，若无外力作用，它们都将无法推进下去。此时称系统处于......
2023-2024-1 20211211 《信息安全系统设计与实现（上）》第13章
1网络编程简介TCP/IP协议、UDP和TCP协议、服务器-客户机计算、HTTP和Web页面、动态Web页面的PHP和CGI编程2TCP/IP协议IPv432位地址IPv6128位地址TCP/IP协议顶层是使用TCP/IP的应用程序，用于登录到远程主机的ssh，用于交换电子邮件的mail、用于Web页面的http等应用程序需要......
浅谈微服务架构的设计理念
微服务架构是一种软件设计和开发的架构风格，将应用程序划分为一组小而自治的服务，每个服务都有自己的数据存储和业务逻辑，并通过轻量级的通信机制相互协作。以下是微服务架构的一些设计理念：1.服务自治性（ServiceAutonomy）:核心思想：微服务应该是自治的，即每个服务都独立运行、部署......
使用docker 搭建xtrabackup服务，实现mysql全量和增量备份
mysql数据库的备份是运维的重中之重，是保障服务灾难恢复的最后一道屏障在我的构想里，一个完备的mysql容灾体系应该包括高可用架构和一套基础的数据库备份方案高可用架构：MM+ Keepalived，PXC（PerconaXtraDBCluster）或者GR（GroupReplication），来保证故障恢复，并附带一个延迟备库（延迟1......