首页 > 数据库 >数据库三范式

数据库三范式

时间:2024-02-22 13:34:24浏览次数:37  
标签:范式 数据库 课程名称 002 001 90 主键

1. 简介

三大范式是 Mysql 数据库设计表结构所遵循的规范和指导方法,目的是为了减少冗余,建立结构合理的数据库,从而提高数据存储和使用的性能。

三大范式之间是具有依赖关系的,比如第二范式是在第一范式的基础上建设的、第三范式是在第二范式的基础上建设的。当然 Mysql 数据库的范式不止三大范式,除了三大范式,还有巴斯-科德范式(BCNF)、第四范式(4NF)、第五范式(5NF,又称“完美范式")。

而本篇文章,我们只介绍范式中常用的三大范式。

虽然,遵循范式能使我们的数据库结构更合理,但是也不是一成不变的,偶尔我们也要学会在范式的基础,根据实际应用场景,作出相应的变通。


2. 第一范式-1NF

遵循原子性。即表中字段的数据,不可以再拆分

先看一个不符合第一范式的表结构,如下:

员工编码 姓名 年龄
001 销售部小张 28
002 运营部小黄 25
003 技术部小高 32

在这一个表中的,姓名 字段下的数据是可以再进行拆分的,因此它不符合第一范式,那怎么样才符合第一范式呢?如下:

员工编码 部门 姓名 年龄
001 销售部 小张 28
002 运营部 小黄 25
003 技术部 小高 32

那是否遵循第一范式就一定是好的呢?如下:

员工编码 姓名 地址
001 小张 江西省南昌市东湖区
002 小黄 广东省佛山市禅城区
003 小高 湖北省武汉市新洲区

通过观察上述表结构,我们发现,地址是可以再进一步拆分的,比如:

员工编码 姓名
001 小张 江西省 南昌市 东湖区
002 小黄 广东省 佛山市 禅城区
003 小高 湖北省 武汉市 新洲区

虽然拆分后,看上去更符合第一范式了,但是如果项目就只需要我们输出一个完整地址呢?那明显是表在没拆分的时候会更好用。所以范式只是给了我们一个参考,我们更多的是要根据项目实际情况设计表结构。


3. 第二范式-2NF

在满足第一范式的情况下,遵循唯一性,消除部分依赖。即,表中任意一个主键或任意一组联合主键,可以确定除该主键外的所有的非主键值。再通俗点讲就是,一个表只能描述一件事情。

我们用一个经典案例进行解析。

学号 姓名 年龄 课程名称 成绩 学分
001 小张 20 语文 90 3
001 小张 20 数学 90 2
002 小黄 20 语文 90 3
002 小黄 20 语文 90 3
003 小高 20 数学 90 2

我们先分析一下表结构。

  1. 假设学号是表中的唯一主键,那由学号就可以确定姓名和年龄了,但是却不能确定课程名称和成绩。
  2. 假设课程名称是表中的唯一主键,那由课程名称就可以确定学分了,但是却不能确定姓名、年龄和成绩。
  3. 虽然通过学号和课程名称的联合主键,可以确定除联合主键外的所有的非主键值,但是基于上述两个假设,也不符合第二范式的要求。

那我们应该如何调整表结构,让它能复合第二范式的要求呢?

我们可以基于上述的三种主键的可能,拆分成 3 张表,保证一张表只描述一件事情。

  1. 学生表 - 学号做主键

    学号 姓名 年龄
    001 小张 20
    002 小黄 20
    003 小高 20
  2. 课程表 - 课程名称做主键

    课程名称 学分
    语文 3
    数学 2
  3. 成绩表 - 学号和课程名称做联合主键

    学号 课程名称 成绩
    001 语文 90
    001 数学 90
    002 语文 90
    002 语文 90
    003 数学 90

这时候我们可能会想,为什么我们就要遵循第二范式呢?不遵循第二范式会造成什么样的后果呢?

  1. 造成整表的数据冗余
    如,学生表,可能我就只有2个学生,每个学生都有许多的信息,比如,年龄、性别、身高、住址......如果与课程信息放到同一张表中,可能每个学生有3门课程,那数据总条数就会变成6条了。但是通过拆分,学生表我们只需要存储 2 条学生信息,课程表只需要存储 3 条课程信息,成绩表就只需保留学号、课程名称和成绩字段。
  2. 更新数据不方便
    假设,课程的学分发生了变更,那我们就需要把整表关于该课程的学分都要更新一次,但如果我们拆分出课程表,那我们就只需要把课程表中的课程信息更新就行。
  3. 插入数据不方便或产生异常
    • 假设主键是学号或课程名称,我们新增了某个课程,需要把数据插入到表中,这时,可能只有部分人有选修这门课程,那我们插入数据的时候还要规定给哪些人插入对应的课程信息,同时可能由于成绩还没有,我们需要对成绩置空,后续有成绩后还得重新更新一遍。
    • 假设主键是学号和课程名称的联合主键。同样也是新增了某课程,但是暂时没有人选修这门课,缺少了学号主键字段数据,会导致课程信息无法插入。

4. 第三范式 - 3NF

在满足第二范式的情况下,消除传递依赖。即,在任一主键都可以确定所有非主键字段值的情况下,不能存在某非主键字段 A 可以获取 某非主键字段 B

仍然用一个经典例子来解析。

学号 姓名 班级 班主任
001 小黄 一年级(1)班 高老师

这个表中,学号是主键,它可以唯一确定姓名、班级、班主任,符合了第二范式,但是在非主键字段中,我们也可以通过班级推导出该班级的班主任,所以它是不符合第三范式的。

那怎么设计表结构,才是符合第三范式的呢?

  1. 学生表

    学号 姓名 班级
    001 小黄 一年级(1)班
  2. 班级表

    班级 班主任
    一年级(1)班 高老师

通过把班级与班主任的映射关系另外做成一张映射表,我们就成功地消除了表中的传递依赖了。


总结

不知道读者们有没有发现,以上所介绍的范式的最终目的都是为了减少我们的工作量呢?所以说,尽管范式是一种很好的指导规范,但在实际应用中,我们也不需要太局限在范式中,更多的是应该从项目中出发,设计出合理的表结构。

以下是本篇三范式的简单总结:

  • 第一范式(1 NF):字段不可再拆分。
  • 第二范式(2 NF):表中任意一个主键或任意一组联合主键,可以确定除该主键外的所有的非主键值。
  • 第三范式(3 NF):在任一主键都可以确定所有非主键字段值的情况下,不能存在某非主键字段 A 可以获取 某非主键字段 B。

作者:高月之风
链接:如何通俗理解第一、二、三「范式」?
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

标签:范式,数据库,课程名称,002,001,90,主键
From: https://www.cnblogs.com/Fogram-c/p/18027123

相关文章

  • MySQL 数据库
    Linux下MySQL的安装与使用安装前说明查看是否安装过MySQL如果你是用rpm安装,检查一下RPMPACKAGE:rpm-qa|grep-imysql#-i忽略大小写检查mysqlservice:systemctlstatusmysqld.serviceMySQL的卸载1.关闭mysql服务systemctlstopmysqld.service2.查看当......
  • 墨天轮2023年度数据库获奖名单
    随着数字化转型深入推进和数据量的爆炸式增长,千行百业应用对数据库的需求变化推动数据库技术加速创新,全球数据库产业快速发展,我国已迈入第一梯队。2023年国产数据库在技术创新、市场竞争和国际合作等方面取得了显著的成就,展现出振奋人心的发展态势。墨天轮数据社区以近50个客观中......
  • 数据库自治与安全服务训练营火热开营!完成任务可得国潮保温杯和阿里云定制双肩包!
    本训练营带您简单了解数据库自治与云安全服务,数据库自治服务提供云上RDS、PolarDB、NoSQL、ADB等数据库7*24小时异常检测、SQL自优化、安全合规审计、弹性伸缩、数据自治、锁分析等亮点功能。一站式自动化、数字化DAS集成平台,助力您畅享DBA运维智能化。完成训练营任务可得国潮保......
  • 参加数据库管理工具DAS训练营,赢取国潮保温杯和阿里云定制双肩包!
    本训练营带您简单了解数据库自治与云安全服务,数据库自治服务提供云上RDS、PolarDB、NoSQL、ADB等数据库7*24小时异常检测、SQL自优化、安全合规审计、弹性伸缩、数据自治、锁分析等亮点功能。一站式自动化、数字化DAS集成平台,助力您畅享DBA运维智能化。完成训练营任务可得国潮保......
  • KEPServerEX与数据库通讯选型大全
    数据库作为重要的基础软件,是很多软件运行的根基,在信息化时代的今天也是必不可少的基石。KEPServerEX针对不同的数据库有不同的连接方案。关系型数据库 1.DataLogger插件将OPC服务器的数据存储到任何兼容ODBC的关系型数据库支持灵活的设置触发条件,控制何时存储支持自动创......
  • 如何将数据库结构导入到PowerDesigner中
    1.点击File->ReverseEngineer->DataBase 2.弹出弹框,对模型进行命名,同时在DBMS中选择对应的数据库类型,点击确定 3.新弹框选择usingscriptfiles,去选择要导入的脚本,点击确定 4.即可成功导入数据库,效果如下 ......
  • 数据库表字段命名规范
    摘要:当前研发工作中经常出现因数据库表、数据库表字段格式不规则而影响开发进度的问题,在后续开发使用原来数据库表时,也会因为数据库表的可读性不够高,表字段规则不统一,造成数据查询,数据使用效率低的问题,所以有必要整理出一套合适的数据库表字段命名规范来解决优化这些问题。本文......
  • TDengine数据库图形用户界面工具
    tsdb-gui说明由于最近工作中一直用到TDengine,使用过程中发现没有一款较好的图形界面工具,类似Navicat之类的,每次进入控制台进行管理,非常不方便,于是萌生了自己开发一款GUI的想法,目前1.0.0版本已经开发完毕,能满足基本操作,后续有时间继续优化。工具介绍免费开源的时序数据库图形用......
  • Python+Faker+Pandas数据库造数
    今日分享一些Python常用的东西,整理一些小笔记,比如Faker的使用,panda的使用1、使用faker造数据简介测试工作中,经常会遇到需要制造大量测试数据的时候,如果手动造数据必然会浪费大量时间Faker是一个制造数据的强大的python库,可以制造姓名、电话、身份证、地址、邮箱等等各种各样伪......
  • 系统架构设计师-第2章-数据库
    第2章-数据库在信息处理领域,由于数据量庞大,如何有效组织、存储数据对实现高效率的信息处理至关重要。数据库技术是目前最有效的数据管理技术。数据库(DataBase,DB)是指长期存储在计算机内、有组织的、统一管理的相关数据的集合。它不仅描述事物的数据本身,而且还包括相关事物之间......