什么是范式?
范式是数据库设计时遵循的一种规范,不同的规范要求遵循不同的范式。每个范式,都是用来规定某种结构或数据要求——后一范式都是在前一范式已经满足的情况用来“加强要求”
最常用的三大范式
第一范式(1NF):属性不可分割,即每个属性都是不可分割的原子项。(实体的属性即表中的列)
第二范式(2NF):满足第一范式;且不存在部分依赖,即非主属性必须完全依赖于主属性。(主属性即主键;完全依赖是针对于联合主键的情况,非主键列不能只依赖于主键的一部分)
第三范式(3NF):满足第二范式;且不存在传递依赖,即非主属性不能与非主属性之间有依赖关系,非主属性必须直接依赖于主属性,不能间接依赖主属性。(A -> B, B ->C, A -> C)
1NF
属性不可再分,即表中的每个列都不可以再进行拆分。
如下学生信息表(student):
id、name(姓名)、sex_code(性别代号)、sex_desc(性别描述)、contact(联系方式)
primary key(id)
id | name | sex_code | sex_desc | contact |
---|---|---|---|---|
001 | 张三 | 1 | 男 | 17835201234_安徽省芜湖市xx村 |
002 | 权浩 | 0 | 女 | 17735204567_安徽省淮南市yy村 |
003 | 郑剑 | 0 | 女 | 18835207890_江苏省盐城市zz村 |
如果在查询学生表时经常用到学生的电话号,则应该将联系方式(contact)这一列分为电话号(phone)和地址(address)两列,这样才符合第一范式。
修改使表满足1NF后:
id | name | sex_code | sex_desc | phone | address |
---|---|---|---|---|---|
001 | 张三 | 1 | 男 | 17835201234 | 安徽省芜湖市xx村 |
002 | 权浩 | 0 | 女 | 17735204567 | 安徽省淮南市yy村 |
003 | 郑剑 | 0 | 女 | 18835207890 | 江苏省盐城市zz村 |
判断表是否符合第一范式,列是否可以再分,得看需求,如果将电话号和地址分开才能满足查询等需求时,那之前的表设计就是不满足1NF的,如果电话号和地址拼接作为一个字段也可以满足查询、存储等需求时,那它就满足1NF。
2NF
什么叫依赖:
如果确定一个表中的某个数据(A),则就可以确定该表中的其他另一个数据(B),则我们说:B依赖于A。
实际上,一个表只要有主键,则其他非主键一定是依赖于主键的。
什么叫部分依赖:
如果确定一个表中的某个数据组合(A,B),则就可以确定该表中的其他另一个数据(C),则我们说:C依赖于(A,B)(此时A,B通常就是做出主键)。
但:如果某个数据D,它只依赖于数据A,或者说,A一确定,则D也可以确定,此时我们就称为"数据D部分依赖于数据A"——可见部分依赖是指某个非主键字段,依赖于联合主键字段的其中部分字段。
在满足1NF的前提下,表中不存在部分依赖,非主键列要完全依赖于主键。(主要是说在联合主键的情况下,非主键列不能只依赖于主键的一部分)
如下学生成绩表(score):
stu_id(学生id)、kc_id(课程id)、score(分数)、kc_name(课程名)
primary key(stu_id, kc_id)
stu_id | kc_id | score | kc_name |
---|---|---|---|
001 | 1011 | 85 | 高数3-1 |
001 | 1022 | 79 | 计算机组成原理 |
002 | 1011 | 59.9 | 高数3-1 |
表中主键为stu_id和kc_id组成的联合主键。满足1NF;非主键列score完全依赖于主键,stu_id和kc_id两个值才能决定score的值;而kc_name只依赖于kc_id,与stu_id没有依赖关系,它不完全依赖于主键,只依赖于主键的一部分,不符合2NF。
修改使表满足2NF后:
成绩表(score) primary key(stu_id)
stu_id | kc_id | score |
---|---|---|
001 | 1011 | 85 |
001 | 1022 | 79 |
002 | 1011 | 59.9 |
课程表(kc) primary key(kc_id)
kc_id | kc_name |
---|---|
1011 | 高数3-1 |
1022 | 计算机组成原理 |
将原来的成绩表(score)拆分为成绩表(score)和课程表(kc),而且两个表都符合2NF。
3NF
在满足2NF的前提下,不存在传递依赖。(A -> B, B -> C, A->C)
如下学生信息表(student):
primary key(id)
id | name | sex_code | sex_desc | phone | address |
---|---|---|---|---|---|
001 | 张三 | 1 | 男 | 17835201234 | 安徽省芜湖市xx村 |
002 | 权浩 | 0 | 女 | 17735204567 | 安徽省淮南市yy村 |
003 | 郑剑 | 0 | 女 | 18835207890 | 江苏省盐城市zz村 |
表中sex_desc依赖于sex_code,而sex_code依赖于id(主键),从而推出sex_desc依赖于id(主键);sex_desc不直接依赖于主键,而是通过依赖于非主键列而依赖于主键,属于传递依赖,不符合3NF。
修改表使满足3NF后:
学生表(student) primary key(id)
id | name | sex_code | phone | address |
---|---|---|---|---|
001 | 张三 | 1 | 17835201234 | 安徽省芜湖市xx村 |
002 | 权浩 | 0 | 17735204567 | 安徽省淮南市yy村 |
003 | 郑剑 | 0 | 18835207890 | 江苏省盐城市zz村 |
性别代码表(sexcode) primary key(sex_code)
sex_code | sex_desc |
---|---|
0 | 女 |
1 | 男 |
将原来的student表进行拆分后,两个表都满足3NF。
什么样的表越容易符合3NF?
非主键列越少的表。(1NF强调列不可再分;2NF和3NF强调非主属性列和主属性列之间的关系)
如代码表(sexcode),非主键列只有一个sex_desc;
或者将学生表的主键设计为primary key(id,name,sex_code,phone),这样非主键列只有address,更容易符合3NF。
总结
到这里就已经将库表设计的三范式做了直观阐述,总结如下:
-
第一范式:确保原子性,表中每一个列数据都必须是不可再分的字段。
-
第二范式:确保唯一性,每张表都只描述一种业务属性,一张表只描述一件事。消除非主键部分依赖联合主键中的部分字段,一定要在第一范式已经满足的情况下。
-
第三范式:确保独立性,表中除主键外,每个字段之间不存在任何依赖,都是独立的。消除传递依赖,非主键值不依赖于另一个非主键值。