数据库系统
- 数据:是数据库中存储的基本对象,是描述事物的符号记录。
数据的种类:文本、图形、图像、音频、学生的档案记录、货物的运输情况等。 - 数据库DB:是长期存储在计算机内、有组织的、可共享的大量数据的集合。
- 数据库的基本特征:
- 数据按一定的数据模型组织、描述和存储;
- 可为各种用户共享;
- 冗余度较小;
- 数据独立性较高;
- 易扩展。
- 数据库系统DBS:是一个采用了数据库技术,有组织的、动态的存储大量相关数据,方便多用户访问的计算机系统。其由下面四个部分组成:
- 数据库(统一管理、长期存储在计算机内的,有组织的相关数据的集合)
- 硬件(构成计算机系统包括存储数据所需的外部设备)
- 软件(操作系统、数据库管理系统及应用程序)
- 人员(系统分析和数据库设计人员、应用程序员、最终用户、数据库管理员DBA)。
- 数据库管理系统DBMS的功能
实现对共享数据有效的组织、管理和存取。
包括数据定义、数据库操作、数据库运行管理、数据的存储管理、数据库的建立和维护等。
三级模式-两级映像
- 内模式:管理如何存储物理的数据,对应具体物理存储文件。
- 模式:又称为概念模式,就是我们通常使用的基本表,根据应用、需求将物理数据划分成一张张表。
- 外模式:对应数据库中的视图这个级别,将表进行一定的处理后再提供给用户使用
- 外模式-模式映象:是表和视图之间的映射,存在于概念级和外部级之间,若表中数据发生了修改,只需要修改此映射,则无需修改应用程序。
- 模式-内模式映像:是表和数据的物理存储之间的映射,存在于概念级和内部级之间,若修改了数据存储方式,只需要修改此映射,而不需要去修改应用程序。
考试真题
数据库设计
- 需求分析:既分析数据存储的要求,产出物有数据流图、数据字典、需求说明书。
- 概念结构设计:就是设计E-R图,也既实体-属性图,与物理实现无关,说明有哪些实体,实体有哪些属性。
- 逻辑结构设计:将E-R图,转换成关系模式,也即转换成实际的表和表中的列属性,这里要考虑很多规范化的东西。
- 物理设计:根据生成的表等概念,生成物理数据库。
数据模型
- 关系模型是二维表的形式表示的实体-联系模型,是将实体-联系模型转换而来的,经过开发人员设计的;
- 概念模型是从用户的角度进行建模的,是现实世界到信息世界的第一抽象,是真正的实体-联系模型。
- 网状模型表示实体类型及其实体之间的联系,一个事物和另外几个都有联系,形成一张网。
- 面相对象模型是采用面相对象的方法设计数据库,以对象为单位,每个对象包括属性和方法,具有类和继承等特点。
- 数据模型三要素:数据结构(所研究的对象类型的集合)、数据操作(对数据库中各种对象的实例允许执行的操作的集合)、数据的约束条件(一组完整性规则的集合)。
- 用E-R图来描述概念数据模型,世界是由一组称作实体的基本对象和这些对象之间的联系构成的。
- 在E-R模型中,使用椭圆表示属性(一般没有)、长方形表示实体、菱形表示联系、联系的两端要填写联系类型,示例如下图:
- 实体:客观存在并可相互区别的事物。可以使具体的人、事、物、或抽象概念。如人、汽车、图书、账户、贷款。
- 弱实体和强实体:弱实体依赖于强实体的存在而存在。
- 实体集:具有相同类型和共享相同属性的实体的集合,如学生、课程。
- 属性:实体所具有的特性。
- 属性分类:简单属性和复合属性;单属性和多值属性;NULL属性;派生属性。
- 域:属性的取值范围称为该属性的域。
- 码(key):唯一标识实体的属性集。
- 联系:现实世界中事物内部以及事物之间的联系,在E-R图中反映为实体内部的联系和实体之间的联系。
- 联系类型:一对一1:1、一对多1:N、多对多M:N。
- 两个以上实体型的联系:
- 关系模型中数据的逻辑结构是一张二维表,由行列组成。用表格结构表达实体集,用外键标识实体间的联系。如下图:
- 优点:建立在严格的数字概念基础上;概念单一、结构简单、清晰、用户易懂易用;存取路径对用户透明,从而数据独立性、安全性好,简化数据库开发工作。
- 缺点:由于存取路径透明,查询效率往往不如关系数据模型。
- E-R模型转换问关系模型:每个实体都对应一个关系模型;联系分为三种:
1:1联系中,联系可以放到任意的两端实体中,作为一个属性(要保证1:1的两端关联),也可以转换为一个单独的关系模式;
1:N的联系中,联系可以单独作为一个关系模式,也可以在N端中加入1端实体的主键;
M:N的联系中,联系必须作为一个单独的关系模式,其主键是M和N端的联合主键。