首页 > 数据库 >数据库系统概论——第1章 绪论

数据库系统概论——第1章 绪论

时间:2024-05-29 18:57:56浏览次数:29  
标签:绪论 数据库 层次模型 概论 数据库系统 数据 模型 数据模型

参考:数据系统概论(第5版) 王珊 萨师煊 编著

目录

数据库系统概述

基本概念

数据管理技术的产生和发展

数据管理技术——三个阶段

数据库系统的特点

数据模型

根据模型应用的不同目的,分为两大类

概念模型

信息世界中的基本概念

表示方法:实体-联系方法

数据模型的组成要素

常用数据模型

层次模型

层次模型的数据结构

层次模型的优缺点

网状模型

网状模型的数据结构

网状模型的优缺点

关系模型

关系模型的数据结构

关系模型的优缺点

数据库系统的结构

概念

三级模式结构

数据库的二级映像功能与数据独立性 

1.外模式/模式映像

​编辑

2.模式/内模式映像


数据库系统概述

基本概念

  • 数据(data):数据是数据库中存储的基本对象。
  • 数据库(DataBase,DB):存放数据的仓库,是长期存储在计算机内、有组织、可共享的大量数据的集合。具有较小的冗余度、较高的数据独立性、易扩展性,可为各种用户共享。

          数据库数据具有永久存储、有组织、可共享三个基本特点。

  • 数据库管理系统(DataBase Management System,DBMS):是位于用户与操作系统之间的一层数据管理软件。和操作系统一样是计算机的基础软件。

       主要功能:

      (1)数据定义功能

      (2)数据组织、存储和管理

      (3)数据操作功能

      (4)数据库的事务管理和运行管理

      (5)数据库的建立和维护功能

      (6)其他功能(通信功能、数据转换功能、互访和互操作功能……)

  • 数据库系统(DataBase System,DBS):是由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员(DBA)组成的存储、管理、处理和维护数据的系统

数据管理技术的产生和发展

数据管理是指对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题。

数据的处理是指对各种数据进行收集、存储、加工和传播的一系列活动的总和。

数据管理技术——三个阶段

1.人工管理阶段:20世纪50年代中期以前

   特点:数据不保存、应用程序管理数据、数据不共享、数据不具有独立性

2.文件系统阶段:20世纪50年代后期到60年代中期

   特点:数据可以长期保存、有文件系统管理数据

   缺点:数据共享性差、冗余度大;数据独立性差

3.数据库系统阶段:20世纪60年代后期以来

   从文件系统到数据可系统标志着数据管理技术的飞跃 

数据管理三个阶段的比较
人工管理阶段文件系统阶段数据库系统阶段
背景应用背景科学计算科学计算、数据管理大规模数据管理
硬件背景无直接存取存储设备磁盘、磁鼓大容量磁盘、磁盘阵列
软件背景没有操作系统有文件系统有数据库管理系统
处理方式批处理联机实时处理、批处理联机实时处理、分布处理、批处理
特点数据的管理者用户(程序员)文件系统数据库管理系统
数据面向的对象某一应用程序某一应用现实世界(一个部门、企业、跨国组织等)
数据的共享程度无共享,冗余度极大共享性差,冗余度大共享性高,冗余度小
数据的独立性不独立,完全依赖于程序独立性差具有高度的物理独立性和一定的逻辑独立性
数据的结构化无结构记录内有结构、整体无结构整体结构化、用数据模型描述
数据控制能力应用程序自己控制应用程序自己控制由数据库管理系统提供数据安全性、完整性、并发控制和恢复能力

数据库系统的特点

和人工管理和文件系统相比,数据库系统的特点:

1.数据结构化:数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别

  “整体”结构化是指数据库中的数据不仅仅针对某一个应用,而是面向整个组织或企业;不仅数据内部是结构化的,而且整体是结构化的,数据之间是具有联系的。

2.数据的共享性高、冗余度低且易扩充:数据共享可以大大减少数据冗余,节约存储空间,还可以避免数据之间的不相容性与不一致性。

3.数据独立性高:是借助数据库管理数据的一个显著优点,包括数据的物理独立性和逻辑独立性。

   物理独立性:指用户的应用程序与数据库中数据的物理存储是相互独立的。

   逻辑独立性:指用户的应用程序与数据库的逻辑结构式相互独立的。

4.数据由数据库管理系统统一管理和控制

    因为数据库共享带来的安全隐患,数据库管理系统必须提供的数据控制功能:

   (1)数据的安全性保护:指保护数据以防止不合法使用造成的数据泄密和破坏。

   (2)数据完整性检查:指数据的正确性、有效性和相容性。

   (3)并发控制

   (4)数据库恢复

数据库系统的出现使信息系统从以前加工数据的程序为中心转向围绕共享的数据库为中心的新阶段。

数据模型

数据模型:是对现实世界数据特征的抽象。是用来描述数据、组织数据对数据进行操作的。是数据库系统的核心和基础。

根据模型应用的不同目的,分为两大类

第一类:概念模型:也称信息模型,是按用户观点来对数据和信息建模,主要用于数据库设计。

第二类:逻辑模型和物理模型

物理模型:是按计算机系统的观点对数据建模,主要用于数据库系统的实现。主要包括:层次模型、网状模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型等。

物理模型:是对数据最底层的抽象,描述数据在系统内部人士的表示方式和存取方法,或在磁盘或磁带上存储方式和存取方法,是面向计算机系统的。

现实世界抽象为信息世界,然后将信息世界转换为机器世界。

概念模型

概念模型实际上是现实世界到机器世界的一个中间层次。

信息世界中的基本概念

1.实体:客观存在并可相互区别的事物

2.属性:实体所具有的某一特性

3.码(key):唯一标识实体的属性集

4.实体型:用实体名及其属性名集合来抽象和刻画同类实体,称为实体型

5.实体集:同一类型实体的集合

6.联系:实体之间的联系通常是指不同实体集之间的联系,有一对一、一对多和多对多等多种类型。

表示方法:实体-联系方法

概念模型的表示方法很多,最常用的是P.P.S.Chen于1976年提出的实体-联系方法(Entity-Releationship approach)。

该方法用E-R图来描述现实世界的概念模型

E-R方法也称为E-R模型

数据模型的组成要素

1.数据结构:描述数据库的组成对象以及对象之间的联系。

2.数据操作:指对数据库中各种各样对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。

3.数据的完整性约束条件:是一组完整性规则。完整性规则是给定的数据模型中数据机器联系所具有的制约和依存规则,用以限定符和数据模型的数据库状态已经状态的变化,以保证数据的正确、有效和相容。

常用数据模型

层次模型

网状模型

关系模型

面向对象数据模型

对象关系数据模型

半结构化数据模型

(其中层次模型和网状模型统称为格式化模型)

层次模型

层次模型是数据库系统中最早出现的数据模型。

层次数据库系统的典型代表是IBM公司的IMA。

层次模型用树形结构来表示各类实体以及实体间的联系。

层次模型的数据结构

在数据库中定义满足下面两个条件的基本层次联系的集合为层次结构:

1.有且只有一个结点没有双亲结点,这个结点称为根结点。

2.根以外的其他结点有且只有一个双亲结点

兄弟结点:同一双亲的子女结点

叶结点:没有子女结点的结点

层次模型像一颗倒立的树,结点的双亲是唯一的。

层次模型的一个基本特点是,任何一个给定的记录值只能按其层次路径查看,没有一个子女记录值能够脱离双亲记录值而独立存在。

层次模型的优缺点

优点:

  1. 层次模型的数据结构比较简单清晰
  2. 层次数据库的查询效率高
  3. 层次数据模型提供了良好的完整性支持

缺点:

  1. 现实世界中很多联系是非层次性的,不适应层次模型表示
  2. 对插入和删除操作限制比较多,应用程序编写比较复杂
  3. 查询子女结点必须通过双亲结点
  4. 由于结构严密,层次命令趋于程序化

网状模型

网状数据模型的典型代表是DBTG系统,亦称CODASTYL系统。

网状模型的数据结构

在数据库中,把满足以下两个条件的基本层次联系集合称为网状模型:

1.允许一个以上的结点无双亲

2.一个结点可以有多于一个双亲

层次模型中子女结点和双亲结点的联系是唯一的,而网状模型中这种联系可以不唯一

网状模型的优缺点

优点:

  1. 能够更为直接地描述现实世界
  2. 具有良好的性能,存取效率较高

缺点:

  1. 结构比较复杂
  2. 网状模型的DDL、DML复杂,且要嵌入某一种高级语言中,用户不容易掌握,不宜使用
  3. 用户必须了解系统结构细节,加重了编写应用程序的负担

关系模型

关系模型是最重要的一种数据模型

关系模型的数据结构

关系模型建立在严格的数学概念的基础上的。

用户观点看,关系模型是由一组关系组成。

关系模型中的一些术语:

  1. 关系:一关系对应通常说的一张表
  2. 元组:表中的一行即为一个元组
  3. 属性:表中的一列即为一个属性,给每个属性起一个名称即属性名
  4. 码:也称码键。表中的某个属性组,它可以唯一确定一个元组。
  5. 域:是一组具有相同数据类型的值的集合。
  6. 分量:元组中的一个属性值。
  7. 关系模式:对关系的描述

关系模型要求关系必须是规范化的,关系的每一个分量必须是一个不可分的数据项,不允许表中还有表

关系模型的优缺点

优点:

  1. 建立在严格的数据概念的基础上
  2. 概念单一。数据结构简单、清晰,用户易懂易用
  3. 存取路径对用户透明,具有更高的数据独立性、更好的安全保密性,简化了程序员的工作和数据库开发建立的工作

缺点:

  1. 存取路径对用户是隐蔽的,查询效率往往不如格式化数据模型
  2. 为了提高性能,数据库管理系统必须对用户的查询请求进行优化,因此增加了开发数据库管理系统的难度

数据库系统的结构

  1. 从数据库应用开发人员角度看,数据库系统通常采用三级模式结构,这是数据库系统内部的系统结构
  2. 从数据库最终用户角度看,数据库系统的结构分为单用户结构、主从式结构、分布式结构、客户-服务器、浏览器-应用服务器/数据库服务器多层结构等

概念

型:指对某一类数据的结构和属性的说明

值:是型的一个具体赋值

模式:是数据库中全体数据的逻辑结构和特征的描述,仅仅涉及型的描述,不涉及具体的值。

模式的一个具体的值称为模式的一个实例,同一个模式可以有很多实例

模式是相对稳定的,而实例是相对变动的。模式反应的是数据的结构及其联系,而实例反应的是数据库某一时刻的状态。

三级模式结构

数据库系统的三级模式结构是指数据库系统是由外模式、模式和内模式三级构成。

1.模式:也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。

2.外模式:也称子模式或用户模式,是数据库用户能够看见和使用的局部数据和逻辑结构和特征描述,是数据库·用户的数据视图,是与某一应用有关的数据的逻辑表示。

   一个数据库可以有多个外模式。

3.内模式:也称存储模式,一个数据库只有一个内模式。是数据物理结构和存储方式的描述,是数据在数据可内部的组织方式。

数据库的二级映像功能与数据独立性 

数据库管理系统在三级模式之前提供了两层映像:外模式/模式映像 和 模式/内模式映像

这两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。

1.外模式/模式映像

​​​​​​​

2.模式/内模式映像

​​​​​​​

标签:绪论,数据库,层次模型,概论,数据库系统,数据,模型,数据模型
From: https://blog.csdn.net/siri__iiiii/article/details/139279046

相关文章

  • 【数据库】【《数据库系统概论(第5版)》笔记】第二章:关系数据库
    文章目录@[toc]2.1|关系数据结构及形式化定义关系码关系类型基本关系的性质关系模式关系模型的存储结构2.2|关系操作查询关系语言的分类2.3|关系的完整性实体完整性参照完整性用户定义的完整性2.4|关系代数传统的集合运算并差交笛卡尔积专门的关系运算选择投影连接......
  • 【计算理论】【《计算理论导引(原书第3版)》笔记】第〇章:绪论
    文章目录@[toc]第〇章:绪论0.1|自动机、可计算性与复杂性计算复杂性理论可计算性理论自动机理论0.2|数学概念和术语集合关系等价关系图简单路径连通图圈强连通图字符串和语言字母表上的字符串空串......
  • 2023 年上半年数据库系统工程师考试
    基础知识●计算机中,系统总线用于(1)。(1)A.接口和外设​B.运算器、控制器和寄存器​C.CPU、主存及外设部件​D.DMA控制器和中断控制器参考答案:(1)C系统总线通常用来连接计算机中的各个部件(如CPU、内存和I/O设备)寄存器和运算器部件主要用片内总线连......
  • 2021年上半年数据库系统工程师考试
    基础知识●在CPU中,用(1)给出将要执行的下条指令在内存中的地址。(1)A.程序计数器​B.指令寄存器​C.主存地址寄存器​D.状态条件寄存器参考答案:(1)A●以下关于RISC和CISC计算机的叙述中,正确的是(2)。(2)A.RISC不采用流水线技术,CISC采用流水......
  • 2019 年上半年数据库系统工程师考试
    基础知识●计算机执行程序时,CPU中(1)的内容是一条指令的地址。(1)A、运算器B、控制器C、程序计数器D、通用寄存器参考答案:(1)C●DMA控制方式是在(2)之间直接建立数据通路进行数据的交换处理。(2)A、CPU与主存B、CPU与外设​C、主存与外设D、外设与外设参考答案:(2)C直......
  • 2020年上半年数据库系统工程师考试
    基础知识●下列属于CPU中算术逻辑单元的部件是(1)。(1)A、程序计数器​B、加法器​C、指令寄存器​D、指令译码器参考答案:(1)B●在CPU和主存之间设置高速缓存(Cache)的目的是为了解决(2)的问题。(2)A、主存容量不足​B、主存与外存储器速......
  • 在Linux中,如何设计一个高可用数据库系统?
    设计一个高可用的数据库系统在Linux环境中是一个综合性的工程,涉及硬件、软件、网络和运维等多个层面的策略。以下是一些关键步骤和实践方法:1.硬件与基础设施冗余硬件:确保所有关键组件(如服务器、存储设备、网络交换机)都有热备或冷备,以减少单点故障。高质量网络:使用高带宽、低......
  • 数据库系统概论-- p70第6题,用关系代数完成题目要求
    6.设有一个SPJ数据库,包括s、P、J、SPJ四个关系模式:S(SNO,SNAME,STATUS,CITY);P(PNO,PNAME,COLDR,WEIGHT);J(JNO,JNAME,CITY);SPJ(SNO,PNO,JNO,QTY);供应商表S由供应商代码(SNO)、供应商姓名(SNAME)、供应商状态(STATUS)、供应商所在城市(CITY)组成;零件表P由零件代码(PNO)、零件名(PNAME)、......
  • 项目管理概论
        ......
  • 统计机器学习—概论
    统计学习方法实现步骤主要组成监督学习非监督学习半监督学习强化学习监督学习任务学习一个模型,使模型能够对任意给定的输入,对其相应的输出做一个好的预测基本概念实例instance每一个具体的输入是一个实例通常由特征向量表示,所有特征......