首页 > 其他分享 >【BUAA-数据管理技术】2-数据模型-概念模型

【BUAA-数据管理技术】2-数据模型-概念模型

时间:2024-06-23 00:01:50浏览次数:24  
标签:联系 概念模型 实体 BUAA 抽象 ER 数据模型 属性

本文内容系2024年北航软件学院数据管理技术课程课堂笔记,内容大部分取自课程PPT,少量来源于互联网,若有侵权请联系删除。文章内容如有错漏,敬请批评指正!

第二章 数据模型

02 - 数据模型-概念模型

2.1 什么是数据模型

  • 模型:是对现实世界的抽象,常用于帮助人们提取问题本质,从而更容易找到解决办法
  • 数据模型:是现实世界数据特征的抽象,是用来描述数据的一组概念和定义。数据在计算机中的组织结构,和施加在这个结构上的处理方法,即是数据模型
  • 不同的数据模型代表了不同的观察世界的角度,代表了不同的抽象方法
  1. 概念数据模型

    • 是独立于计算机系统的数据模型,不涉及信息在计算机中的表示,只用来描述某个特定组织所关心的信息结构,是对现实世界第一层抽象
    • 用户的观点对数据建模,强调其语义表达能力,是用户和数据库设计人员之间进行交流的语言和工具。
  2. 逻辑数据模型

    • 直接面向数据库的逻辑结构,是对现实世界的第二层抽象。它直接与DBMS有关,有严格的形式化定义、DB语言,以便在计算机系统中实现。

    • 有层次模型、网状模型、关系模型等。

      逻辑数据模型是区分不同类型数据库的依据,并在很大程度上决定了数据库的性能和应用范围。

      就是通常所说的数据模型

  3. 物理数据模型

    • 反映了数据在存储介质上的组成结构,并描述了访问机制、如何表达记录结构、记录顺序和访问路径等信息。

2.2 概念模型

基本要求:较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识;简单、清晰、易于用户理解。

2.2.1 ER数据模型

  • 两种常用抽象手段
    1. 分类(Classification):司机,学生,赛事……
      • 定义某一类概念作为现实世界中一组对象的类型
      • 在特定的上下文里,这些对象具有某些共同的特性和行为
    2. 聚集(Aggregation):学生的学号、姓名、专业……
      • 定义某一类型的组成成分
      • 根据上下文管理需求,给出指定类型的特征集合

ER模型的观点:世界是由一组称作实体的基本对象和这些对象之间的联系构成的

  • 三个基本元素

    1. 实体(Entity):客观存在并可以相互区分的客观事物或抽象事件

      实体集:同型实体的集合(e.g. 课程={语文, 数学, 英语})。经常把实体集简称为实体

    2. 属性(Attribute):实体所具有的某一特性,一个实体由若干属性刻画。

      属性类型不同的实体属于不同的实体集,属性类型相同的实体属于同一实体集
      例如,员工和顾客都只有ID属性时,才同属人员实体!!!

      • 域(Domain):属性的取值范围。
      • 属性的类型:单值属性、多值属性(例如某人电话号);简单属性、复合属性
      • 键(key):实体集中能唯一标识实体的属性或属性组。两个以上属性组成的键称为复合键(compound key)。实体集中的每一个实体,在键属性上的取值各不相同
    3. 联系(Relation):由一系列的实体间对应关系所组成

      • 联系的键是复合键,由来自于各相关实体集的键属性组成
      • 也可以用属性来刻画联系的特性
  • ER图(ER diagram)

    • 实体:矩形框
    • 实体的属性:椭圆框,连线到响应实体
    • 实体之间的联系:菱形框,连到有关的实体
  • 联系的元(degree):参与联系的实体的个数

  • 联系的基数比约束(Mapping Cardinality Constraints):表示一个实体可以通过联系关联到的另一个实体集中实体的数量。画ER图时要表明

    • 一对一联系(1:1):班级与班长,观众与座位
    • 一对多联系(1:n):班级与学生,公司与职员。表示可以为:1的那一方用箭头,n的一方没有箭头
    • 多对多联系(m:n):教师与学生,工厂与产品
  • 一元联系:sometimes,二元联系关联的两个实体集实际上属于同一个实体集的两个副本,可将其合并。在一元联系中,需要用角色来区分同一实体集的不同副本

  • 多元联系:⭐️⭐️⭐️牢记三元联系转换为二元联系的方法!(把关系作为一个实体)

在这里插入图片描述

  • 约束(Constraints):是一种对数据库的断言(assertion),数据库应保证该断言成立:丰富了数据的语义,保证数据的有效性和完整性,实现更高效的存储和数据查询(后续详述)
  • 键约束(Key Constraints):可以容易地引用实体
    • **超键(super key)**是实体集中的一个或一组属性,用它们可以唯一的确定每一个实体
    • 候选键(candidate key)是某个超键的==若存在多个候选键,则可以任选一个作为该实体集的主键(primary key)

2.2.2 ER模型建模

建模准则:

  1. 忠实于用户需求

  2. KISS准则(keep it simple and stupid)

  3. 设计上避免冗余

    • 冗余:用两个以上不同的实例描述同一件事情

    • 冗余会导致空间浪费,更会带来数据不一致

    my understanding:一个实体不能是另外一个实体的属性,一件事尽可能少画框

  4. 能抽象为属性的,就不要抽象为实体

    只有在符合下面两个情况之一的时候才需要把事物抽象为实体:

    1. 事物有至少一个非键属性(不属于键的属性):
      学生(姓名) VS 书(书名,页数,出版年代)
    2. 事物处于“一对多”或“多对多”联系中“多”那一端

    不符合以上情况的事物,都可以抽象为属性。

    • 反过来,应该是实体的,也不要强行拆解为属性

2.2.3 ER模型小结

  • 客观性:ER模型是在客观事物或系统的基础上形成的,在某种程度上反映了客观现实,反映了用户的需求
  • 主观性:ER模型又不等同于客观事物的本身,它往往反映事物的某一方面,至于选取哪个方面或哪些属性、如何表达,则决定于观察者本身的目的与状态
  • 设计过程:
    1. 先设计实体类型(找出逻辑独立的事物,即管理对象);
    2. 再设计联系类型(确定实体之间相互影响的关系);
    3. 最后为实体和联系确定属性
  • ER模型应该充分反映用户需求,要得到用户的认可才能确定下来。

last tip: ER图可以没有联系,不要想复杂!

作业题:

1、现开发一套销售管理系统,需保存交易记录信息,包括销售人员身份证号、顾客身份证号、售卖货品名称、数量、单价。请绘制数据库建模的 ER 图。

  • 这道题看似的实体顾客、销售员、货品(虽然它有很多属性),实际上都是交易记录的属性而已

2、现开发一套销售管理系统,需保存进销存信息,包括: 1). 货品清单,包括货品编号、货品名称、单价、库存数量; 2). 交易记录,包括销售人员身份证号、顾客身份证号、售卖货品编号。请绘制数据库建模的 ER 图。

  • 这道题销售员和顾客都只有ID这一属性,不用抽象出实体,二者共同作为交易方的属性,和货物产生“交易记录”这一联系

3、注意顾客和销售员这两个实体集同属人员实体集,可以合并成一元联系
在这里插入图片描述

标签:联系,概念模型,实体,BUAA,抽象,ER,数据模型,属性
From: https://blog.csdn.net/Gary_ming_/article/details/139890230

相关文章

  • BUAA OO 第四单元总结 + 课程总结
    第四单元课程着眼于UML语言,重点关注了类图、状态图、顺序图三种不同类型的图,分别从不同的视角展现代码架构设计与思考在本单元任务要求我们实现一个图书馆系统,能够实现对于学生的借阅、查询、预约、续借、捐赠等操作,该图书馆包括书架、预约处、借还处、漂流角等不同位置,图......
  • 深入了解Git:从数据模型到集成IDEA
    Git是现代软件开发中不可或缺的版本控制工具。理解Git的数据模型、暂存区、命令行接口,并将其集成到IDE(如IntelliJIDEA),可以显著提升开发效率。本文将从底层开始,逐步深入Git的各个方面,并介绍如何将其集成到IntelliJIDEA中。目录Git的数据模型暂存区Git的命令行接口将Git集......
  • BUAA操作系统万字笔记-课堂笔记-期末考试-考研必备-北航961系列
    文章目录1概论1.1CPU漏洞攻击1.2操作系统简史1.2.1体系结构1.2.2系统发展1.3操作系统基本实现机制1.3.1异常:陷阱和中断2系统引导3内存管理3.1预备知识-链接与装载3.2存储管理基础3.2.1存储器管理目标3.2.2存储器硬件发展3.2.3存储管理的功能3.2.4存储......
  • 【BUAA-OS-理论课】5-IO管理
    本文内容系2024年北航计算机学院/软件学院操作系统课程课堂笔记,内容大部分取自操作系统课程组PPT,少量来源于互联网,若有侵权请联系删除。文章内容如有错漏,敬请批评指正!第五章I/O管理文章目录第五章I/O管理5.1I/O硬件组成设备控制器I/O端口地址与I/O端口地址空......
  • 大模型应用:太普软件基于大数据模型的知识助理场景
    随着数字革命的汹涌澎湃,人工智能的核心——大模型技术,正日益显现其促进人与机器协作共进的决定性作用。广州太普软件科技有限公司(以下简称“太普软件”)依托自研先进技术,巧妙地将大模型知识助理嵌入各行各业的服务之中,使其在知识问答、架构搭建、信息整合及智能推荐等领域展现......
  • JINGWHALE ABCDE 概念模型系统设计建模法,用户画像进行场景化业务需求分析与归纳,帮你规
    JINGWHALE对此论文相关未知以及已知概念、定理、公式、图片等内容的感悟、分析、创新、创造等拥有作品著作权。未经JINGWHALE授权,禁止转载与商业使用。《一种基于概念模型思想的ABCDE系统设计建模法的研究与应用》张云龙(JINGWHALE数字科学艺术创新中心,浙江杭州,310......
  • Mysql数据库-数据模型
    1.关系型数据库(RDBMS)概念:建立在关系模型基础上,由多张相互连接的二维表组成的数据库。二维表:指的是由行和列组成的表,如下图(就类似于Excel表格数据,有表头、有列、有行,还可以通过一列关联另外一个表格中的某一列数据)。MySQL、Oracle、DB2、SQLServer等都是属于关系型数据库,......
  • 数据结构与算法学习(05)查找(2)索引——BUAA
    文章目录查找(2)——索引介绍索引的基本概念稠密索引非稠密索引——分块索引多级索引查找(2)——索引介绍本文为查找第二部分,主要是整理了本人上课时讲的内容索引的基本概念索引:记录关键字值与记录的存储位置之间的对应关系索引文件:由基本数据与索引表两部分组成的......
  • 数据结构与算法学习(07)查找(4)散列、哈希、字典——BUAA
    文章目录查找(4)——散列(Hash)字典介绍散列函数的构造方法直接地址法数字分析法平方取中法叠加法移位叠加法折叠叠加法基数转换法除留余数法随机数法一些好的哈希函数**针对字符串好的哈希函数冲突的处理方法开放地址法线性探测二次探测伪随机特点再散列法链接地址法代......
  • 数据结构与算法学习(06)查找(3)Trie树(C语言)——BUAA
    文章目录查找(3)——Trie树(C语言)介绍结构实现典型应用(字典树)代码实现优势查找(3)——Trie树(C语言)介绍本文为查找第三部分,主要是整理了本人上课时讲的内容,并给出了C语言代码实现结构实现键值由固定的字符序列组成(如数字或字母),如Huffman码、英文单词;对应结点的分层标记......