首页 > 数据库 >数据库基本结构及原理

数据库基本结构及原理

时间:2024-03-08 14:36:34浏览次数:35  
标签:salary name 数据库 元组 原理 instructor2 select 结构

数据库(DataBase,DB):指长期保存在计算机的存储设备上,按照一定规则组织起来,可以被各种用户或应用共享的数据集合。
数据库管理系统(DataBase Management System,DBMS):指一种操作和管理数据库的大型软件,用于建立、使用和维护数据库,对数据库进行统一管理和控制,以保证数据库的安全性和完整性。
用户通过数据库管理系统访问数据库中的数据。
数据库软件应该为数据库管理系统,数据库是通过数据库管理系统创建和操作的。
数据库:存储、维护和管理数据的集合。

数据库系统一般由4个部分组成:

1、数据库是指长期存储在计算机内的,有组织,可共享的数据的集合。

2、硬件:构成计算机系统的各种物理设备,包括存储所需的外部设备。

3、软件:包括操作系统、数据库管理系统及应用程序。

4、人员:主要有4类。第一类为系统分析员和数据库设计人员,系统分析员负责应用系统的需求分析和规范说明,和用户及数据库管理员一起确定系统的硬件配置,并参与数据库系统的概要设计。第二类为应用程序员,负责编写使用数据库的应用程序。第三类为最终用户,他们利用系统的接口或查询语言访问数据库。第四类为数据库管理员,负责数据库的总体信息控制。

1.数据库(Database,DB)是什么
数据库是按一定结构组织并可以长期存储在计算机内、在逻辑上保持一致的、可共享的大量相关联数据的集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为在一定组织范围内的各种用户所共享
广义数据库:Oracle,MySQL,PostgreSQL,Redis,Hbase
2.数据库的应用场景
电商网站:用户账号信息,商品信息,用户订单信息
网上论坛:主题,发帖,回复
3.数据库存在的目的
存储,管理,维护大量数据
提供比Excel,磁盘文件读写等更好的性能和可靠性
如何实现一个数据库? 例:(1)实现一个存储管理学生信息程序 (2)支持基本的按名字读取功能 (3)最简单的,数据存成文本文件,例student.txt
需求1:查询名叫“xx”的学生
(1)打开student.txt (2)读取文件中下一行数据 (3)判断姓名字段是否是“xx”;如果是则返回 (4)如果不是则顺序扫描整个文件直至末尾 (5)关闭student.txt

需求2:更快的查找(索引)
(1)每次读取扫描整个文件很慢
(2)如果能直接根据姓名定位到数据行
(3)增加一个文件存储名字到完整数据行的文件偏移映射
(4)需求:访问速度 方法:独立的索引文件

补充:
信息(Information)是现实世界事物的存在方式或运动状态的反映,具有特定的语义,具有可感知、可存储、可加工、可传递和可再生等自然属性
数据(Data)是描述现实世界事物的符号记录,指用物理符号记录下来的可以见别的信息。物理符号包括数字、文字、图形、图像、声音及其他特殊符号。数据的各种 表现形式都可以经过数字化后存入计算机
数据与信息的关联:数据是信息的符号表示,可称为载体;信息时数据的内涵,是数据的语义解释

需求3:更快读取(缓存)
(1)即使有索引还是每次都要去磁盘上读“xx”的信息
(2)磁盘IO是非常慢的(ms),但访问内存却很快(ns)
(3)如果内存可用,可在内存里面缓存部分数据
(4)需求:访问加速 方法:缓存/Cache

需求4:通用接口
(1)要同时支持WEB服务器访问,支持App访问
(2)为了推广使用存储系统,组设计一套通用访问接口
(3)要求:满足基本数据操作需求,支持各种语言
(4)方法:结构化查询语言----SQL(structure query language)
sql语句-->词法解析关键字(解析出:关键字、单词、运算符等)-->语法解析(识别并判断执行类型)-->读取(read)、插入(inser)、更新(update)、删除(delete)操作

需求5:更优的执行策略
(1)有了SQL,查询就复杂了,比如支持了更多的索引时,如何执行
(2)用户发起一个查询“select * from student where 学号=xxx and 名字=xx”
(3)该选用哪个索引?名字索引?还是学号索引?
(4)方法:查询优化器(当有多个访问路径时,查询优化器可帮助我们选择一个执行更快的执行路径)

需求6:服务更多的用户
(1)真实的数据库很强大,需提供大量客户并发访问
(2)需求:多用户同时高效读写,互不阻塞
(3)方法:需以多进程或多线程或异步响应用户的并发请求

其他需求
(1)需要记录用户的访问日志以便排查问题,需要全日志以及慢查询日志
(2)并发的读写访问需要加锁,防止数据被写坏
(3)为了高效管理磁盘存储空间,需要独立磁盘物理空间管理模块
(4)主从复制系统,以实现集群的高可用
 

数据库语言四大类
DQL(Data Query Language):数据库查询语言。

DDL(Data Definition Language):数据库定义语言。定义关系模式、删除关系、修改关系模式。

关系、属性
DML(Data Manipulation Language):数据库操纵语言。插入元组、删除元组、修改元组。

元组
DCL(Data Control Language):数据库控制语言。用来授权或回收访问数据库的某种特权,并控制数据库操纵事务发生的时间及效果。

GRANT、revoke
commit / rollback work
完整性
实体完整性:要求每个关系(表)有且仅有一个主键,每一个主键值必须唯一,而且不允许为“空”(NULL)或重复。

主键
参照完整性:对于永久关系的相关表,在更新、插入或删除记录时,如果只改其一,就会影响数据的完整性。如删除父表的某记录后,子表的相应记录未删除,致使这些记录称为孤立记录。对于更新、插入或删除表间数据的完整性。

外键
自定义完整性

基础操作
创建关系
create table instructor2(
id char(5) not null,
name varchar(20) not null,
dept_name varchar(20) not null,
salary numeric(8,2),
primary key(id)
);
结果如图。可看出对属性进行了相关定义。

插入元组

insert into 关系名 values(每个属性对应的值);
insert into instructor2 values(00001,'ai','math',2500.37);
insert into instructor2 values(00002,'la','math',3700.89);
insert into instructor2 values(00003,'bi','math',5400.45);
insert into instructor2 values(00004,'ma','english',1450.23);
insert into instructor2 values(00005,'ye','english',3421.34);
insert into instructor2 values(00006,'er','technology',10000.65);

删除所有元组

delete from 关系名;
删除了元组,但关系和属性还存在。

删除关系

drop table 关系名;
删除了关系,进行select查询时会出现关系名无效的错误。

属性操作

alter table 关系名 add 新属性 数据类型,新属性 数据类型,⋯

例:alter table instructor2 add firstname varchar(20),lastname varchar(20);

alter table 关系名 drop 属性,⋯

例:alter table instructor2 drop firstname ,lastname ;
查询语句基础结构

select对应投影Π    from对应笛卡尔积
where对应选择σ

含义
(1).为from子句列出的关系产生笛卡尔积。
(2).在(1)的结果上应用where子句中指定的谓词(条件)。
(3).对于(2)中的元组,输出select子句中指定的属性。
select *(属性1,属性2,...)
from 关系名1,关系名2,...
where 条件1 and 条件2 and ...;

select id,name,salary
from instructor2
where salary>4000;
结果如下

去重操作(distinct)

对于一些属性来说,在某些元组中存在相同的值,有时我们需要对结果去重,得到正确答案。
select distinct 属性名
from 关系名
where 条件

例如:当我们想要查看系名时,多个老师可能位于同一个系,不去重将产生下列结果:


显然这不是我们想要的答案。我们只需要知道存在哪些系,而无需知道个数:


更名操作(as)

优点
方便:长名字变短名字,便于书写语句。
同一关系笛卡尔积:区分属性。
对属性:
对关系:
select 属性 as 属性别名
from 关系名
where 条件

select 属性
from 关系名 as 关系别名
where 条件

例:属性别名

select name as instructor_name,salary
from instructor2
where salary>3500;

结果如下


例:关系别名

select i1.id,i2.name
from instructor2 as i1,instructor2 as i2
where i1.id=i2.id and i2.salary>3500;

结果如下

字符串运算(like)

SQL使用一对单引号来标示字符串,例‘math’。
百分号(%):匹配任意子串
下划线(_):匹配任意一个字符
select 属性
from 关系名
where 属性 like '字符形式';

select *
from instructor2
where salary like '%0_.%';

结果如下

显示次序(order by)

默认升序:asc
降序:desc
select 属性
from 关系名
where 条件
order by 属性 升序/降序;

select * from instructor2  order by salary desc;
结果如下

between⋯

and⋯

属性值介于某个范围内
select *
from instructor2
where 属性名 between ... and ... ;

select *
from instructor2
where salary between 3000 and 6000;

结果如下

分组聚集(group by)

聚集函数:平均值(avg)、最小值(min)、最大值(max)、总和(sum)、计数(count)。
出现在select语句中但没有被聚集的属性只能是出现在group by子句中的属性。
错误查询
select dept_name,id,avg(salary)
from instructor2
group by dept_name;

结果如下

having子句(出现group by时使用)

有group by时,select 和 having子句中出现的属性有所限制。
任何出现在having子句中,但没有被聚集的属性必须出现在group by子句中。
正确查询
select dept_name,avg(salary) as avg_salary
from instructor2
group by dept_name
having avg(salary)>3000

结果如下

集合成员资格

in:测试元组是否是集合的成员
not in:测试元组是否不是集合的成员
in和 not in 操作符用于枚举集合。

select *
from instructor2
where name not in('ai','ye','er');

结果如下

例: 注意内层查询语句的select对应的属性应与外层查询语句的where对应的属相同。

select *
from instructor2
where name in (select name
from instructor2
where salary>3000
);

过程:相当于两层for循环

结果如下

集合的比较

>some:至少比某一个要大
>all:比所有的都大。
>some、<some、>=some、<script type="math/tex" id="MathJax-Element-47"><=</script>some、<script type="math/tex" id="MathJax-Element-48"><></script>some
all、<script type="math/tex" id="MathJax-Element-52"><</script>all、<script type="math/tex" id="MathJax-Element-53"><</script>all
=some等价于in,<>some并不等价于not in。
<script type="math/tex" id="MathJax-Element-56"><></script>all等价于not in,=all不等价于in。
例:查询工资大于3000的教师姓名

select *
from instructor2
where name =some(select name
from instructor2
where salary>3000
);

结果如下

例:查询工资小于等于3000的教师姓名

select *
from instructor2
where name <>all(select name
from instructor2
where salary>3000
);

错误查询实例
例:查询工资小于等于3000的教师姓名

select *
from instructor2
where name <>some(select name
from instructor2
where salary>3000
);

结果如下(分析:内层查询中只要有一条元组的salary>3000并且name和外层查询name值不相等即可)

例:查询工资大于3000的教师姓名

select *
from instructor2
where name =all(select name
from instructor2
where salary>3000
);

结果如下(分析:内层查询中满足salary>3000的所有元组的name都和外层查询name值相等才可以)

空关系测试(exists)

存在exists是相对于某一条元组,因而子查询中是select *。
例:查询在2009年秋季学期和2010年春季学期同时开课的所有课程

select course_id
from section as S
where semester='Fall' and year=2009 and exists(select *
from section as T
where semester='Spring' and year=2010
and S.course_id=T.course_id
);

删除某些元组
例:从instructor关系中删除与‘math’系教师有关的所有元组

delete from instructor
where dept_name='math';

删除所有元组
delete from instructor;
1删除的特殊情况

内层语句只有一条元组。
例:删除工资低于大学平均工资的教师记录。

delete from instructor2
where salary < (
select avg(salary)
from instructor2
);

select *
from instructor2;

结果如下

插入一些元组

insert into 关系名 values(⋯

);一次只能插入一条元组。
insert into 关系名 selec查询语句可一次性插入多条。

insert into instructor2
select id,name,dept_name,18000
from student
where dept_name='math';

更新元组
update 关系名
set 语句
where 条件;

例:只给工资低于7000元的教师涨工资。

update instructor2
set salary=salary*1.05;
where salary<7000;

例:给工资低的教师涨5%,大于7000的涨3%

update instructor2
set salary=case
when salary<=7000 then salary*1.05
else salary*1.03
end

 

参考:https://blog.csdn.net/liu450668867/article/details/80071201

https://blog.csdn.net/YEN_CSDN/article/details/51814912

https://blog.csdn.net/weixin_40087851/article/details/81978347

https://blog.csdn.net/qq_36982160/article/details/89258056

标签:salary,name,数据库,元组,原理,instructor2,select,结构
From: https://www.cnblogs.com/klb561/p/18060881

相关文章

  • 关于安卓连接自带的数据库方法
    安卓连接自带的SQLLite方法和搭建web网站连接数据库操作基本没有区别。唯一的区别就是在web网站的时候我们在数据库中创建表都是在可视化软件中进行的,而安卓开发则需要自己去写SQL语句去创建一个新的表。接下来就简单演示一下这个过程。第一步自然是新建一个安卓项目,这里不在进行......
  • UDP 协议端口检测原理和存在的问题说明
    一、UserDatagramProtocol(UDP)用户数据报协议(UDP):一种非常简单的传输协议,它提供类似于TCP的传输层寻址,但除此之外几乎没有其他功能。UDP只不过是一个“包装”协议,它为应用程序提供了一种访问互联网协议的方式。无法建立连接,传输不可靠,并且数据可能会丢失。二、UDP......
  • 新建数据库报错亦或者root 账号无法显示所有数据库
    NavicatPremium创建数据库报1044-Accessdeniedforuser'root'@'%'todatabase1查询权限SELECThost,user,Grant_priv,Super_privFROMmysql.user; 2、修改权限UPDATEmysql.userSETGrant_priv='Y',Super_priv='Y'WHEREUse......
  • React设计原理解密及核心源码解读
    一、React基础回顾1、react介绍React是一个用于构建用户界面的JavaScript库,它只负责应用的视图层,帮助开发人员构建快速且交互式的web应用程序。React使用组件的方式构建用户界面。2、JSX语法回顾在React中使用JSX语法描述用户界面,它是一种JavaScript语法扩展......
  • 从数据库中随机选取数据(基于golang,xorm)
    一、 从MySQL数据库中随机选取数据,可以使用SQL的 ORDERBYRAND() 语句来实现。具体步骤如下:定义一个结构体用于存储数据typeUserstruct{Idint64NamestringAgeint}建立与数据库的连接,并获取一个 Engine 实例engine,err:=xorm.NewE......
  • Unity3D 多线程定时器的原理与实现详解
    Unity3D提供了丰富的功能和工具,让开发者可以轻松地创建各种类型的游戏。其中,定时器是一个非常重要的功能,在游戏开发中经常会被使用到。Unity3D中并没有提供原生的多线程定时器功能,但我们可以通过一些技巧和方法来实现一个多线程定时器。对啦!这里有个游戏开发交流小组里面聚集了......
  • 随笔-perf off-cpu 原理
    off-cpu:view#testincentos7echo1|sudotee/proc/sys/kernel/sched_schedstatsperfrecord-esched:sched_stat_sleep-esched:sched_switch-esched:sched_process_exit-p$(cat/var/run/cs.pid)-g-operf.data.rawsleep10perfinject-v-s-iperf.......
  • 4-1张量的结构操作
    本篇我们介绍张量的结构操作。张量结构操作主要包括:张量创建、索引切片、维度变换、合并分割。1.创建张量张量创建的许多方法和numpy中创建array的方法很像。importnumpyasnpimporttorcha=torch.tensor([1,2,3],dtype=torch.float)print(a)"""tensor([1.,......
  • MyBatis Java 和 数据库 数据类型对应表
    类型处理器(typeHandlers)MyBatis在设置预处理语句(PreparedStatement)中的参数或从结果集中取出一个值时,都会用类型处理器将获取到的值以合适的方式转换成Java类型。下表描述了一些默认的类型处理器。提示 从3.4.5开始,MyBatis默认支持JSR-310(日期和时间API)。类型处......
  • 【学习笔记】 - 基础数据结构 :Link-Cut Tree(进阶篇)
    前言LCT没题写可以去写树剖和一些线段树合并的题练手LCT的概念原本的树剖是对树进行剖分,剖分为重边和轻边LCT则是对于树分为虚边和实边,特殊的,LCT可以没有虚边(例:银河英雄传说v2)单独被包含在一个实链里的点称作孤立点在树剖中,我们使用线段树/树状数组来维护重链在Link-Cut......