数据库系统(事务并发|封锁协议|数据库安全|商业智能|SQL语句)

举报
帅次 发表于 2024/11/20 14:58:01 2024/11/20
【摘要】 本文主要概述了数据库系统的事务并发控制、封锁协议、数据库安全、商业智能和SQL语句等重要内容。其中,详细介绍了事务并发处理、X封锁和S封锁、三级封锁协议、数据库备份与恢复、数据仓库与数据挖掘、以及SQL语句的各种操作等关键知识点。


一、事务并发

1.1 事务概述

        DBMS 运行的基本工作单位是事务,事务是用户定义的一个数据库操作序列,这些操作序列要么全做,要么全都不做,是一个不可分割的工作单位。事务具有的四个特性(ACID):

  • (操作)原子性(Atomicity):事务是数据库的逻辑工作单位,事务的所有操作在数据库中要么 全做,要么全都不做。

  • (数据)一致性(Consistency):事务的执行使数据库从一个一致性状态变成另一个一致性状态。

  • (执行)隔离性(Isolation):一个事务的执行不能被其他事务干扰。

  • (改变)持久性(Durability):指一个事务一旦提交,它对数据库的改变必须是永久的,即便系统出现故障时也是如此。

1.2 并发控制

        事务是并发控制的前提条件,并发控制就是控制不同的事务并发执行,提高系统效率,但是并发控制中存在下面三个问题:

  • 丢失更新:事务1对数据A进行了修改并写回,事务2也对A进行了修改并写回此时事务2写回的数据会覆盖事务1写回的数据,就丢失了事务1对A的更新。即对数据A的更新会被覆盖。

  • 不可重复读:事务2读A,而后事务1对数据A进行了修改并写回,此时若事务2再读A,发现数据不对。即一个事务重复读A两次,会发现数据A有误。

  • 读脏数据:事务1对数据A进行了修改后,事务2读数据A,而后事务1回滚,数据A恢复了原来的值,那么事务2对数据A做的事是无效的,读到了脏数据。

1.3 封锁

1.3.1 X 封锁和 S 封锁

        并发控制的主要技术是封锁,主要有两种类型的封锁,分别是 X 封锁 和 S 封锁。

  • 排他型封锁(X 封锁):如果事务 T 对数据 A(可以是数据项、记录、数据集以至整个数据库)实现了 X 封锁,那么只允许事务 T 读取和修改数据 A,其他事务要等事务 T 解除 X 封锁以后,才能对数据 A 实现任何类型的封锁。可见 X 封锁只允许一个事务独锁某个数据,具有排他性。

  • 共享型封锁(S 封锁):如果事务 T 对数据 A 实现了 S 封锁,那么允许事务 T 读取数据A,但不能修改数据 A,在所有 S 封锁解除之前决不允许任何事务对数据 A 实现 X 封锁。

1.3.2 三级封锁协议

  • 一级封锁协议:事务在修改数据R之前必须先对其加X锁,直到事务结束才释放。可解决丢失更新问题

  • 二级封锁协议:一级封锁协议的基础上加上事务T在读数据R之前必须先对其加S锁读完后即可释放S锁可解决丢失更新、读脏数据问题

  • 三级封锁协议:一级封锁协议加上事务T在读取数据R之前先对其加S锁,直到事务结束才释放可解决丢失更新、读脏数据、数据重复读问题

二、数据库安全

2.1 备份(转储)与恢复

  • 备份是指通过数据转储和监理日志文件的方法监理冗余数据,DBA定期地将整个数据库复制到磁带或另一个磁盘上保存起来的过程。这些备用的数据文本称为后备副本。

  • 恢复是指把数据库从错误状态恢复到某一个已知的正确状态的功能。当数据库遭到破坏后,就可以利用后备副本把数据库恢复,这时数据库只能恢复到备份时的状态,从那以后的所有更新事务必须重新运行才能恢复到故障时的状态。

2.2 备份分类

  • 静态转储:即冷备份,指在转储期间不允许对数据库进行任何存取、修改操作。
    • 优点是非常快速的备份方法、容易归档(直接物理复制操作)

    • 缺点是只能提供到某一时间点上的恢复,不能做其他工作,不能按表或按用户恢复。

  • 动态转储:即热备份,在转储期间允许对数据库进行存取、修改操作,因此转储和用户事务可并发执行。
    • 优点是可在表空间或数据库文件级备份,数据库扔可使用,可达到秒级恢复;

    • 缺点是不能出错,否则后果严重,若热备份不成功,所得结果几乎全部无效。

  • 完全备份(海量备份):备份所有数据。

  • 差量备份:仅备份上一次完全备份之后变化的数据。

  • 增量备份:备份上一次备份之后变化的数据。

2.3 数据库故障

        数据库的 4 类故障:事务故障、系统故障、介质故障、计算机病毒。

        事务故障的恢复有两个操作:撤销事务(UNDO)和 重做事务(REDO)。

        介质故障的恢复由数据库管理员装入数据库的副本和日记文件副本,再由系统执行撤销和重做操作。

        日志文件:在事务处理过程中,DBMS把事务开始、事务结束以及对数据库的插入、删除和修改的每一次操作写入日志文件。一旦发生故障,DBMS的恢复子系统利用日志文件撤销事务对数据库的改变,回退到事务的初始状态。

三、商业智能

        商业智能(Business Intelligence,BI)是企业对商业数据的搜集、管理和分析的系统过程,目的是使企业的各级决策者获得知识或洞察力,帮助他们作出对企业更有利的决策。一般认为数据仓库、联机分析处理(OLAP)和数据挖掘是商业智能的三大组成部分。

3.1 数据仓库

        数据仓库是一个面向主题的、集成的、非易失的、且随时间变化的数据集合,用于支持管理决策。数据仓库的关键特征是:面向主题、集成的、非易失的、时变的。

  • 面向主题:按照一定的主题域进行组织的。

  • 集成的:数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息

  • 相对稳定的:数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。

  • 反映历史变化:数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

传统数据库与数据仓库的比较:

传统数据库与数据仓库的比较  

3.2 数据仓库的结构-OLAP

数据仓库的结构通常包含四个层次,如上图所示:

  • 1.数据源:是数据仓库系统的基础,是整个系统的数据源泉。

  • 2.数据的存储与管理:是整个数据仓库系统的核心。

  • 3.0LAP(联机分析处理)服务器:对分析需要的数据进行有效集成,按多维模型组织,以便进行多角度、多层次的分析,并发现趋势

  • 4.前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。

OLTP 即联机事务处理,就是关系数据库的基础;OLAP即联机分析处理,是数据仓库的核心部分。

OLTP 与 OLAP 的区别 

OLTP 与 OLAP 的区别 

3.3 数据挖掘

        数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先知、有效和实用三个特征。先前未知的信息是指该信息是预先未曾预料到的,即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。

3.4 分布式数据库

        局部数据库位于不同的物理位置,使用一个全局DBMS将所有局部数据库联网管理,这就是分布式数据库。

  • 分片模式
    • 水平分片:将表中水平的记录分别存放在不同的地方。

    • 垂直分片:将表中垂直的列值分别存放在不同的地方。

  • 分布透明性
    • 分片透明性:用户或应用程序不需要知道逻辑上访问的表具体是如何分块存储的

    • 位置透明性:应用程序不关心数据存储物理位置的改变

    • 逻辑透明性:用户或应用程序无需知道局部使用的是哪种数据模型

    • 复制透明性:用户或应用程序不关心复制的数据从何而来

四、SQL语句

4.1 创建表(CREATE table)

//学生表创建
CREATE table student(
Sno CHAR(9) PRIMARY KEY,
Sname CHAR(20) UNIQUE,
Ssex char(2),
Sage SMALLINT,
Sdept char(20)
);
  • PRIMARY KEY,指定主键;

  • FOREIGN KEY,指定外键。

4.2 修改表(ALTER table)

//修改表名
alter table 表名 rename to 新的表名;

4.3 删除表(DROP table)

//删除表
drop table 表名;
//删除表时判断表是否存在,若存在则删除
drop table if exists 表名;

4.4 查询(select)

//查询表中所有数据
select * from 表名;

//查询users表中年龄在18~25岁之间的记录
//方式1 &&
select *from users where age>=18 && age<=25;
//方式2 and
select * from users where age>=18 and age<=25;
//方式3 between..and..
select *from users where age between 18 and 25;

4.5 分组查询(group by)****

-- 查询users表中的记录,按照性别分组
select gender from users group by gender;

4.6 模糊查询(like)

  • _ 单个任意字符

  • % 0个/多个任意字符

//查询users表中姓名第二个字为帅的记录
select * from users where name like '_帅%';
//查询users表中姓名含有帅字的记录
select * from users where name like '%帅%';

4.7 去除重复记录查询(distinct)

//查询users表中所在城市不相同的记录
-- select distinct 字段 from 表名;
//去掉 name 重复的部分
select distinct name from users;

4.8 排序查询(order by)

排序order by,默认为升序,降序要加关键字DESC。

//查询users表中记录,并以年龄升序排序
select * from users order by age asc;
select * from users where age > 18 order by id;
//查询users表中记录,并以年龄降序排序
select * from users order by age desc;

4.9 表-插入数据(insert into)

有多少个字段,就要写多少个值,且是一一对应的。

insert into 表名 values(值1,值2,值3...值n);

4.10 表-删除数据(delete/truncate)

//删除表中所有数据
delete from 表名;   
//删除表中指定的数据
delete from 表名 where 字段 = 值;  
//删除表中所有数据(先删除整张表,然后创建一张一样的空表,此方法更高效)
truncate table 表名;

drop table 表名; 是连表一起删除

4.11 表-修改数据(updata)

//无限制条件的修改,会修改整张表
update 表名 set 字段 = 值;
//有限制条件的修改,只修改特定记录
update 表名 set 字段 = 值 where 条件(字段 = 值);

4.12 聚合函数

计算和(sum)

  //将求和后输出的字段以sumvalue展示 
  //默认以sum(字段)展示 
  select sum(字段) as sumvalue from 表名;
  select sum(id) as ID,count(id) ID_count from users;

计算最大值(max)

  select max(字段) as maxvalue from 表名;
  select max(age) as maxvalue from 表名;

计算最小值(min)

  select min(字段) as minvalue from 表名;
  select min(age) as minvalue from 表名;

计算平均值(avg)

  select avg(字段) as avgvalue from 表名;

计算个数(count)

  select count(字段) as totalcount from 表名;


【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。