热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据库知识点总结-mysql教程

一、相关概念和知识点1.数据依赖:反映一个关系内部属性与属性之间的约束关系,是现实世界属性间相互联系的抽象,属于数据内在的性质和语义的体现。2.规范化理论:是用来设计良好的关系模式的基本理论。它通过分解关系模式来消除其中不合适的数据依赖

一、相关概念和知识点 1. 数据依赖 :反映一个关系内部属性与属性之间的约束关系,是现实世界属性间相互联系的抽象,属于数据内在的性质和语义的体现。 2. 规范化理论 :是用来设计良好的关系模式的基本理论。它通过分解关系模式来消除其中不合适的数据依赖

一、相关概念和知识点

1. 数据依赖:反映一个关系内部属性与属性之间的约束关系,是现实世界属性间相互联系的抽象,属于数据内在的性质和语义的体现。
2. 规范化理论:是用来设计良好的关系模式的基本理论。它通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。
3. 函数依赖:简单地说,对于关系模式的两个属性子集X和Y,若X的任一取值能唯一确定Y的值,则称Y函数依赖于X,记作XY。
4. 非平凡函数依赖:对于关系模式的两个属性子集X和Y,如果X→Y,但Y!?X,则称X→Y为非平凡函数依赖;如果X→Y,但Y?X,则称X→Y为非平凡函数依赖。
5. 完全函数依赖:对于关系模式的两个属性子集X和Y,如果X→Y,并且对于X的任何一个真子集X',都没有X'→Y,则称Y对X完全函数依赖。
6. 范式:指符合某一种级别的关系模式的集合。在设计关系数据库时,根据满足依赖关系要求的不同定义为不同的范式。
7. 规范化:指将一个低一级范式的关系模式,通过模式分解转换为若干个高一级范式的关系模式的集合的过程。
8. 1NF:若关系模式的所有属性都是不可分的基本数据项,则该关系模式属于1NF。
9. 2NF:1NF关系模式如果同时满足每一个非主属性完全函数依赖于码,则该关系模式属于2NF。
10. 3NF:若关系模式的每一个非主属性既不部分依赖于码也不传递依赖于码,则该关系模式属于3NF。
11. BCNF:若一个关系模式的每一个决定因素都包含码,则该关系模式属于BCNF。
12. 数据库设计:是指对于一个给定的应用环境,构造优化的数据库逻辑模式和物理结构,并据此建立数据库及其应用系统,使之能够有效地存储和管理数据,满足各种用户的应用需求,包括信息管理要求和数据操作要求。
13. 数据库设计的6个基本步骤:需求分析,概念结构设计,逻辑结构设计,物理结构设计,数据库实施,数据库运行和维护
14. 概念结构设计:指将需求分析得到的用户需求抽象为信息结构即概念模型的过程。也就是通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。
15. 逻辑结构设计:将概念结构模型(基本E-R图)转换为某个DBMS产品所支持的数据模型相符合的逻辑结构,并对其进行优化。
16. 物理结构设计:指为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程。包括设计数据库的存储结构与存取方法。
17. 抽象:指对实际的人、物、事和概念进行人为处理,抽取所关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。

18. 数据库设计必须遵循结构设计和行为设计相结合的原则。

19. 数据字典主要包括数据项、数据结构、数据流、数据存储和处理过程五个部分。
20. 三种常用抽象方法是分类、聚集和概括
21. 局部 E-R 图之间的冲突主要表现在属性冲突、命名冲突和结构冲突三个方面。

22. 数据库常用的存取方法包括索引方法、聚簇方法和 HASH 方法三种。
23. 确定数据存放位置和存储结构需要考虑的因素主要有: 存取时间、 存储空间利用率和维护代价等。

二、细说数据库三范式

2.1 第一范式(1NF)无重复的列

第一范式(1NF)中数据库表的每一列都是不可分割的基本数据项
同一列中不能有多个值
即实体中的某个属性不能有多个值或者不能有重复的属性。
简而言之,第一范式就是无重复的列。

在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。

2.2 第二范式(2NF)属性完全依赖于主键[消除部分子函数依赖]

满足第二范式(2NF)必须先满足第一范式(1NF)。

第二范式(2NF)要求数据库表中的每个实例或行必须可以被惟一地区分。

为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。
第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。简而言之,第二范式就是属性完全依赖于主键。
2.3 第三范式(3NF)属性不依赖于其它非主属性[消除传递依赖]

满足第三范式(3NF)必须先满足第二范式(2NF)。

简而言之,第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。

例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。那么在的员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。简而言之,第三范式就是属性不依赖于其它非主属性。

2.4 具体实例剖析

下面列举一个学校的学生系统的实例,以示几个范式的应用。

在设计数据库表结构之前,我们先确定一下要设计的内容包括那些。学号、学生姓名、年龄、性别、课程、课程学分、系别、学科成绩,系办地址、系办电话等信息。为了简单我们暂时只考虑这些字段信息。我们对于这些信息,说关心的问题有如下几个方面。

1)学生有那些基本信息
2)学生选了那些课,成绩是什么
3)每个课的学分是多少
4)学生属于那个系,系的基本信息是什么。

首先第一范式(1NF):数据库表中的字段都是单一属性的,不可再分。这个单一属性由基本类型构成,包括整型、实数、字符型、逻辑型、日期型等。在当前的任何关系数据库管理系统(DBMS)中,不允许你把数据库表的一列再分成二列或多列,因此做出的都是符合第一范式的数据库。

我们再考虑第二范式,把所有这些信息放到一个表中(学号,学生姓名、年龄、性别、课程、课程学分、系别、学科成绩,系办地址、系办电话)下面存在如下的依赖关系。
1)(学号)→ (姓名, 年龄,性别,系别,系办地址、系办电话)
2) (课程名称) → (学分)
3)(学号,课程)→ (学科成绩)

根据依赖关系我们可以把选课关系表SelectCourse改为如下三个表:

学生:Student(学号,姓名, 年龄,性别,系别,系办地址、系办电话);
课程:Course(课程名称, 学分);
选课关系:SelectCourse(学号, 课程名称, 成绩)。

事实上,对照第二范式的要求,这就是满足第二范式的数据库表,若不满足第二范式,会产生如下问题
数据冗余: 同一门课程由n个学生选修,"学分"就重复n-1次;同一个学生选修了m门课程,姓名和年龄就重复了m-1次。

更新异常: 1)若调整了某门课程的学分,数据表中所有行的"学分"值都要更新,否则会出现同一门课程学分不同的情况。
2)假设要开设一门新的课程,暂时还没有人选修。这样,由于还没有"学号"关键字,课程名称和学分也无法记录入数据库。

删除异常 : 假设一批学生已经完成课程的选修,这些选修记录就应该从数据库表中删除。但是,与此同时,课程名称和学分信息也被删除了。很显然,这也会导致插入异常。

我们再考虑如何将其改成满足第三范式的数据库表,接着看上面的学生表Student(学号,姓名, 年龄,性别,系别,系办地址、系办电话),关键字为单一关键字"学号",因为存在如下决定关系:

(学号)→ (姓名, 年龄,性别,系别,系办地址、系办电话)
但是还存在下面的决定关系
(学号) → (所在学院)→(学院地点, 学院电话)
即存在非关键字段"学院地点"、"学院电话"对关键字段"学号"的传递函数依赖。
它也会存在数据冗余、更新异常、插入异常和删除异常的情况(这里就不具体分析了,参照第二范式中的分析)。根据第三范式把学生关系表分为如下两个表就可以满足第三范式了:

学生:(学号, 姓名, 年龄, 性别,系别);
系别:(系别, 系办地址、系办电话)。


照例,在对数据库基本知识(尤其是SQL语句和范式)的归纳总结之后,来一份小测试题。题目的难度大致和大学数据库原理与应用课程期末考试相当,大家看看,通过题目再次熟悉熟悉知识。

关系数据库规范化是为解决关系数据库中( A )问题而引入的。

A. 插入异常、删除异常和数据冗余 B. 提高查询速度

C. 减少数据操作的复杂性 D. 保证数据的安全性和完整性

在数据管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。在这几个阶段中,数据独立性最高的是 A 阶段。

A.数据库系统 B.文件系统 C.人工管理 D.数据项管理


数据库(DB)、数据库系统(DBS)和数据库管理系统(DBMS)三者之间的关系是( C )。

A.DBMS包括DB和DBS B.DB包括DBS和DBMS

C.DBS包括DB和DBMS D.DBS就是DB,也就是DBMS


数据库管理系统能实现对数据库中数据表、索引等对象的定义、修改、删除,这类语言称为( A )。

A.数据定义语言(DDL) B.数据操纵语言(DML)

C.数据查询语言(DQL) D.数据控制语言(DCL)


同一个关系模型的任意两个元组值( A )。

A. 不能全同 B. 可全同 C. 必须全同 D. 以上都不是


概念模型是( B )

A、用于信息世界的建模,与具体的 DBMS 有关

B、用于信息世界的建模,与具体的 DBMS 无关

C、用于现实的建模,与具体的 DBMS 有关

D、用于现实的建模,与具体的 DBMS 无关


物理数据独立性是指( D )。

A. 模式改变,外模式和应用程序不变 B. 模式改变,内模式不变

C. 内模式改变,模式不变 D. 内模式改变,外模式和应用程序不变


SQL语言是( C )语言。

A.层次数据库 B.网络数据库 C.关系数据库 D.非数据库


自然连接是构成新关系的有效方法。一般情况下,当对关系R和S使用自然连接时,要求R和S含有一个或多个共有的( D )。

A. 元组 B. 行 C. 记录 D. 属性


关系运算中花费时间可能最长的运算是( C )。

A. 投影 B. 选择 C. 笛卡尔积 D. 除


文件系统与数据库系统的最大区别是( C )。

A. 数据共享 B. 数据独立 C. 数据结构化 D. 数据冗余


用于事务回滚的SQL语句是( D )

A、CREATE TABLE B、COMMIT

C、GRANT和REVOKE D、ROLLBACK


( C )用来记录对数据库中数据进行的每一次更新操作。

A.数据库文件 B.缓冲区 C.日志文件 D.后援副本


并发操作会带来哪些数据不一致性( D )。

A.丢失修改、不可重复读、读脏数据、死锁

B.不可重复读、读脏数据、死锁

C.丢失修改、读脏数据、死锁

D.丢失修改、不可重复读、读脏数据


为提高效率,关系数据库系统必须进行( B )处理。

A、定义视图 B、查询优化

C、建立索引 D、数据规范化到最高范式


对数据库物理存储方式的描述称为( B )

A.外模式 B.内模式

C.概念模式 D.逻辑模式


在数据库三级模式间引入二级映象的主要作用是(  A  )

A.提高数据与程序的独立性 B.提高数据与程序的安全性

C.保持数据与程序的一致性 D.提高数据与程序的可移植性


视图是一个“虚表”,视图的构造基于( C )

A.基本表 B.视图

C.基本表或视图 D.数据字典


关系代数中的π运算符对应SELECT语句中的以下哪个子句?(  A )

A.SELECT B.FROM

C.WHERE D.GROUP BY


将E-R模型转换成关系模型,属于数据库的( C )。

A. 需求分析 B. 概念设计

C. 逻辑设计 D. 物理设计


事务日志的用途是( C )

A. 事务处理 B. 完整性约束

C. 数据恢复 D. 安全性控制

如果事务T已在数据R上加了X锁,则其他事务在数据R上( D )

A. 只可加X锁 B. 只可加S锁

C. 可加S锁或X锁 D. 不能加任何锁


说明视图与基本表的区别和联系

视图是从一个或几个基本表导出的表,它与基本表不同,它是一个虚表,数据库中只存放视图的定义,而不存放视图对应的数据,这些数据存放在原来的基本表中,当基本表中的数据发生变化,从视图中查询出的数据也就随之改变。视图一经定义就可以像基本表一样被查询、删除,也可以在一个视图之上再定义新的视图,但是对视图的更新操作有限制。


简述事务的特性

事务具有四个特性,即ACID特性:

(1)原子性:事务中包括的所有操作要么都做,要么都不做。

(2)一致性:事务必须使数据库从一个一致性状态变到另一个一致性状态。

(3)隔离性:一个事务内部的操作及使用的数据对并发的其他事务是隔离的。

(4)持续性:事务一旦提交,对数据库的改变是永久的。


试述关系模型的参照完整性规则

参照完整性规则:

若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:取空值(F的每个属性值均为空值)或者等于S中某个元组的主键值。


现有关系数据库如下:

学生(学号,姓名,性别,专业)

课程(课程号,课程名,学分)

学习(学号,课程号,分数)

下述有5个小问题,请分别用关系代数表达式和SQL语句来实现其要求。

1. 检索所有选修了课程号为“C112”的课程的学生的学号和分数;

2. 检索“英语”专业学生所学课程的信息,包括学号、姓名、课程名和分数;

3. 检索“数据库原理”课程成绩高于90分的所有学生的学号、姓名、专业和分数;

4. 检索没学课程号为“C135”课程的学生信息,包括学号,姓名和专业;

5. 检索至少学过课程号为“C135”和“C219”的课程的学生的信息,包括学号、姓名和专业。


设有一教学管理数据库,其属性为:学号(S#),课程号(C#),成绩(G),任课教师(TN),教师所在的系(D)。这些数据有下列语义:

1.一个学生所修的每门课程都有一个成绩;

2.每门课程只有一位任课教师,但每位教师可以有多门课程;

3.教师中没有重名,每个教师只属于一个系。

(1).试根据上述语义确定函数依赖集。

(2).如果用上面所有属性组成一个关系模式,那么该关系模式为何模式?并举例说明在进行增、删操作时的异常现象。

(3).将其分解为具有依赖保持的3NF。

解:

(1).F={(S#,C#)→G,C#→TN,TN→D}

(2).关系模式为1NF。

∵该关系模式的候选关键字为(S#,C#)

则非主属性有G、TN和G。

又∵F中有C#→TN

∴存在非主属性TN对候选关键字(S#,C#)的部分依赖

即:(S#,C#)—--→TN。

异常现象:

§ 若新增设一门课程而暂时还没有学生选修时,则因缺少关键字S#值而不能进行插入操作。

§ 若某个教师调离学校要删除其有关信息时,会将不该删除的课程(C#)信息删除。

(3). ∵F=F′={(S#,C#)→G,C#→TN,TN→D}

∴ρ={R1,R2,R3}

其中:R1=(S#,C#,G)

R2=(C#,TN)

R3=(TN,D)

推荐阅读
  • Java String与StringBuffer的区别及其应用场景
    本文主要介绍了Java中String和StringBuffer的区别,String是不可变的,而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象,内存使用上要优于String类。因此,在需要频繁对字符串进行修改的情况下,使用StringBuffer更加适合。同时,文章还介绍了String和StringBuffer的应用场景。 ... [详细]
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
  • MyBatis错题分析解析及注意事项
    本文对MyBatis的错题进行了分析和解析,同时介绍了使用MyBatis时需要注意的一些事项,如resultMap的使用、SqlSession和SqlSessionFactory的获取方式、动态SQL中的else元素和when元素的使用、resource属性和url属性的配置方式、typeAliases的使用方法等。同时还指出了在属性名与查询字段名不一致时需要使用resultMap进行结果映射,而不能使用resultType。 ... [详细]
  • 本文内容为asp.net微信公众平台开发的目录汇总,包括数据库设计、多层架构框架搭建和入口实现、微信消息封装及反射赋值、关注事件、用户记录、回复文本消息、图文消息、服务搭建(接入)、自定义菜单等。同时提供了示例代码和相关的后台管理功能。内容涵盖了多个方面,适合综合运用。 ... [详细]
  • 本文介绍了如何使用Power Design(PD)和SQL Server进行数据库反向工程的方法。通过创建数据源、选择要反向工程的数据表,PD可以生成物理模型,进而生成所需的概念模型。该方法适用于SQL Server数据库,对于其他数据库是否适用尚不确定。详细步骤和操作说明可参考本文内容。 ... [详细]
  • 本文分享了一个关于在C#中使用异步代码的问题,作者在控制台中运行时代码正常工作,但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机,但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]
  • 本文是一位90后程序员分享的职业发展经验,从年薪3w到30w的薪资增长过程。文章回顾了自己的青春时光,包括与朋友一起玩DOTA的回忆,并附上了一段纪念DOTA青春的视频链接。作者还提到了一些与程序员相关的名词和团队,如Pis、蛛丝马迹、B神、LGD、EHOME等。通过分享自己的经验,作者希望能够给其他程序员提供一些职业发展的思路和启示。 ... [详细]
  • 本文介绍了C#中生成随机数的三种方法,并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法,但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数,进一步突显了这个问题。文章指出,随机数生成在任何编程语言中都是必备的功能,但Random类生成的随机数并不可靠。最后,提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]
  • Python如何调用类里面的方法
    本文介绍了在Python中调用同一个类中的方法需要加上self参数,并且规范写法要求每个函数的第一个参数都为self。同时还介绍了如何调用另一个类中的方法。详细内容请阅读剩余部分。 ... [详细]
  • 测绘程序设计Excel度分秒转换模板附代码超实用版
    本文介绍了测绘程序设计Excel度分秒转换模板附代码超实用版的相关知识,包括准备工作、编写表达式和注意事项。在实际工作中,将GPS实测的经纬度度转换为度分秒是常见需求,本文提供了在Excel中快速进行转换的方法,以提高工作效率。 ... [详细]
  • 阿,里,云,物,联网,net,core,客户端,czgl,aliiotclient, ... [详细]
  • 本文介绍了C#中数据集DataSet对象的使用及相关方法详解,包括DataSet对象的概述、与数据关系对象的互联、Rows集合和Columns集合的组成,以及DataSet对象常用的方法之一——Merge方法的使用。通过本文的阅读,读者可以了解到DataSet对象在C#中的重要性和使用方法。 ... [详细]
  • 如何修改路由器密码?路由器登录密码和无线密码的修改方法
    本文介绍了修改路由器密码的两种方法:一是修改路由器登录口令,需要进入路由器后台进行操作;二是修改无线连接密码,通过进入路由器后台的无线设置和无线安全设置进行修改。详细步骤包括复位处理、登录路由器后台、选择系统工具、填入用户名和用户密码、保存修改等。 ... [详细]
  • 本文介绍了2019年上半年内蒙古计算机软考考试的报名通知和考试时间。考试报名时间为3月1日至3月23日,考试时间为2019年5月25日。考试分为高级、中级和初级三个级别,涵盖了多个专业资格。报名采取网上报名和网上缴费的方式进行,报考人员可登录内蒙古人事考试信息网进行报名。详细内容请点击查看。 ... [详细]
  • Tomcat/Jetty为何选择扩展线程池而不是使用JDK原生线程池?
    本文探讨了Tomcat和Jetty选择扩展线程池而不是使用JDK原生线程池的原因。通过比较IO密集型任务和CPU密集型任务的特点,解释了为何Tomcat和Jetty需要扩展线程池来提高并发度和任务处理速度。同时,介绍了JDK原生线程池的工作流程。 ... [详细]
author-avatar
帅帅考拉_955
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有