位置:首页 > 自考专业

网友整理的数据库及应用笔记(一)

  • 发布时间:2024-09-15 16:21:23
  • 来源:本站整理
  • 阅读:
导读:
数据库及其应用笔记    笔记还未全部整理完成,先贴1-5章内容。(第五章函数及内存变量、数组操作等命令下次贴)欢迎大家补充,更正!    第一章    人类社会活动的三大要素是能源、物质和信息。    信息是现实世界各种事物的存在特征、运动形式以及不同事物间的相互联系等诸要素在人脑中的抽象反映,
  数据库及其应用笔记

笔记还未全部整理完成,先贴1-5章内容。(第五章函数及内存变量、数组操作等命令下次贴)欢迎大家补充,更正!

第一章

人类社会活动的三大要素是能源、物质和信息。

信息是现实世界各种事物的存在特征、运动形式以及不同事物间的相互联系等诸要素在人脑中的抽象反映,进而形成概念。是一个抽象的概念。信息源于客观事物,而后通过人们加工处理再控制客观事物,从而达到认识世界,改造世界的目的。数据本质上是对信息的一种符号化表示,即用一定的符号表示信息。符号是由人为而定,在计算机中通常使用0和1这两个符号。信息和数据,既有区别,又有联系,数据是信息的载体,用来载荷信息,信息是数据的内涵,数据处理本质上就是信息处理。

从已知数据出发,参照相关数据,进行加工计算,产生出一些新的数据,这些新的数据又表示了新的信息,可以作为某种决策的依据,这一过程就是数据处理过程。数据处理的任务不是计算,而是管理数据。数据处理本质上就是信息处理。数据的收集、整理、组织、存储、查询、维护和传送等各种操作,是数据处理的基本环节,是任何数据处理任务必有的共性部分。

数据管理大体上可分为自由管理阶段、文件系统阶段和数据库系统阶段。

文件是操作系统管理数据的基本单位,文件可以命名,通过文件名以记录为单位存取数据,不必关心数据的存储位置。若干记录的集合称为文件。

描述事物性质的最小数据单位是数据项。记录是若干数据的集合,一个记录能表达一个具体事物。

在数据库系统阶段,数据库技术具有以下五个特点:数据结构化、数据共享、减少了数据冗余、有较高的数据独立性和提供了方便的用户接口。文件系统与数据库系统的最大区别是数据结构化。

数据库系统由数据库、支持数据库运行的软硬件、数据库管理系统和应用程序等部分组成。

DB是存储在磁盘等外部直接存取设备上的数据集合,是按一定的数据结构组织起来的,数据库是一个结构化的数据集合,主要是通过综合各个用户的文件,除去不必要的冗余,使之相互联系所形成的数据结构。(结构化的、有联系的数据集合)

数据库系统中的硬件是数据库赖以存在的物理设备,包括CPU、存储器和其他外部设备。

数据库系统中的软件是指数据库管理系统。-用于数据管理的软件系统

数据库管理系统简称DBMS,是是数据库系统的关键组成部分,是专门用于数据管理的软件。任何数据操作,包括数据库定义、数据查询、数据维护、数据库运行控制等都是在DBMS管理下进行的。DBMS是用户与数据库的接口,应用程序只有通过DBMS才能和数据库打交道。

DBA是指数据库管理员,其职责是维护和管理数据库,使之始终处于最佳状态。

UWA:用户工作区,是用户程序与系统缓冲区交换数据的场所。用户只能对UWA中的数据进行处理,其数据是DBMS根据用户的请求装进去的。

DD:数据字典,其中存放着数据库三级结构的描述以及各数据项的类型、值域和关键字等,从结构上对数据的语言和数值范围加以约束。

计算机系统中任何软件必须在操作系统的支持下才能工作。

1975年SPARC公布了数据库标准报告,提出了数据库三级组织结构,称SPARC分级结构,从内到外分三个层次描述,分别称为内模式、概念模式、外模式。

概念模式,简称模式,是对数据库的整体逻辑描述,并不涉及物理存储,故称为DBA视图。

内模式,又称存储模式,具体描述了数据是如何组织存储在存储介质上,是系统程序员用一定的文件形式组织起来的一个个存储文件和联系手段。故称内模式为系统程序员视图。只有内模式才是真正存储数据的。

外模式通常是模式的一个子集,又称子模式,外模式面向用户,是用户眼中的数据库,称外模式为用户视图。

数据库系统的三级结构中,总体观和存储观有一个,用户观有多个,一个应用对应一个用户观。三级结构的关系,可以概括为模式是内模式的逻辑表示,内模式是模式的物理实现,外模式是模式的部分抽取。

三个模式反映了对数据库的三种不同观点,模式表示了概念级数据库,体现了对数据库的总体观,内模式表示了物理级数据库,体现了对数据库的存储观,外模式表示了用户级数据库,体现了对数据库的用户观。

数据库三个模式之间存在两种映射,一是外模式/模式间的映射,另一映射是模式/内模式间的映射。

在数据库系统的组织结构中,模式/内模式映射把概念数据库与物理数据库联系起来,外模式/模式把用户数据库与概念数据库联系起来。

映射技术的好处:保证了数据的独立性、保证了数据共享、方便了用户使用数据库、有利于数据的安全和保密。

应用程序员和终端用户是数据库的用户。

DBMS通过DDL(数据描述语言)来定义三种模式,并将各种模式翻译成相应的目标代码。

DML数据操纵语言实现对数据库的操作,基本操作有:插入、修改、删除、检索。

DBMS有两种类型的程序设计语言:如FORTRAN、C等属于宿主(HL)型,FoxPro则属于自主(SCL)

型。

DBMS对数据库运行的控制主要是通过数据安全性控制、完整性控制、故障恢复和并发操作四个方面实现的。

关于信息和数据,下面的论述是正确的。D

(A)只有区别没有联系(B)信息是数据的载体(C)同一信息用同一数据表示形式(D)数据处理本质上就是信息处理

数据库是。B(A)单用户独享的(B)多用户共享的(C)多用户(D)单用户

下面关于数据库管理系统的论述,是正确的。B

(A)数据库管理系统是用户与应用程序的接口(B)应用程序只有通过数据库管理系统才能和数据库联系

(C)数据库管理系统用DML来定义三级模式(D)数据库管理系统用DDL来实现对数据库的各种操作

数据库系统提供了多种语言,下面不是其中的一种。(A)DDL(B)SCL(C)DML(D)HL

第二章

数据模型是对客观事物及其联系的描述,是记录及其联系的集合,应具有描述数据和数据联系两方面的功能,采用形式化的描述方法表达数据和数据之间的联系。数据模型表示的是数据库的框架,在该框架约束下填上具体数据才是数据库。数据库类型根据数据模型划分。数据的数据结构形式就是数据模型

为保证数据的完整性,数据模型对数据的描述应包括)模型中包含哪些记录类型,并对记录类型进行命名;指明各个记录类型由哪些数据项构成,并对数据项进行命名;每个数据项均需指明其数据类型和取值范围。

对数据间联系的描述要指明:各个不同记录类型间所存在的联系和联系方式。

公式DM{R,L}是对数据模型的描述,其中R代表记录类型的集合,L代表不同记录类型联系的集合。

公式的含义是表示了数据模型具有描述数据和数据联系两方面的功能,R是对数据的描述,L是对数据间联系的描述。

数据模型本质上是对“信息模型”的数据化表示,信息模型又称“实体联系模型”,是客观事物及其自然联系在人脑中所形成的概念。

信息来自于三个领域:现实世界、信息世界和数据世界。

在信息世界中,不论是实际存在的东西,还是概念性的东西,或是事物与事物之间的联系,一律统称为实体。不同实体是由其属性的不同而被区分的。实体和属性都有“型”和“值”之分。“型”是概念的内涵,而“值”是概念的实例。“型”表达的是个体的共性,而“值”是个体的具体内容。

“键”也称关键字,是指在实体属性中,可用于区分实体集中不同个体的那个或几个属性的组合。

当有多个属性可作为键而选定其中一个时,则称它为该实体的“主键”。若在实体诸属性中,某实体虽非该实体的主键,却是另一个实体的主键,则称此属性为“外部键”。实体中每个属性,都有一个取值范围,这叫做属性的“域”。

实体间的联系分别是一对一联系(1:1),一对多联系(1:n),多对多联系(m:n)。

E-R方法,又称为实体联系表示法。

E-R图中所表示的实体及其联系,实际上是信息模型。E-R图的三大要素:属性、实体、联系。

目前,成熟地应用于数据库系统中的数据模型有层次模型、网状模型和关系模型。

层次模型用树结构表示记录类型及其联系。结构特点:有且仅有一个结点无父结点,其他结点有且仅有一个父结点。在层次模型中,上一层记录型和下一层记录型之间的联系为1:n.不能直接支持m:n联系。对于记录之间的m:n关系,可以将其转换为1:n联系。

网状模型的结构是结点的连通图,特点是:有一个以上结点无父结点且至少有一个结点有多于一个父结点。典型代表是DBTG系统。

目前,在微机上的数据库系统应用最广泛的数据模型是关系模型。关系模型的本质是一张二维表,关系模型中,一张二维表就称为一个关系。如果二维表中的数据有变化,则它的记录数改变,它的字段数相对固定。

在文件系统中,一张二维表称为一个文件,表头行称为记录型,表中其他各行称为记录,而每一列中的各元素称为一个数据项。通常在数据库中,二维表以文件的形式存储在磁盘上,一个关系就是一个文件(一张二维表)。

从E-R图导出关系模型的时候,图中的每一个实体,都应转换为关系,其中应包括对应实体的全部属性,并应根据关系所表达的语义确定哪个属性(或哪几个属性组合)作为主键。

E-R图:方框表示实体,椭圆表示实体的属性,菱形表示联系。

信息世界用语:实体集、实体、属性、实体键,在数据世界中对应:文件、记录、数据项(字段)、记录键。

以下关于数据模型的描述,A不正确。

(A)数据模型表示的是数据库本身(B)数据模型表示的是数据库的框架

(C)数据模型是客观事物及其联系的描述(D)数据模型能够以一定的结构形式表示出各种不同数据之间的联系

下列关于实体的说法,不正确。B

(A)实体是指现实世界中存在的一切事物(B)实体靠联系来描述

(C)实体所具有的性质统称为属性(D)实体和属性是信息世界表达概念的两个不同单位

实体集中,各实体值相应的属性有着B的域。(A)不同(B)相同(C)各自(D)固定

综合:画E-R图,写出关系模型

第三章

域是值的集合,域中数据个数叫做域的基数。

R(D1,D2,…Dn)的含义是:当且仅当R是D1×D2×…×Dn的一个子集,则称R是D1×D2×…×Dn上的一个关系。其中,R是关系名,n是关系的度,Di是第i个域名。在关系的定义中,n度的关系,必有n个域。

一个关系就是一张二维表,表中的每一行对应关系中的一个元组,它对应于信息世界中的实体和计算机世界中的记录,表中的每一列就是关系中的一个域。也称为属性,对应于计算机世界中的字段。

关系与文件有许多相似之处,把关系看成文件时,则元组就是文件中的记录,属性就是记录中的数据项(字段)。

不允许“表中套表”,即表中元组分量必须是原子的。

二维表中的各列取自同一个域,因此一列中的各个分量具有相同性质。

列的次序、行的次序可以任意交换,不改变关系的实际意义。

表中的行叫元组,代表一个实体,因此表中不允许出现相同的两行。

判断两个关系是否相等,与属性的次序无关,与元组的次序无关,与关系的命名无关。

关系模式是指用关系数据描述语言描述后的关系,必须逐个对关系模型中的关系进行描述才能生成数据库概念模式。对关系的描述实为定义关系模式。关系数据描述语言实质是定义关系框架的,包括对域和关系进行描述

常用的关系数据描述语言(DDL)有问答式和语言描述式,常用的FoxPro属于问答式DBMS.

语言描述式有专门描述语言定义关系模式,包括关系名、组成该关系的各个域名、数据类型、长度和取值范围

域描述语句:DOMAIN 域名 PIC IS 类型(长度) [RANGE IS 数1 THRU 数2 ],通过DOMAIN定义域名、PIC定义数据类型和长度,RANGE定义取值范围。

关系描述语句:RELATION 关系名 ( 域名1,域名2,… )KEY=( 域名i,域名j,… )

关系模式的三类完整性规则是:实体完整性约束规则、引用完整性约束规则、用户定义的完整性约束规则。

实体完整性约束是指关系中的“主键”不允许取空值。引用完整性约束规则是限制引用不存在的记录。

在关系的各种操作中,关系查询是核心,所以关系数据操纵语言DML语言,常被称为查询语言。

DML特点:操作对象与结果都是关系,非过程性强,语言一体化,有严密的数学工具。

关系数据操作的最大特点是:以关系为处理单位,处理后的结果是关系。

关系DML查询,根据表达查询方式的不同,可分为两类:用关系代数运算表达查询和用关系演算公式表达查询。关系数据操作语言相应分为两种不同类型:关系代数型和关系演算型。

所谓单目运算就是对一个关系施加的运算,所谓双目运算就是对两个关系施加的运算。选择、投影是单目运算,连接、关系笛卡儿积是双目运算。

集合运算符:∪并、∩交、-差、×迪卡尔积,关系运算符:π投影、σ选择、|×|连接

比较运算符: 、≥、 、≤、=、≠,逻辑运算符:-非、∧与、∨或

并、交、差用于关系运算,要求参加运算的两个关系是相容的,即两个关系度数相同,相应属性取自同一个域。

并:由属于R或属于S或同时属于R和S的元组构成的集合,记为R∪S.

差:由属于R而不属于S的所有元组组成的集合,记为R-S.

交:由同时属于R和S的元组组成的集合,记为R∩S.

选择:按给定条件从关系中挑选满足条件的元组组成的集合,记为σF(R)

投影:从关系中挑选出指定的属性组成的新关系,记为:πA(R)A是属性名表,R是关系名。

关系R和S的笛卡儿积,它是由R的第一个元组依次与S的所有元组组合,然后是R的第二个元组,直到最后一个元组依次与S所有元组组合,形成新的关系。记为:R×S关系R和S的笛卡儿积k1+k2个元组。

连接:按给定条件,把满足条件的两关系的所有元组,按一切可能拼接后形成的新关系,相当于在两关系笛卡儿积上的选择。记为:R|×|S=σF(R×S)关系R和S的连接后的关系有≤k1×k2个元组。

连接运算可以从乘积运算和选择运算中导出,自然连接运算可以从乘积运算、选择运算和投影运算中导出。

自然连接是连接的一个重要特例,它要求被连接的两关系有若干相同的属性名。记为:R|×|S

连接运算:JOIN 关系1 WITH 关系2 WHERE 条件 ,按给定条件对两关系进行连接运算。

五种基本运算:并、差、选择、投影、连接。

在关系中,当有多个属性可作为键而选定其中一个时,则称它为该关系的主键。

在一个关系中,需要几个属性组合起来才能惟一标识元组时,则称这几个属性为该关系的联合键。

凡在关系中可以用来惟一标识元组的属性或属性组叫做候选键。

当关系中的某个属性或某一组属性并非主键,但却是另一个关系的主键时,称该属性为外部键。

凡可作为侯选键的属性叫主属性,不能作为侯选键的属性叫非主属性。

所谓函数依赖其实质是刻画关系中各个属性之间相互制约而又相互依赖的关系。

函数依赖包括:完全函数依赖、部分函数依赖、传递函数依赖

满足最低要求的关系称它属于第一范式,在此基础上又满足了某种条件,则称它属于第二范式的关系,依此类推直到第五范式。数据库一般使用3NF以上的关系。满足较高条件者必满足较低范式条件。

一个较低范式的关系,可以通过关系的无损分解转换为若干较高级范式关系的集合,这个过程叫做关系规范化

如果关系R的所有属性都是不可再分的数据项,称该关系属于第一范式。1NF

第一范式缺点:数据冗余大、修改麻烦、插入异常、删除异常。

若关系R属于1NF,且它的每一非主属性都完全依赖于主键,则称R属于第二范式,2NF

若关系R属于2NF,且它的每一非主属性都不传递依赖于关键字,则称R属于第三范式,3NF

在关系规范化中,分解关系的两条基本原则是:分解必须是无损的和分解后的关系要相互独立。

关系规范化过程实质是对关系不断分解的过程,通过分解使关系逐步达到较高范式。规范化是围绕函数依赖进行的。在规范化过程中,消除部分依赖和传递依赖后,1NF变成3NF.1NF、2NF、3NF相互间是全包含关系。

以下说法正确的是。A

(A)一个关系就是一张二维表(B)在关系所对应的二维表中,行对应属性,列对应元组

(C)笛卡儿积中不允许有相同的域(D)关系的各属性名必须与对应的域同名

根据关系模式的完整性规则,一个关系中的“主键”。C

(A)不能有两个(B)不能成为另一个关系的外部键(C)不允许为空(D)可以取空值

关系中的最高范式为。D(A)2NF(B)3NF(C)4NF(D)5NF

综合:1、计算并、差、交、选择、投影、关系笛卡尔积、连接、自然连接。2、范式关系规范化

3、写出关键字4、确定范式等级

相关阅读