1.1 数据处理的目的
1) 把数据转换成便于观察分析、传送或进一步处理的形式;
2) 把数据加工成对正确决策有用的数据;
3) 把数据编辑后存储起来,供以后取用。
1.2 数据处理的基本内容
数据收集、数据转换、数据的筛选分组和排序、数据的组织、数据的运算、数据存储、数据检索、数据的输出。
2. 数据组织的概念(简单应用)
2.1 数据结构的两种形式
外存结构、内存结构
2.2 数据组织的四个层次
数据项、记录、文件、数据库
2.3 数据项、记录、鉴别键、文件、数据库等概念
数据项:是描述一个数据处理对象的某些属性的。与字段的概念相对应。
记录:是与一个公共标志有关的数据项的集合。
主键:是用来唯一地标志一个记录的标示符。
鉴别键:主键与副键的统称,其功能是用来鉴别和搜索记录。
文件:为了某一特定的目的而形成的相关记录的集合。(如:输入文件、报告文件)
数据库:是数据组织层次中目前已达到的最高级别。
2.4 数据外存储介质的构造
磁带:是一条涂有磁性材料的塑料带,上面有多条平行的磁道,上面每个磁点代表一个二进位。
磁盘:柱面×磁道×扇区
3. 数据的物理组织和逻辑组织(简单应用)
3.1 逻辑记录和物理记录的概念和它们的区别
逻辑记录:是数据在用户或应用程序员面前呈现的方式,即用户对数据的标示方式。
物理记录:是与逻辑记录怎样具体地存储到外存上有关的。
3.2 数据物理组织的两种基本形式及其特点
1) 顺序的数据组织
2) 直接的数据组织
3.3 数据逻辑组织的概念
数据的逻辑组织:指的是对相关记录进行逻辑上的编排。
三种结构形式:链表、树、网络
3.4 按需要用指针在图纸上将记录联结成链表
(需要理解P24)
3.5 用图形表示树和网状组织两种数据的逻辑组织
(需要理解P25)
4. 文件组织(简单应用)
4.1 文件组织、文件系统的概念和文件系统的功能
文件组织:是数据组织的一部分,主要指数据记录在外设备上的组织。
文件系统:指计算机操作系统中的文件管理系统,实质上是一个管理和存取文件的软件系统,它由文件和管理文件的程序组成。
文件系统功能:它能定义需要的文件组织方式,并提供建立和存取数据的环境。
4.2 记录存入存储器的物理顺序和逻辑顺序的区别
两者并不一定完全一致,排好序的顺序文件是物理顺序和逻辑顺序一致的文件。
4.3 各种文件组织方式的特征
1) 顺序文件:存储在顺序存储器上时,只能按顺序扫描法存取;存储在随机存取存储器上时,还可以按分块查找法或折半查找法进行存取。
2) 索引文件:分为索引区和数据区,索引表的索引项按顺序排列,数据文件本身可以按顺序或不按顺序排列。
3) 直接存取文件
①直接地址法:存取机构动作简单,使用方便,不会产生重号;不易记忆。
②相对键法:搜索时间短,处理速度快;若有空号,造成空间浪费;需要占用一个连续的地址块,空间利用率低。
公式: (100为假设的记录长度,400为假设的文件存储起点地址)
③杂凑法公式:存取速度快,节约存储空间;不易找到一个良好的算法,有时碰撞现象发生过多时,会加长存取时间。
存储单元数: (N记录总数,n单位存储记录数)
质数除法公式: (K需要转变的键号,P接近存储单元的质数,INT表示取整)
4.4 在顺序存取存储器和随机存取存储器上顺序文件可以采用的查找方法
(见4.3)
4.5 索引文件的特点以及查找、删除、和插入操作过程
(见4.3)
4.6 实现直接存取文件组织的三种方法的原理
(见4.3)
4.7 杂凑函数的一种算法——质数除余数
(见4.3)
4.8 用溢流表法解决存储单元分配中碰撞现象的原理
(需要理解P30)
4.9 使用杂凑法的步骤,知道杂凑法的优缺点
1) 确定记录总数N;
2) 确定每一存储单元可以存放的记录数n;
3) 按公式计算应准备的单元数: ;
4) 找出一个杂凑函数。
5. 数据处理技术(简单应用)
5.1 数据库的概念
数据库系统:是由计算机系统、数据库管理系统和有关人员造成的具有高度组织的总体。
5.2 数据库的主要特征
1) 最小的数据重复性
2) 数据存储的一致性
3) 数据的独立性
4) 数据的安全性
5.3 数据库与数据文件的主要区别
数据库包含了若干个文件,通过联结路径实现记录之间的联系;
数据库能反映显示世界中信息间联系及含义;
文件只包含数据本身,而数据库则包含了基本数据和关于数据的数据,如反映联系的、反映语义的,为了管理控制而附加的各种数据。
5.4 数据模型的三种类型
层次数据模型、网状数据模型、关系数据模型
5.5 数据库管理系统的概念和功能
数据库管理系统:是由实现数据库管理功能的许多系统程序组成的集合。
功能:①定义数据库、②管理数据库、③维护数据库、④数据通讯功能、实现数据的传送。
5.6 目前常用的几种数据库管理系统
1) Oracle数据库
2) FoxPro(笔者注:老掉牙的东西,不学还不行,晕。换成DB2、SQl Server或者Sybase等还差不多)
5.7 用SQL语言查询数据用的语句
(略,考过《数据库原理》的应该是没有问题的。)
6. 数据处理技术(领会)
6.1 定义数据文件的结构
6.2 数据文件建立过程中设立控制点的重要性
控制点的目的:对输入的数据项进行校验,避免由此而影响数据的正确性。
数据校验的方法:名称校验、重复校验、范围校验、类型校验、平衡校验等。
6.3 根据具体要求编写建立和修改数据文件的程序
6.4 编写对数据文件按选定字段进行排序的程序
6.5 对数据文件进行检索的几种方法
6.6 编写按顺序查找法对数据文件进行检索的程序
6.7 随机检索程序的编写方法
6.8 数据文件合并和更新的含义和使用场合
6.9 用处理文件去更新文件的程序原理
7. 数据处理方式(识记)
7.1 数据处理方式的两种类型
批处理方式、联机实时处理方式
7.2 批处理的两种类型及其处理过程
1) 顺序处理:必须从第一个记录开始,一个一个搜索下去,直至找到要修改的为止。
适合于:①定期处理的场合、②每次处理的记录数量较大的情况。
2) 直接存取处理:每次更新都直接去修改主文件记录,原有记录被破坏。又叫破坏性更新或覆盖更新。
7.3 分析直接存取处理的优点
1) 用一个简单的程可以更新多个文件
2) 当更新的主记录少时,直接存取系统文件的维护比顺序系统要快得多。
7.4 联机实时系统和分时系统的概念
联机实时系统优点:相应及时,适合于要求及时响应的场合;不需要脱机转换数据,不需要人工干预,使用方便,服务及时。缺点:集中程度高,要求有严格的控制过程,对存取的安全控制要求较高,技术较复杂。