数据库是按照一定的组织方式(或称数据模型)在计算机系统中组织、存储和使用的互相联系的数据集合。数据库转换是指数据模式、数据、数据操作之间的转换。在实际应用,数据可能存储在不同数据库中,为实际应用需要,需要对不同数据库进行转换,得到我们想要的数据或数据模式。
一个数据库有4个主要成分:数据(data)、关系(relationship)、约束(constraint)和模式(schema)。数据是所存储的逻辑实体在计算机中的二进制表示;关系表示数据项之间的某种对应;约束是定义正确数据状态的语言;模式描述数据库中数据的组织和联系。以内模式为框架所组成的数据库叫做物理数据库;以概念模式为框架所组成的数据叫概念数据库;以外模式为框架所组成的数据库叫用户数据库。
⑴ 物理数据层。
它是数据库的最内层,是物理存贮设备上实际存储的数据的集合。这些数据是原始数据,是用户加工的对象,由内部模式描述的指令操作处理的位串、字符和字组成。
⑵ 概念数据层。
它是数据库的中间一层,是数据库的整体逻辑表示。指出了每个数据的逻辑定义及数据间的逻辑联系,是存贮记录的集合。它所涉及的是数据库所有对象的逻辑关系,而不是它们的物理情况,是数据库管理员概念下的数据库。
⑶ 用户数据层。
它是用户所看到和使用的数据库,表示了一个或一些特定用户使用的数据集合,即逻辑记录的集合。
数据库不同层次之间的联系是通过映射进行转换的。
数据库存放数据的模式,正因为有数据模式,才能构造复杂的数据结构来建立数据之间的内在联系与复杂关系,从而构成数据的全局结构模式。
数据模式是基于选定的数据模型对数据进行“型”方面的刻画,而相应的“实例”则是对数据“值”方面的描述。先有数据模型,才能据其讨论相应数据模式,有了数据模式,就能依据该模式得到相应的实例。
定义:也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
理解:
① 一个数据库只有一个模式;
② 是数据库数据在逻辑级上的视图;
③ 数据库模式以某一种数据模型为基础;
④ 定义模式时不仅要定义数据的逻辑结构(如数据记录由哪些数据项构成,数据项的名字、类型、取值范围等),而且要定义与数据有关的安全性、完整性要求,定义这些数据之间的联系。
数据转换 (data transfer)是将数据从一种表示形式变为另一种表现形式的过程。软件的全面升级,肯定带来数据库的全面升级,每一个软件对其后面的数据库的构架与数据的存诸形式都是不相同的,这样就需要数据的转换了。主要是由于数据量的不断增加,原来数据构架的不合理,不能满足各方面的要求。由数据库的更换,数据结构的更换,从而需要数据本身的转换。
异型数据库的转换就是在不同的数据库系统之间实现数据库模式、数据、数据操作之间的转换。特别是新、旧信息系统的变更,旧系统数据库中的数据转换到新系统之中时需要这种转换。显然,不同数据库应用系统, 其数据库模式、数据的格式和对数据的操作都不同,其转换的操作必须包含数据库模式的转换、数据格式的转换、对数据操作的转换和数据内容的转换。 另外,新、旧系统可能是不同操作系统下的不同数据库系统,也可能是同一操作系统下的不同数据库系统,对于不同操作系统下的数据库转换问题还必须考虑操作系统之间的数据交换问题。
在文件系统的层次,将源数据库中的数据文件转换为目标数据库文件,其特点是批量性的转换,这样可保证数据的一致性和完整性, 但转换的工作量较大, 是早期使用较多的方法。
利用 ODBC、OPEN C/S 、DBE、JDBC、ADO 等技术,实现不同数据库间的数据交换和共享,从而进行数据库的转换操作,其特点是为不同的数据库之间提供了信息交换的标准接口,使数据库转换操作简洁化,并且支持不同操作系统下数据库之间的信息交换,是网络计算模式下的常用方法。
一般来讲,不同的数据库应用系统的数据模式、数据类型和格式以及操作是不相同的,所以数据库转换的操作步骤应该包括数据模式的转换、数据类型和格式的转换及数据操作的转换。
数据库模式的转换
模式转换是数据库转换的基础,数据模式包括结构和约束两部分:结构,指数据和实体之间的抽象联系。
约束,是数据的逻辑限制,是实体性质对数据性质的约束。在进行模式转换时一定要考虑结构和约束的转换,使数据过渡到目标的数据库模式中。
数据转换
数据转换就是将源数据库中的数据信息转换到目标数据库中,在此过程中数据的类型或格式要发生变化,步骤为:
( 1) 将源数据库中数据文件转换到中间文件中存放。
( 2) 对中间文件进行处理,使其变为符合目标数据库模式及格式要求的数据文件。
( 3) 将处理后的文件导入到目标数据库系统中。