②一个一对一的联系可以转换为一个独立的关系模式,也可以与任意一端对应的实体关系模式合并。如果转换为一个独立的关系模式,则与该联系相连的各实体的关键字以及联系本身的属性转换为关系的属性,每个实体的关键字均为该关系的候选关键字。
如果与某一端对应的实体关系模式合并,则需要在该端关系模式的属性中加入另一端关系模式的关键字和联系本身的属性。
③一个一对多的联系可以转换为一个独立的关系模式,也可以与多端对应的关系模式合并。如果转换为一个独立的关系模式,则与该联系相连的各实体的关键字以及联系本身的属性均转换为关系的属性,而关系的关键字为多端实体的关键字;如果与多端对应的关系模式合并,则需要在多端关系模式的属性中加入另一端关系模式的关键字和联系本身的属性。
④一个多对多的联系转换为一个关系模式时,与该联系相连的各实体的关键字以及联系本身的属性均转化为关系的属性,关系的关键字为各实体的关键字的组合。
⑤三个或三个以上实体间的一个多元关系转化为一个关系模式时,与该多元关系相连的各实体的关键字以及联系本身的属性均转化为关系的属性,而关系的关键字为各关键字的组合。
2.关系的规范化理论
物流信息系统的运行效率在很大程度上取决于数据库系统的效率。所以,对一个数据量庞大的物流信息系统而言,如何以最优的方式组织这些数据,形成规范化形式存储的数据库是物流信息系统建设和数据库设计的一个非常重要的问题。
从数据库的应用来讲,数据库投入运行以后,人们随时可能要修改数据库,如对数据的增加、删除、修改及数据关系的改变。在这种情况下,为了使用户使用方便,要尽可能消除对用户程序所带来的不良影响。如何能够较好地解决这个问题,就要用规范化方法和理论来进行数据库逻辑结构的设计,尽可能提高数据组织的相对独立性,简化数据结构,提高数据的可维护性、完整性和一致性。
规范化理论以关系数据模型为背景,但它对一般的数据逻辑设计,同样具有重要的指导意义。在规范化理论中,把关系看做是二维表,它具有以下四个性质:
①在任一列上,数据项具有同一个属性。
②在一个表中,所有的行都是不同的,不允许有相同的元组出现。
③在一个表中,行的顺序无关紧要。
④在一个表中,每一列(属性)有不同的名称,列的顺序也无关紧要。
一个结构不合理的数据库常常会出现数据冗余或插入、删除、修改异常等情况。通常,把关系模式分解以消除异常的过程称为规范化,把分解后的关系模式的规范形式称为范式。根据规范程度不同,范式依次可分为第一范式(记为1NF)、第二范式(记为2NF)和第三范式(记为3NF)等。对于物流信息系统开发来讲,一般只需要规范到第三范式即可。
5.3.3 物理结构设计
物理结构设计是在逻辑结构设计的基础上,利用DBMS所提供的方法、技术,以较优的数据存储结构、数据存取路径、合理的数据存放位置以及存储分配,设计出一个高效的、可实现的物理数据库结构。
由于不同的DBMS所提供的硬件环境、存储结构、存取方法不同,提供给数据库系统设计人员的系统参数及其变化范围也不同,因此,物理结构设计并没有一个放之四海而皆准的准则,只是提供一些技术和方法以供参考。
1.存储记录的格式设计
对数据模式的属性特征作分析,对存储记录进行格式化,决定如何进行数据压缩或代码优化。使用“记录的垂直分割”方法,对含有较多属性的关系,按其中属性的使用频率不同进行分割;或使用“记录的水平分割”方法,对含有较多记录的关系,按某些条件进行分割,把它们定义在相同或不同类型的物理设备上,或在同一设备的不同区域上,使访问数据库的代价最小,以此提高数据库的性能。
2.存储方法设计
物理设计中最重要的一个考虑是把数据记录如何在全范围内进行物理存储,常用的存储方式有:
①顺序存放,平均查询次数为关系的记录个数的1/2。
②散列存放,查询次数由散列算法决定。散列存放可以提高数据的查询效率。
③聚簇存放,“记录聚簇”是指将不同类型的记录分配到相同的物理区域中去,可以充分利用物理顺序,提高访问速度。经常在一起使用的记录聚簇在一起,可以减少物理输入/输出的次数。
3.存取方法设计
存取方法设计为存储在物理设备上的数据提供数据访问的路径。索引是数据库中一种非常重要的数据存取路径。在存取方法设计中要确定建立何种索引,以及在哪些表和属性上建立索引。通常情况下,对数据量很大、又需要做频繁查询的表建立索引,并且选择将索引建立在经常用做查询条件的属性或属性组以及经常用做连接操作的属性或属性组上。
物理设计的结果是物理设计说明书,包括存储记录格式、存储记录位置分布及存取方法,并说明对硬件和软件系统的约束。
5.4 输入输出设计
物流信息系统的输入/输出(I/O)设计是一个在物流信息系统中很容易被忽视的环节,同时又是一个很重要的环节,它将直接影响用户对物流信息系统的评价,从而影响物流信息系统的综合竞争力和使用寿命。良好的输入/输出设计可以提高用户对物流信息系统的满意度和使用效率,并为物流决策者提供便捷、有效、实用的管理和控制信息。
在输入输出设计中必须遵循的一个基本原则是:以输出确定输入和处理方式,这是因为准确、及时地反映和组成用于生产和物流部门的有用的系统输出信息是用户评价物流信息系统的最直接的标准。所以,输入输出设计过程与系统实施过程相反,不是从输入设计到输出设计,而是从输出设计到输入设计。
5.4.1 输入设计
输入是连接用户与物流信息系统的桥梁,也是物流信息系统与用户交互的首要环节。处理好输入环节,需要系统在界面简单、美观和方便的前提下,能够正确地引导用户输入系统所需要的正确信息。
1.输入设计的原则
输入设计的原则包括以下方面:
①最小量原则。在满足系统处理要求的前提下,应当使输入量尽量小,同一项数据内容不要重复输入,系统能够计算出的数据不要由用户来输入。输入量越小,则出错率越低,同时输入效率越高。
②简单性原则。输入过程应尽量简单,以最大限度地减少输入错误的发生。
③及早检验原则。对输入数据的检验应尽量接近原始数据发生点,使错误能及时得到改正,避免错误在系统中不断扩散。
④适合使用原则。输入数据尽量采用用户熟悉的或用户需要的形式记录,以免数据转换存储格式时发生错误。
⑤快速原则。在网络环境下,一些数据的输入校验,会传输到远程服务器上进行校验,要注意输入速度,要尽量提高系统对用户输入的反馈速度。
2.输入内容的设计
输入设计的主要工作包括输入内容的确定、输入方式的选择、输入格式的设计和输入数据校验等。
(1)输入内容的确定
原始数据的获得需要考虑数据产生的部门,确定数据收集的时间和方法,了解数据产生的周期、平均发生量及高峰数量等。这些工作有的已在系统规划和系统分析阶段进行了,在这里需要进行整理和调整,以确定输入数据项的名称、数据内容、精度和数值范围等。
(2)输入方式的选择
数据按其表现形式不同,可分为文字、图像和声音等。不同的数据类型应使用不同的输入方式,如手工输入或计算机自动输入。有些输入数据是从数据产生地直接采集来的原始数据,这类数据应由手工输入;有些数据是经计算机处理产生后存入存储介质,或由其他计算机信息系统传输到本系统作为再次输入的数据,这里所讨论的主要是前一类原始数据的输入,其输入方式根据数据产生的地点、时间、周期、数量、特性和处理要求而确定。常用的输入方式主要有以下三类:
1)键盘输入
这是目前最常用的一种输入方式。输入后通过屏幕显示确认,使用比较方便。但是,这种输入方式速度较慢,工作量大,且出错率较高,主要用于常规的、少量的数据输入。
2)光电设备输入
直接通过光电设备,对实际数据进行采集并将其转换成计算机能够识别和接受的数据形式,如用图形扫描仪输入图形,再通过图形识别系统识别各种文字或符号;利用光学符号阅读器输入条形码,将物品包装上的条形码转化为计算机能够识别和接受的数据。
3)声音输入
通过语音识别系统,利用转换器和语音分析手段,与预先存入系统的声音特征参量进行对比,通过逻辑判断完成识别与辨认。
(3)输入格式的设计
输入格式分为两种:一种是原始单据的设计;另一种是人机界面设计。这里主要介绍原始单据的设计。对于原始单据的设计,要符合标准化和便于使用,要求输入数据的记录格式既要便于操作人员录入,又要便于填表人员在现场工作填写。这种记录格式本质上可分为两部分:预先印刷部分和插入数据的空格。需要手工填写的表格,不仅要注明文字,而且在表格下方也要注明代码说明,这样能给填表人和读表人一定提示,不用死记编码或反复翻阅代码表,同时又可以提高填写的准确性。
(4)输入数据的正确性校验
在输入数据过程中,不可避免地会出现各种错误,对于系统中的主要数据,应确保其正确性,这将会直接关系到系统的正常运行和系统的正确输出。
1)输入错误种类
常见的系统输入错误主要有数据本身错误、数据数量错误和数据延迟三类。
①数据本身错误指由于原始数据填写错误、书写不清等原因引起的输入数据错误。
②数据数量错误包括数据多余或不足,主要是在数据收集过程中产生的差错,如原始单据的散失、遗漏或重复等原因引起的错误。
③数据延迟是在数据收集过程中所产生的差错,多由开票、传送等环节的延迟引起,严重时会导致输入的信息毫无利用价值。因此,数据的收集与传输必须具有一定的时间性,在收集和传递过程中尽量采用先进的设备进行支持,并且事先确定数据产生延迟时的处理对策。
2)数据出错的校验方法
常用的校验方法有以下几种,这几种方法可以单独使用,也可以组合使用。
①重复校验,即要求两次输入同一数据,然后由物流信息系统自动进行对比校验,如两次输入内容不一致,系统将显示或打印出错信息。
②视觉校验,即在输入内容的同时,由计算机打印或显示输入数据,然后与原始单据进行比较,找出差错。视觉校验的差错率与检查者的状态、情绪、检验水平等有直接关系,不可能查出所有的差错,一般的差错率为75%~85%。
③校验位校验,即利用代码的校验位完成对原始编码信息的正确性检验,具体步骤参见本章第二节。
④控制总数校验,即工作人员先用手工求出数据的总值,然后在数据的输入过程中由物流信息系统累计总值,将两者对比校验。
⑤格式校验,即校验数据记录中各数据项的位数和位置是否符合预先规定的格式。
⑥逻辑校验,即根据业务上各种数据的逻辑性检查有无矛盾,例如,月份的最大值不会超过12,否则即为出错。
⑦界限校验,即检查某些输入数据的内容是否在规定的范围之内。
⑧顺序校验,即检查记录的顺序。例如,要求输入数据无缺号时,通过顺序校验,可以发现被遗漏的记录。又如,要求记录的序号不得重复时,用顺序校验即可查出有无重复的记录。
⑨记录计数校验。这种方法通过计数记录个数来检查记录是否遗漏或重复。不仅对输入数据,而且对处理数据、输入数据及出错数据的个数等,均可进行计数校验。
⑩平衡校验。平衡校验的目的主要在于检查对应项目之间是否平衡。例如,会计工作中检查借方会计科目与贷方会计科目合计是否一致。
皕瑏瑡对照校验。对照校验即将输入的数据与基本文件的数据相核对,检查两者是否一致。例如,为了检查销售数据中的用户代码是否正确,可以将输入的用户代码与用户代码总表进行核对。当两者的代码不一致时,就说明出错。当然,凡是出现新的用户,都应该先录入到用户代码总表中。
3)出错的改正方法
出错的改正方法应根据出错的类型和原则而异。当发现原始单据有错误时,应将原始单据送交填写单据的原单位修改,不应由输入员随意修改。机器自动检错时,出错的恢复方法有以下几种:待输入数据全部校验并改正后,再进行下一步处理;舍弃出错数据,只处理正确的数据(这种方法适用于作趋势调查分析的情况,一般不需要太精确地输出数据);剔除出错数据,继续进行处理,出错数据待留下一运行周期一并处理(这种方法适用于运行周期短而且剔除数据不致引起输出信息的正确性显着下降的情况)。
4)确定输入设备
输入设备是人或外部环境与物流信息系统进行交互的一种装置,用于把原始数据和处理这些数据的程序输入计算机。现在常用的计算机输入设备按功能可分为以下几类:
①字符输入设备,如键盘。②光学阅读设备,如光学标记阅读机、光学字符阅读机。③图形输入设备,如鼠标、操纵杆、光笔。④图像输入设备,如摄像机、扫描仪、传真机。⑤模拟输入设备,如语言模数转换识别系统。