郝光烨
九十年代以来,随着个人计算机的迅猛发展和不断普及,以单个部门或单个业务为主的信息系统得到了广泛应用,人口管理、工资管理、档案管理、办公自动化等信息系统在信息存储、交换和业务工作规范化、流程化管理方面发挥了积极的作用。但是另一方面,这些单项信息系统的应用也存在一些不可避免的问题,造成设备重复投资、重复建设,数据重复采集、重复录入,系统自行开发、信息不能共享等现象。主要表现在:一是由于应用系统建设的总体规划滞后,各单位通常自行进行软件开发和应用。从部门内“纵向”而言,面向某类业务在各个应用层次的整体规划工作不足;从部门间“横向”而言,缺少面向各个应用层次及其主要业务的整体应用规划。即应用系统建设缺少全局性的“条”、“块”结合的统一规划和规范。应用的整体规划和总体设计滞后,导致信息系统小而多、繁而杂,而且标准不统一、接口不规范、数据项(库)和开发环境不一致,技术上的差异性导致“信息孤岛”现象普遍存在,跨地区、跨部门信息共享困难。二是由于缺乏集成化的建设和集中式的管理,各部门各单位“自建自用”、自成体系,自行购置硬件设备和系统软件,甚至为了管理几百条数据也要建设一套计算机应用系统。重复投资、重复建设,造成资金浪费。三是信息分散、数据不一致。由于单项信息系统大都侧重于业务管理,处于独立运行、数据孤立存放状态,信息系统网络化、集成化程度低,难以实现数据的有效复用。信息系统间信息采集交叉、数据重复录入,造成数据冗余、数据出错和不一致,影响到信息的准确性。为此,充分利用现有的信息系统和保护现有的投资为基础,以统一标准、统一规范为原则,以信息共享、信息综合利用为核心的信息整合成为信息化建设的一个重要环节。
综合数据库的“五要素”模型
信息整合就是通过抽取、复制、逻辑映射等方式,将分散在单项信息系统中的信息联系在一起,形成有机的整体,实现“单点采集、多点使用”。同时,去伪存真、拾遗补缺,最大限度地保证数据的一致性和唯一性。数据的集约化存储,降低数据的不一致性是综合数据库建设目标之一。
信息整合不是简单的数据集中和堆砌,其关键是综合数据库的建立。为此,依据信息工程理论、关系数据库理论,提出综合数据库的“五要素”数据关联模型,即人员、事件、物品、地点、机构。
1.人员要素
是各信息系统中所涉及到的自然人信息的高度抽象和归类,按人的自然属性、社会属性、管理属性加以表征,并按一定的数据组织方式加以存放,如以教师、律师、居民、工人、农民、军人等职业性质分类;以常住、暂住、流动、出入境等居住性质分类。
2.事件要素
是所有客观发生的事件、事故等信息的高度抽象和归类,并按件所固有的特征加以表述,按一定的数据组织方式加以存放,如灾害事件、犯罪事件、群体事件、交通事故、火灾事故等都属于事件要素的范畴。
3.物品要素
是所有信息系统在管理中涉及的物品信息的高度抽象和概括,并按物品所固有的特征加以表述,并按一定的数据组织形式加以存放,如药品、机动车、货物等都属于物品要素的范畴。
4.地点要素
是所有地点、区域和场地类信息的高度抽象和概括,并按地点所固有的特征加以表述,并按一定的数据组织形式加以存放,如人的住址、事件地点等都属于地点要素的范畴。
5.机构要素
是所有由人组成的社会群体信息的高度抽象和概括,按机构所固有的特征加以表述,并按一定的数据组织形式加以存放,如企业事业单位、民间组织、各种行业等都属于机构要素的范畴
综合数据库的建设原则
1.以数据为中心的原则:按照信息工程理论,数据是稳定的,业务处理是多变的。遵循“以数据为中心”的原则,提炼和抽象出相对稳定的数据模型,才能使行政管理上或业务处理上的变化能够被计算机信息系统所适应。把数据作为设计的中心,对各种单项信息系统的数据进行整合和集约化处理,建立动态或静态关联模型,实现有效的数据管理,保证综合信息的稳定性。
2.数据标准化和规范化的原则:综合数据库中的数据必须满足统一的标准和规范,包括对数据属性的统一定义,数据词典和约束条件的统一定义。对不符合标准和规范的数据必须进行整合处理。
3.统一结构和灵活性相结合的原则:综合数据库中的数据结构应坚持统一性和灵活性相结合的原则,在相对统一结构的基础上,追求最大限度的灵活性和可扩展性。
4.数据集约化管理的原则:综合数据库的数据物理上可以采用集中、分布、集中与分布相结合的方式,但逻辑上应是集中的。无论数据是集中还是分布,数据的管理必须遵循集约化管理的原则。
5.数据开放的原则:综合数据库应在集约化管理和安全授权的条件下,制定统一的接口标准,为单项信息系统提供信息服务。
6.与单项信息系统相互促进的原则:综合数据库的数据来源于各单项信息系统的数据库,在对其进行整合、规范和建立关联之后,通过开放接口,为各种单项信息系统提供跨地区、跨部门的信息服务和数据复用,提高单项信息系统的数据准确性和一致性。
综合数据库的建立模式
模式一:综合数据库和单项系统数据库分离的方式—松耦合模式。
在这种方式下,单项系统数据库和综合数据库各自独立建设,综合数据库的数据来源于单项系统数据库,业务应用管理系统必须按照一定的格式向综合数据库提供数据。
优点:
1. 保护了现有系统的投资,原有的单项信息系统不必进行较大改动;
2. 系统对网络的要求不太高;
3. 数据冗余存放,增加了数据的安全性。
缺点:
1.各部门独立建设单项信息系统,整体投资加大、系统维护成本增高;
2.如果单项信息系统不进行相应的改造,无法解决信息重复采集、录入及数据一致性问题;
3.信息维护的实时程度降低,只能进行相对及时的维护;
4.增加了数据接口设计的难度。
模式二:综合数据库和单项系统数据库一体的方式—紧耦合模式。
这种模式的特点是综合数据库和单项系统数据库完全一体化,各部门共建共用综合数据库。在建设综合数据库的同时,从整体上规划各个单项信息系统的数据,综合数据库同时支持单项业务处理和综合应用,综合应用系统和单项信息系统是紧耦合方式。
优点:
1. 保证了数据的一致性和实时性,减轻了重复采集和录入的负担;
2. 数据处理流程清晰,数据处理简单,易于建立数据的关联,易于应用的扩展;
3. 避免重复投资和重复建设造成的浪费。
缺点:
1. 整体规划难度大;
2. 开发周期长;
3. 对网络、主机的性能要求高。
信息整合是信息化发展的必然趋势,随着网络技术的不断发展和网速的大幅度提高,为信息整合和信息的综合应用提供了有力的保证。在信息整合的过程中,要把综合数据库的建立放在首位,确定好综合数据库的关系模型,结合单项信息系统的建设实际,选择松耦合、紧耦合或松紧相结合的模式建立综合数据库,为信息的整合和共享奠定坚定的基础。
作者单位:陕西省公安厅信息通信处