开放档案信息系统(OAIS)介绍
【编者按】本文为《中国科学院数字档案馆建设方案》课题研究的部分内容。OAIS系统发布时间不长,已经得到国际信息领域的广泛认同和参考应用,也引起国内信息领域的关注和研究,并成为数字档案信息管理所遵循的原则和参考框架。 在国际标准化组织(ISO)的请求下,空间数字系统咨询委员会(Consultative Committee for Space Data Systems,CCSDS)开始开发一个存档标准以支持数字形式存在的数据的长期保存。CCSDS的这一工作导致1999年5月开放档案信息系统(OpenArchival Information System ,OAIS)参考模型的发布。这一参考模型针对数字信息的长期保存和维护的档案系统提供一个概念性的框架,描述了一个档案系统存在的环境、档案系统的功能组织以及支持档案处理的信息基础结构。在CCSDS和ISO的推动下,OAIS参考模型成为了数字档案系统普遍遵从的标准规范,来自图书馆、档案馆、科学数据、文化传承等领域的相关项目和系统都纷纷以其为准,进行系统的规划和设计。OAIS参考模型同时支持数字化的和物理存在的存档信息。它特别对数字化信息给予了较多关注,这些数字信息或者是作为档案的主体,或者是作为对数字化资源以及物理存档资源的支持信息存在。在OAIS参考模型中,提供了一个完整的档案信息保存功能,它包括摄入、档案存储、数据管理、存取和分发。它同时论述了数字信息从一种媒体或格式到另一媒体或格式的移植、信息表示的数据模型、信息保存中软件的作用、档案系统之间数字信息的交换等。它还确立了各个档案功能内部和外部的接口,以及一系列在这些接口之上的高层服务。1. OAIS的环境OAIS认为,一个OAIS是一个置身于生产者、消费者和管理者之间的一个存档体系。如图1所示。图1 OAIS
的环境模型围绕OAIS进行档案存储、管理和利用的角色分别有生产者、管理者和消费者。其中:(1)生产者是提供需要保存信息的人或者是客户系统。生产者通过OAIS的摄取过程(Ingest)向OAIS提交要保存的信息,包括元数据。这个过程接受提交的数据并准备到档案系统中存储。生产者与OAIS的相互作用通常被描述为提交协议,具体包括:提交的信息类型、期望生产者能提供的元数据以及从生产者到存档的实际传送管理。
(2)管理者由设置OAIS整体政策的人组成。这一角色确立档案收集的范围,明确档案条目的保存许可,指明资金来源以及监管使用的情况,定期评论OAIS的政策和运作。
(3)OAIS的消费者指的是与OAIS服务交互以获取特定保存信息的人或系统。在OAIS消费者中,包括了被称为“目标团体(DC)”的特殊消费者。
管理者、生产者、用户以及DC在OAIS中更多的代表了功能性,而不是单纯的组织角色。所有这些角色可以被包含在单一的组织架构内,也可以分布在多个不同的组织中。2. OAIS参考模型框架在OAIS中定义了6个功能实体和3种信息包。图2描述了OAIS参考模型的框架结构。 图2 OAIS的参考模型框架
OAIS中6个功能实体分别为:(1)摄入(Ingest)功能。这一实体提供的服务和功能是从信息生产者那里接收提交信息包(SIP),并且对内容进行准备,以便所提交信息能够在档案系统中进行存储和管理。Ingest的功能包括:接收SIP包、对子SIP包进行质量确认、生成符合档案系统数据格式和文件标准的存档信息包(AIP)、从AIP中抽取出描述信息以存入档案数据库,并且协调对档案存储和数据管理的修改工作。(2)档案存储(Archival Storage)功能。这一实体提供的服务和功能是存储、维护和检索AIP。档案存储的功能包括从Ingest接收AIP,并将它们存储到永久存储系统之中、管理存储系统的组织结构、对存储有档案的媒体进行翻新、执行日常的维护工作和特殊的错误检查、提供灾难恢复能力、并且为Access提供AIP以实现档案提取。(3)数据管理(Data Management)功能。这一实体提供的服务和功能是植入、维护和存取那些标识并记录档案馆藏的描述信息以及对档案系统进行管理的管理数据。数据管理的功能包括管理档案数据库(维护数据库中概念模型及视图的定义,维护系统的参照完整性等)、执行数据库更新(装载新的描述信息或档案管理数据)、对管理数据提供查询功能以产生结果集,并从这些检索结果集中生成查询报告。(4)系统管理(Administration)功能。这一实体提供的服务和功能是对整体的档案系统提供操纵管理。管理功能包括与信息生产者进行商讨以决定提交协议,对提交进行审计以确保提交内容符合档案标准、对系统的软件环境进行配置和管理。它同样还包括一些功能:如监测并提高档案系统运作、详细记录、报告档案的内容,并且对档案的内容进行移植和修改。它也包括建立并维护档案标准和政策、提供客户支持、激发存储请求。(5)保存规划(Preservation Planning)功能。这一实体提供的服务和功能是监测OAIS的环境,提供相关建议以确保在OAIS中存储的信息在长期一段时间之后,仍然能够被相应的目标用户(DC)所访问,即便是在原有计算环境都退化了之后。保存计划包括的主要功能有对档案系统中的存储内容进行评估,并且周期地提供存档信息建议以移植当前的档案馆藏;对档案系统的标准和政策进行建议;监测技术环境和目标用户(DC)的服务需求及知识背景的变化。保存计划同样包括设计信息包(IP)的模板,提供设计帮助和相关评价以对这些模板进行专业化处理形成特定的SIP和AIP。保存计划还包括开发详细的移植计划,开发移植软件原型系统和相应测试计划以实现管理移植目标。(6)存取(Access)功能。这一实体提供的服务和功能是支持消费者,使消费者可以判定、了解、定位以及存取存储在OAIS中的信息,让消费者可以请求并接收信息产品。存取功能包括与消费者进行通讯以接收请求,对于某些特别保护的信息进行管理控制以限制其访问,协调请求的执行以实现请求的完全响应,生成响应(分发信息包DIP,结果集,报告)并且将这些响应传送给消费者。OAIS提出了信息包(Information Package)的概念来说明档案生产者向OAIS的提交过程和OAIS向档案消费者的分发过程。一个信息包是一个包含名为内容信息(ContentInformation)和保存描述信息(Preservation DescriptionInformation,PDI)两种信息对象的容器。内容信息和保存描述信息被认为是通过打包信息进行封装和标识的,而为了使打好的信息包可以被了解和发现,需要通过描述信息对信息包进行描述。OAIS对提交给它的信息包、它所存储的信息包、以及它分发给其它消费的信息包进行了区分,分别将这些信息包叫做提交信息包(Submission Information Package,SIP)、存档信息包(Archival Information Package,AIP)和分发信息包(Dissemination Information Package,DIP)。其中:(1)提交信息包(SIP)是信息生产者提供给OAIS的信息包。它的格式和具体内容通常情况下是生产者和OAIS系统之间协商的结果。多数的SIP通常有一些内容信息和PDI,但它可能需要多个SIP来形成一个完整的内容信息和相应的PDI,从而进一步形成一个AIP。一个SIP也可能包括需要被包括在多个AIP中的信息。SIP对应的打包信息通常会以某种形式存在。(2)在OAIS中,一个或多个SIP需要被转换成为一个或多个AIP以进行保存。AIP有一系列完整的PDI和相关的内容信息。一个AIP还可能会由多个其它的AIP组成。AIP的打包信息(PI)需要遵守OAIS内部的标准,并且在OAIS的管理下,它还可能变化。(3)根据消费者的请求,OAIS需要以分发信息包(DIP)的方式提供一个AIP的所有或者部分内容给消费者。一个DIP也可能包括多个AIP,并且它可能有、也可能没有完整的PDI。打包信息(PI)需要以某种方式显性出现,以使消费者可以明确地辨别出所要的信息。根据分发媒体和消费者需求的不同,打包信息可能以多种方式存在。OAIS参考模型是对与数字档案系统相关的环境、功能模块以及信息对象的概念化。但是这个参考模型并不能用来建立实际系统,主要是因为,参考模型中并没有提及系统的体系结构、存储或处理过程、数据库设计、处理平台、以及任何与建立一个档案系统机能相关的技术细节。但是,这个参考模型是实际系统建立的一个起点,也就是说,不同形式结合起来刻画了实际系统所必须的高层任务、服务以及信息需求。 by the way: hams档案管理系统 为其他业务系统提供的通用接口是符合这个接口规范的