1. 引言
随着信息技术的快速发展和管理信息化的逐步深入,电子文件正在成为新的档案形态,具有保存价值的电子文件仅以电子形式归档即“单套制”归档逐步应用实施。如何妥善地对“单套制”形成的电子档案进行管理与保存则提上议事日程,同时包括高效的电子归档,缩短归档过程中的传播路径,全程不需要人工参与,也成为亟待解决的问题[1]。
2. 业务电子文件归档现状以及存在的问题
通常来说,业务档案一般周期长、业务规模大,涉及参与方、关联方众多,形成的档案文件类型复杂,具体表现为来源系统多、数量大、类型多、传播周期链条长等特点。在业务建设实际开发过程中,由于项目体量大,涉及业务系统多,所产生的电子档案涉及关联方多,如何能高效地进行归档有效提升档案归档的效率成为值得关注的问题[2]。
当前在业务建设完成后,相关电子档案需要及时进行归档便于后期规范管理。按照目前常规的做法主要以人工参与的方式为主。具体表现为由归档人员整理待归档的电子档案,通过相关系统上传待归档的电子档案资料至档案系统进而完成归档过程。通过此种方式的归档由于依赖人工参与[3],可能存在如下问题:
一是现有方式无法保障归档的准确率和完整性,若归档人员遗忘某项待归档的电子档案,则该档案将无法及时进行归档,容易导致归档文件的遗漏。
二是归档效率低下,由于此种归档模式依赖人工参与,没有进行自动化归档方式,归档时间较慢。
3. 业务电子档案自动归档的应用
综上所述,现有技术大多通过人工整理的方式来对档案进行归档,无法保障归档的准确率和归档效率[4]。为解决上述问题,本文设计一种应用于业务电子档案的自动归档方法,来提升电子档案的自动归档效率,保障电子档案的归档准确率和完整性。
3.1. 与现有技术对比和不同点
与现有依赖人工的方式不同,本方法主要是通过提前预设相关归档标准,对系统中上传的待归档电子档案进行识别,同时与预设的归档标准进行对比,找出待归档文档问题(如缺失、上传文件有误)并予以修改完善[5]。通过系统自动比对方式取代传统人工比对方式,可以大幅提升业务电子档案的归档效率,并且通过对比方式能及时找出缺失或者有误的归档文件,极大提高归档的准确性,如图1所示。
Figure 1. Architecture diagram of electronic archives automatic archiving system
图1. 电子档案自动归档系统架构图
3.2. 确定业务档案的归档标准
根据各种业务的建设相关要求,确定项目归档标准,同时将归档标准以列表的方式进行梳理便于后期系统的录入[6]。这里以公积金业务建设为例,假设某业务完成后的归档标准需要进行归档的文件如下(考虑实际归档种类较多,这里只列举部分类别便于理解):
1) 楼盘项目可行性研究报告、会议纪要(归档格式为:pdf);
2) 楼盘项目审批文件(归档格式为:pdf);
3) 企业资料:法人营业执照副本、组织机构代码证等(归档格式为:pdf、图片);
4) 项目资料:国有土地使用证、建设用地规划许可证、建设工程规划许可证、建筑工程施工许可证、商品房预售许可证(归档格式为:pdf、图片);
5) 施工图设计文件(归档格式为:pdf、CAD施工图纸);
6) 施工合同(归档格式为:pdf、图片);
7) 开工令(归档格式为:pdf、图片);
8) 施工过程资料(归档格式为:doc、pdf、图片);
9) 影像文件(归档格式为:多媒体格式)。
3.3. 现有系统电子归档模块改进及优化
在业务项目档案归档标准确定后,下面进行现有系统的优化改造。这里的优化改造主要分为三个部分,一是电子档案的识别模块,主要用于识别提交过来的待归档电子档案的归档名称及电子档案格式;二是电子档案的对比模块,主要是待归档的电子档案与系统中已经存在的归档标准进行比对;三是电子档案的改进优化模块,根据比对结果对需要改进的电子档案进行改进和优化。系统电子归档模块主要优化如下。
3.3.1. 电子档案识别模块
电子档案的识别模块主要功能为对获取的电子档案文件进行文件名称和文件类别格式的识别,该通过可以通过编写文件识别程序进行,通过程序可获取该电子档案的名称,同时获取后缀后面的文件格式。
以上述为例,假设目前已经通过前期上传所获取到的待归档的电子档案,通过循环文件识别程序可依次获取到电子档案的文件名称和后缀名,并存储到临时文件中,用于后续的对比步骤。
3.3.2. 电子档案的对比模块
电子档案比对模块主要是将上述步骤中识别出来的待归档电子档案的文件名和格式逐一前期设置的标准格式进行对比,并形成对比记录。这里需要注意的是,在对比模块中,文件类别格式的对比要求是必须一致的,即标准为pdf格式,那么待归档的文件也必须要满足pdf格式,如果为其他非pdf格式,视为比对不通过。
而待归档文件的文件名称不需要全部一致,只要符合对比要求即可,这里的对比要求可根据各业务实际进行约定,比如满足关键字要求即可,如某电子档案的文件名称为《**楼盘可行性研究文件报告》,而要求归档文件的标准名为《**楼盘的可行性研究报告》,关键字设定为“楼盘”、“可行性研究”、“报告”,那么根据上述条件,这里依托关键字比对均满足对比要求,文件名也可视为符合标准,比对通过。通过上述比对方式,可解决文件名必须完全一致的严苛标准,极大提高对比通过效率,提高归档率。
3.3.3. 电子档案的改进优化模块
电子档案的改进优化模块主要是将上述通过比对模块中发现的问题进行改进和优化,进一步提高系统的自动归档效率。模块主要针对电子档案的文件名称和文件类型与标准不一致而产生无法归档的系列问题,对文件名称和类型进行调优达到归档标准[7]。
这里仍以上述楼盘归档的电子档案为例,假设要求归档的电子档案标准格式为pdf格式,而系统中所上传格式为doc格式,在对比模块无法通过,这里可以调用文件格式转换程序对该名称进行格式转换,将doc格式转换为pdf格式,进而符合电子档案的归档格式标准。
另一方面,针对归档文件名称比对,若归档文件名称比对完全一致,则不需要进行处理,若出现文件名不完全一致的情况则视比对结果来进行相应处理。如果文件名不完全一致,但是通过了上述步骤二中比对模块的关键字比对,可采取更改电子档案的文件名方式,也就是说将该电子档案的文件名改为标准所需要的名称即可。若未通过比对模块的关键字比对程序,即视为该电子档案无法满足归档要求,需进一步核实归档的内容等。同时还可能存在标准里面有,但未发现归档文件的情况,此类属于归档文件的缺失,需要进一步补充。
3.4. 自动归档和结果反馈
根据上述三个步骤,通过对归档的电子档案逐一与归档的标准进行比对和优化,可根据比对优化结果进行自动归档。若待归档电子文档与归档标准全部比对一致,则自动生成归档目录,同时对电子档案进行系统归档。若比对结果存在不一致等问题,则将对比结果反馈给用户,对需要修改和补充的进行提示,待电子档案补充完善后再次进行反馈比对,确保电子档案符合相关归档标准。
依托此种方式进行批量对比和自动归档,一方面可大幅减轻人工比对工作量,提高归档的效率,同时可有效发现通过人工比对方式所遗漏的电子档案,大幅提升归档效率。
4. 自动归档的应用推广
本文主要以楼盘业务建设的归档工作为例,探索了自动归档的实现方式。在实际生产过程中,本文提出的自动归档方法也可以直接应用到其他业务领域的归档工作。其他领域归档时,与本文所属的归档方法唯一的区别在于需要确定该领域的归档标准,也就是明确需要归档的文件要求和类型等要求,然后按照上述操作步骤依次进行即可,本方法具有较高的复制性和推广性。
5. 结语
本文围绕业务电子档案的归档的技术特性,提出业务电子档案自动归档方法,通过优化现有归档系统,设计档案识别和对比模块,对归档进行自动化比对和归档,能批量地对归档文件进行对比分析,此举将大幅提升电子档案自动归档的准确性和完整性。本文主要关注的为文件名和格式的对比,下一阶段还可进一步考虑对文件内容的识别和比对,以达到更好的归档效果。