在现如今的数字化时代,各行各业只有积极开展数字化转型,与先进技术手段相结合,才能跟上时代发展步伐,不被时代发展所淘汰,档案管理事业也不例外。因此,我国档案管理行业积极与数字化等技术手段深度融合。
档案数字化率是指数字化档案数量在全部档案数量中所占的比例。这里的数字化档案涵盖了通过扫描、录入、转换等技术手段将纸质、音像等传统载体档案转化而成的数字形式档案。这一指标直观地展示了一个单位、机构乃至地区在档案数字化进程中的成果。例如,若某单位共有10万份档案,其中已完成数字化的有3万份,那么其档案数字化率即为30%。较高的档案数字化率意味着更多的档案资源以数字形式存在,更便于档案信息的存储、检索和传播。
档案数字化的主要流程:
1. 数字前处理:
(1)确定扫描页
原则上应将确定为数字化对象的纸质档案全部扫描,不宜进行挑扫。如有不需要扫描的页面应加以标注。密级档案不得与普通档案一同扫描,如需要扫描,需另设专用涉密计算机、扫描仪、存储磁盘,单独扫描单独存储。
(2)编制页号
对没有页号或页号不正确的档案重新编制页号。重新编制页号时,应在统一位置书写页号,且不压盖档案内容。一般正面右上角,背面左上角的空白位置,距离垂直或水平顶边1CM处。如右上角、左上角已经编制页码,可以统一在左下角、右上角进行编制。
采用硬度较小的铅笔编制页号。
将破损页面、缺页等特殊情况进行登记。
(3)拆除装订
应以对纸质档案的保护为原则确定是否拆除装订。如需拆除装订物,应注意保护档案不受损害,并对排列顺序不准确的档案进行重排。特殊装订且拆除装订后需恢复的档案,在拆除装订物时应采用拍照等方式记录档案原貌,以便于恢复。
2. 档案数字化处理:
(1)档案扫描。档案扫描是纸质档案转化数字档案的关键步骤。档案扫描可以使用各种不同的扫描设备来完成,例如:平板扫描仪、工程扫描仪或鼓式扫描仪。具体使用什么扫描仪将取决于所扫描文件的类型和数量,以及所需的分辨率和其他因素。原件的扫描与存储格式应完全按照国家档案管理的统一标准进行,对实际扫描卷数、每卷的页数要做好登记。
(2)图像处理。扫描完成后,需要对图像进行处理。这包括图像校正、裁剪、旋转和增强等操作。图像校正消除了因扫描时出现的倾斜或偏移导致的问题,确保图像的水平和垂直对齐。裁剪操作可以去除边框、空白和不需要的部分,使图像更加整洁。旋转功能可以纠正横向或纵向放置的图像。图像增强则是通过调整亮度、对比度和色彩来改善图像质量。
(3)光学字符识别(OCR)。为了增强数字化档案的可搜索性和可编辑性,通常需要进行光学字符识别(OCR)。OCR软件能够自动识别扫描图像中的文本,并将其转换为可编辑文本格式。这样,用户可以方便地使用关键词搜索档案内容,而不必逐页查找。
3. 档案数字化后处理:
(1)数据挂接。数据挂接又称数据匹配,是数字归档中为保证数字档案的准确性和完整性所需要的流程。借助软件对数据库中的目录数据与对应的数字档案进行匹配挂接,并逐条对挂接结果进行检查,包括目录数据与数字档案对应的准确性、已挂接数字档案与实际扫描数量的一致性、数字档案是否能正常打开等,以实现准确关联。
(2)数据验收。项目验收是档案数字化加工中,用于确保数字化后的档案符合所需质量标准和规范的过程。这通常涉及对数字档案进行一系列测试和检查,以验证它们具有足够的质量并符合指定的标准。这其中包括图像扫描、检查处理数据匹配步骤中可能存在的错误、遗漏或其他问题。在某些情况下,项目验收测试还可能涉及使用专门的软件工具来完成该过程,以确保符合所需标准。
影响档案数字化率的因素:
(一)资金投入
档案数字化工作需要购置专业设备,如高速扫描仪、大容量存储设备等,还涉及数字化加工服务费用、后期维护成本等。资金匮乏会直接限制设备采购和项目推进,导致数字化进程缓慢。以小型地方档案馆为例,受限于财政拨款不足,难以承担高昂的数字化设备采购费用,致使档案数字化率长期处于低位。
(二)技术水平
数字化技术的先进性和适用性至关重要。OCR 文字识别技术精准度低,会增加人工校对工作量,降低数字化效率;存储技术不稳定,可能造成数据丢失,影响数字化成果。一些老旧机构仍沿用早期的低精度扫描设备和简单的数据存储方式,难以满足大规模档案数字化的需求,进而影响数字化率提升。