馆内规章制度

中国计量大学档案数字化加工方案

日期:2021-06-04     阅读:




1.方案综述

在数字化加工项目中,整个数字化加工过程可以分为档案接收、档案查卷、核查页号、去除装订物、目录对录、目录核校、纸面处理、档案扫描、扫描抽检、图像处理、图像质检、格式转换、转换核查、数据挂接、档案装订、总质检、数据备份、档案归还共18个环节,每一卷档案以“提卷单”为开始,以“流程单”为过程跟踪,以“还卷单”为结束。具体流程示意图如下图所示:

2.档案整理方案

1.按照“编页——拆除装订——页面修整——填写备考表——装订”的顺序执行,档案装订尽可能地按照原来的装订孔进行穿线装订,尽量不要新打孔装订,力求保护原件。重新打印目录归入卷宗,且保留原有目录。

2.1档案领取

档案管理人员从库房提取(每200卷为一批次)需要加工的档案实体,对提卷出库的档案实体进行逐卷清点,保证案卷封面的档号与调卷单开具的档号应一一对应,在每次提卷的过程中:

1、每批交接档案的清单要一式两份,一份放在每个档案运输箱中,一份由接收负责人按顺序持有。

2、档案管理人员负责对出库的档案实体进行出库登记(包括档案的物理位置(库排架位置)、档案的数量,档案年代、全宗号、案卷号、目录号、档号、存放箱号等信息),并由档案管理人员和提卷出库人员共同签字确认;

3、提卷出库人员负责填写《提卷单》相关信息,包括调卷时间、全宗号、年度、起止卷号、所调卷数等信息,对于调卷时所缺的卷,在《提卷单》上要明确进行说明,对短缺以及其他特殊情况的处理要进行详细记载,最后需要由提卷出库人员和档案管理人员一起进行签字确认;

4、档案管理人员陪同、跟踪、监督提卷出库人员将档案实体从库房运送到加工现场的全过程;

2.2档案查卷

在档案数字化加工项目中,档案查卷人员对所提案卷进行逐卷的检查核对,核对案卷中是否有卷内目录、备考表,并将检查结果记载到《流程单》,对拟扫描档案逐份进行鉴定,区分扫描件与非扫描件。档案严重破损、污染和字迹褪变等情况在《流程单》相应栏中标注清楚“此件不扫”、“此页不扫”、“原件破损”、“原件模糊”、“原件残缺”等情况说明。最后,查卷人员将形成《流程单》加入到案卷首页,保证案卷与《流程单》的一一对应,查卷人员在处理完每一卷档案后,需要在《流程单》上填写查卷相关信息(如查卷人、查卷时间、发现问题等信息),同时利用“数字化管理系统”中的“档案查卷”功能,将查卷相关信息记载到系统中。

3.档案扫描加工方案

在档案整理方案的基础上,对每一项(如每一卷/件)任务进行数字化加工的过程可以分为:目录著录、档案扫描、加贴模板、文件命名、扫描抽检、图像处理、图像质检、图像补扫、档案还原、格式转换、转换核查、OCR识别制作、数据挂接、总质检、数据复核、数据备份、档案还卷入库共17个环节。

3.1目录著录

按照DA/T 18-1999档案著录规则及中国计量大学南大系统及管理的要求,确定档案的著录项,建立目录数据库。进行原有案卷级、文件级目录挂接及案卷、文件级和专题目录的补录工作,通过人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查,确保著录项目完整,著录内容准确、规范,发现不合格的数据及时进行修改或重录。过程中如遇档案原件页码编错,或者漏编,应该按照档案相关规范更正或者补编页码。以前著录漏录的要补录,没目录的要编目、录入,错误条目要修改。确保目录录入的数据准确率99%以上,著录项目、字段要完整,内容正确,并支持目录打印。

纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为扫描后的图像文件命名。

3.2档案扫描(含在扫描过程中不对原件造成二次损伤所采取的措施)

扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。图纸、文书档案资料扫描采用彩色模式进行扫描采用彩色300dpiTIFF格式储存;照片档案资料扫描采用彩色模式进行扫描采用彩色600dpiTIFF格式储存;为了更好展现档案的原貌原样,在加工过程中选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用大幅面图纸扫描仪)进行扫描;对于案卷中出现如文字偏小、密集、清晰度较差等情况,可将分辨率提高到600dpi

图像保存格式:采用彩色模式扫描的图像文件,一般均采用TIFF和双层PDFTXT格式存储。存储时的压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。

采用平板进纸方式扫描,扫描时必须保证放纸端正、不压边、不漏扫、错扫,从而保证原始扫描图像无歪斜,减少后期处理可能带来的图像失真,确保图像质量。

扫描时,应根据纸张质地、底色、薄厚程度等因素,设置最佳的扫描明暗度、对比度设置,保证原始扫描图像效果与原件吻合。

纸张底色较浅,字迹较深、黑、明显(如毛笔字、碳素墨水字等)时其明暗度应设为默认值(0);当纸面上有较多的表格时,为了达到较好的效果应适当提高明暗度参数值(推荐10-20)

纸张底色较浅,字迹较浅、淡、不明显(如复写纸复写过和字、蓝色墨水、圆珠笔、铅笔字等)时应适当提高明暗度参数值(推荐20-30,或者40-50)。纸张底色较深,纸面粗糙,字迹较深、黑、明显(如毛笔字、碳素墨水字等)时,为防止因亮度设置不当出现较多黑点时其明暗度应设为负值(推荐-5-10之间)

纸张状况较差,以及过薄、过软或超厚的档案,采用平板扫描方式,如果是大幅面的可以加膜扫描;纸张状况好的档案可采用高速扫描方式以提高工作效率。

对于档案中的“筒子页”,应当平摊开后进行整幅扫描。

因纸张超薄且背面又有字迹时,扫描时为不让背面字迹扫描出来应将明暗度设为负值(推荐-5-10之间)

档案扫描人员利用“数字化管理系统”中的“档案扫描”功能,以卷为单位逐件进行扫描,档案扫描人员在处理完每一卷档案后,需要在《流程单》上填写档案扫描相关信息(如扫描人、扫描时间等信息),同时系统自动将档案扫描相关信息记载到管理系统中。

每一案卷纸质档案扫描完后,扫描人员应核对案卷内每一文件的实际扫描张数与前处理人员填写的文件张数是否一致,不一致时应在备注栏填写具体原因或向现场管理人员询问。

扫描操作员将整理好的档案,根据档案幅面的大小和纸张状况,选择相应扫描仪,具体对不同纸张档案扫描的处理工艺如下:

在扫描过程中不对文献原件造成二次损伤所采取的措施,根据不同的纸张质地状况和档案采取不同的处理方式

1.普通纸张:采用平板扫描仪进行扫描。

2.较薄纸张易碎(如信纸、便笺纸):在纸张下加入白色打印纸作衬,采用平板扫描仪进行扫描。

3.字迹较浅或模糊(如铅笔字):如采用彩色扫描应调节扫描临界值(亮度对比度),拉大字迹与原稿的反差,通过调参数达到理想效果。

4.脏乱、字型弯曲、版面较偏的纸张:应采取清理、纠偏、纠斜等措施,以保证图像字迹清晰,不失真。

5.底色较深的纸张(如草浆纸、油印纸):如24位彩色扫描应将扫描对比度及亮度适当调高,显示效果理想为止。

6.不规则纸张:纸张幅面较长但幅宽不超过A3,可采用扫描仪长纸扫描功能,根据纸张状况设定合适的扫描幅长即可。如纸张幅宽超过A3,采用宽幅扫描设备进行扫描。

7.不拆卷档案:对于不能拆卷的档案采用V型不拆卷扫描仪或零边距扫描仪进行扫描,最大程度减少档案损伤。

8.灰度、彩色页:采用平板扫描仪,调整具体模板参数,保证扫描质量。

9.补扫页:补扫的文件除不拆卷资料外,一律采用平板扫描仪。

●扫描图像标准

﹡确保纸张扫描时放置端正,从而保证原始扫描图像无歪斜,减少后期处理可能带来的图像失真。

﹡对于档案中的“报表”,应当平摊开后进行整幅扫描。图纸、表格等应整页扫描。超长页进行分页扫描后,使用软件进行拼接。

﹡按档案管理员要求对其有其他要求的档案资料进行扫描,扫描影像生成后,涉密、非涉密数据必须分类扫描及存放,具体区分正确率达100%

﹡对不宜拆卷的成册材料,需采用不拆卷扫描仪进行扫描。

﹡使用A3幅面扫描仪进行扫描,扫描时绝对保证档案载体的安全。

﹡扫描后的电子图像清晰,亮度对比度适中,无扭曲现象。

﹡扫描图像要完整,整洁、无歪斜、无黑边。

●扫描质量标准

﹡扫描影像的顺序与计算机的著录顺序一致,与纸质档案的案卷和文件的顺序排列一致,不可颠倒;不能有漏扫和重页,保证电子影像的完整齐全。

﹡扫描后的影像文件保持字迹清晰、不失真、不留文字版面外的暗影、无干扰信息,亮度对比度适中,有利于排版、建库处理。

﹡扫描后的影像文件页面要端正,无扭曲。

●扫描流程控制

档案数字化工作由数字化加工管理软件辅助管理控制:

﹡管理员认真填写纸质档案数字化转换过程交接登记表单,登记扫描档案的页数、色彩模式、分辨率等。

﹡扫描完成后,质检员核对每份文件的实际扫描页数与档案整理登记单时填写的文件页数是否一致,发现漏扫或错扫时应及时补扫,并在登记表上注明原因和处理方法。

﹡根据档案管理员提供的工作单核对目录,修改有错误的目录并将档案实体按照实际扫描页重新编号并填写到工作单中,作为文件和质检依据。

3.3加贴模板

在本项目中,对原档案由于客观问题影响图像信息阅读与利用的,需加贴模板对图像进行相应解释,以达到利用者对图像信息了解和掌握。

3.4文件命名

在本项目中,纸质档案的目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为扫描后的图像文件命名。

3.5图像处理

图像处理人员需要对扫描后生成的图像文件进行进一步处理,可以利用“数字化管理系统”中的“图像处理”功能实现,在保证文件内容完整的前提下,影像页应无扫描过程中带来的污斑,无黑边,外观达到基本清晰、平直、干净。进行逐页纠偏、去污、黑点、黑线、黑框、去黑边、扫描精度、对比度、亮度调节、影像的替换、插入、删除、图像拼接、裁边处理、统一版面大小、排列顺序调整,还可对图像进行字迹锐化、去除图像杂点、去除图像局部脏点等处理。确保每幅图像清晰、不失真。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。

保证图像信息与原档案内容完全一致,不删除页面任何有用信息,包括正文内容、页眉、页脚、手写注释和印鉴等。扫描的页面内容基本居中显示,不出现明显偏左或偏右现象。不准出现页面内容残缺或将其它页面信息扫入本页的现象。

1.对每份文件的每页进行纠偏处理,其左右歪斜偏差小1度。

2.对横向排放的页面进行左右旋转90度或270度处理,以符合阅读习惯。

3.对于除文字内容外,纸张边界内有个别较大的黑点、黑线条、黑框、黑边时进行去黑处理。

4.由于档案本身因陈旧、破损或不洁等造成页面上有污点的,如果在页面视图下无法看清,或该污点嵌在文本行中无法清除,可不予清除。

5.纸张太薄或字体颜色过浓,扫描时倒映反面文字,文字上的污点无法去污时,保证正文文字可以看清楚。

6.扫描后形成的文件由于各种原因,有可能字迹较深、较浅,影响视觉效果,将选择区域的字迹作加深、变浅处理。

7.严格执行图像污斑、黑点和黑边的处理工作,须达到图像放大2倍后肉眼观看仍能清晰、平直;档案图像倾斜度不超过1度,档案图像版面要居中,差错率在万分之一以内。

8.大幅面档案进行分区扫描的图像进行图像拼接,拼接处信息要完整,不能缺少任何信息,以保证图像的整体性。

9.图像成品要求:图像完整、整洁、无歪斜、无黑边、浏览及打印清晰。

3.6扫描校对

图像质检人员依据《流程单》,利用“数字化管理系统”中“图像质检”功能,对图像文件文件的清晰度、完整性逐页进行检查,确保质检后的图像数据与档案实体资料一致,确保无缺页现象,确保图像文件中的页码清晰。如在质检的过程发现有错误现象,需将错误信息记录在《成品数据验收记录单》上,并将其错误问题与《成品数据验收记录单》一同反馈给纠错人员,并要求纠错人员在当天内提供复检数据,再进行2次数据复检,在图像质检过程中,对于个别与原件问题有关的不符合标准的图像必须查找档案原件进行核对。图像质检人员在处理完每一卷档案后,需要在《流程单》上填写图像质检相关信息(如图像质检人、图像质检时间等信息),同时利用“数字化管理系统”中的“图像质检”功能,将图像处理相关信息记载到系统中。

校对内容主要包括扫描图像的质量是否符合要求;目录和图像是否一一对应;电子图像与档案实体是否一致。通过软件对扫描图像进行校对,并对扫描质量统计,并打印出统计报表。主要检查目录和图像的对应关系、图像质量(返工)、档案的实体顺序要保持和电子图像一致、并进行工作量统计和文件夹校对管理。

为了保证扫描质量,扫描校对共有两道工序,分为一校、二校。一校任务中分成二部分,一是对文件有漏扫、错扫部分给补扫,对于错误的扫描文件顺序及文件命名给予纠正;二是对扫描图像质量处理。二校重点在于确保每张图像质量完全符合要求。

严格按照《纸质档案数字化技术规范》(DA/T 312005)对档案进行扫描加工,保证扫描图像质量以及扫描画幅的顺序与数目正确。

1)质检岗位的专业质检员采用质检管理软件对扫描完成档案电子目录和图像进行逐册逐本逐页的检查,并根据情况对图像进行质检校正、统计管理和生成返扫各种工作单。

2)质检管理软件可以对数字化加工管理流程中每个环节质量状况进行监督、统计、修改。产生的个别质量问题运用图像质检管理软件进行批量自动/单页手工的旋转、纠斜、去黑边、剪边、线型弯曲校正、文字变形校正、中缝删除、居中、局部处理等全部图像加工手段,保证图像字迹清晰质量优秀。

3)采用软件对检查扫描图像数据信息的完整性。此软件主要功能:图像文件在局域网中传输时可能会出现数据丢包现象,此软件主要用来检查图像文件是否完整,确保图像信息完整性。

●质量保证措施及相关标准:

1)通过软件质量管理模块,采用“批量撒种子(随机不重复)”方式对图像处理后的电子图像数据进行随机抽检,并且该工序抽检内容与其他工序不交叉、不重复。此次抽检比例为30%,与数据初检、数据终检两道工序所抽检的60%的内容合计90%,再由用户在成品验收时抽检的10%的内容,实现100%的数据质检,当然客户也权可选择合适的比例抽检。

2)不合格图像直接由质检员负责重新处理。通过软件技术与工作人员登录信息记录保证图像质量以及明确责任人,并做出工作考核。

3)《纸质档案数字化技术规范》(DA/T 312005

4DA/T 18-1999档案著录规则

5)《连续色调静态图像的数字压缩及编码》(GB/T 17235.1-1998

6)对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,应重新进行图像的处理。

7)由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。

8)发现文件漏扫时,应及时补扫并正确插入图像。

9)发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。

1.对数字化加工文件的清晰度、完整性进行检查,要求质检率达到100%

2.对质检不合格的、遗漏的档案重新进行数字化加工。

3.7图像补扫

在本项目中,规范数字化档案质量检查,保证档案数字化图像清晰、完整、不失真、不影响图像的利用效果,图像分辨率不低于300dpi。应遵循在不影响可懂度的前提下展现档案原貌的原则。对图像处理环节存在问题的文件进行补扫或修改。

3.8档案装订

在本项目中,在对档案原件进行扫描、图像处理、图像质检后,档案装订人员需要对拆分的案卷进行逐卷的装订,所有装订的案卷要尽力按照原样进行恢复,要保证重新装订后的案卷不压字,装订完毕后的档案资料经过抽样质检验收合格后交还给用户档案管理人员进行装盒工作,装盒结束后,再由装订人员进行粘贴卷盒脊背信息,档案装订人员在处理完每一卷档案后,需要在《流程单》上填写档案装订相关信息(如装订人、装订时间等信息),同时利用“数字化管理系统”中的“档案装订”功能,将档案装订相关信息记载到系统中。装订要求如下:

1.装订前取掉所有金属物。

2.需要装订的案卷用三孔一线法结实装订,保证脊背和底边的平直,线结在卷后的中位。不需要装订的用不锈钢钉或不锈钢夹固定在案卷(件)左上角上方或下边。

3.归档材料案卷内不同尺寸的图件要折叠为统一A4幅面(图件折叠要将图例、标识在正面),在案卷的装订线一边和下边的案卷材料必须折叠齐平。

4.做到坚实、平整、美观。

5.将卷内目录和备考表分别装订在案卷的首页和末页。

6.档案盒脊背标签需用电脑打印后贴上。

7.档案扫描完成后,要进行细致认真的装订。档案装订应尽可能地按照原来的装订孔进行穿线装订,尽量不要新打孔装订,保证纸张的平整、抚平边角,力求保护原件。应遵循“两对齐”要求,即装订线一侧边缘对齐,档案内页下边缘对齐。个别原来没有卷内目录的卷,要把补录的目录打印出来归入卷宗。

8.装订后应逐页检查无误后再装盒,不允许出现掉页、倒装页、反订页及粘页等问题,确保档案还原质量。

3.10数据挂接

在本项目中,在对档案原件进行扫描、图像处理、图像质检合格后,需要建立档案目录信息与扫描图像文件的关联关系,数据挂接人员可以利用“数字化管理系统”中的“数据挂接”功能,根据文件的档号将目录数据与图像文件进行对接,建立档案目录信息与扫描图像文件的对应关系。

数据挂接人员在处理完每一卷档案后,需要在《流程单》上填写数据挂接相关信息(如挂接人、挂接时间等信息)、记录数据关联后的页数,根据《数据挂接报告》核对每一份文件关联后的页数与档案整理、扫描时填写的页数是否一致,不一致时应注明具体原因和处理办法,并提交用户项目管理人员审核同意后,进行处理。同时利用“数字化管理系统”中的“数据挂接”功能,将数据挂接相关信息记载到系统中。

挂接过程中应通过抽检参看原文内容,看文件内容是否与数据所著录的内容一致,图像文件与目录数据对接要做到准确无误。目录数据著录内容与原件有偏差时,应以原件内容为准。

及时对数字化加工文件进行数据汇总。建立数字化加工文件与目录的关联,并通过档案管理软件实现一一对应,其中,扫描文件以卷为单位进行存储,案卷目录应对应到相应图像文件所在的文件夹;卷内目录应对应到相应页数的图像文件。

扫描图像文件命名、排列、组合等根据档案管理员的归档要求设定。所有扫描数据提交前均采用相应质检软件进行批量检测挂接和质量检测,确保目录与对应图像对应挂接的正确率达到100%。确保扫描图像与案卷目录、卷内目录100%挂接正确,数字化成果需要与室藏现有的计算机目录数据校对且一一对应,并将正确的数据导入甲方档案室现有档案数据库中,确保加工扫描成果在招标方所使用的档案管理系统中有效检索和显示。

3.11数据质检

总质检人员利用“数字化管理系统”中的“数据质检”功能,对案卷实体、图像文件以及目录著录信息进行抽检(包括案卷实体的装订情况、目录信息著录情况、图像文件、数据挂接情况、报表输出情况等)。确保扫描图像与实体原件对应的一致性、图像与索引数据对应的一致性。

在无特殊的要求时,案卷实体及图像文件以及目录著录信息分别按照总工作量的50%的比例进行抽检,抽检工作将按照阶段验收周期进行,每次抽检结束后必须出具《数字化项目实施数据质量抽检报告》;

如在抽检的过程中有不合格现象时,必须将抽检问题记录在《数字化项目实施数据质量抽检报告》上,并将抽检报告在当天内反馈给纠错人员,并监督其在当天内完成纠错工作并再次提交成品数据给抽样质检人员进行复检。

总质检人员在处理完每一卷档案后,需要在《流程单》上填写总质检相关信息(如质检人、质检时间等信息),同时利用“数字化管理系统”中的“总质检”功能,将对档案实体的总质检相关信息记载到系统中。

采用软件系统,自动核对的方式以年度为单位进行逐页检查,包括图像数据信息完整性检查、目录数据准确性检查、图像挂接准确性检查等。

质量检查的内容和范围如下:

1)图像数据(含水印)信息完整性检查;

2)目录数据信息准确性检查;

3)数据成品(图像和目录数据信息)完整性检查;

4)文本数据完整性和可用性检查。

3.12数据复核

用户对加工完成的数字化档案进行复核,复核出“不合格”的卷、页、目录和挂接错误,项目组及时免费进行修改。对复核“未通过”的加工批次,则该批次全部退回,项目组重新加工制作。

3.13汇总挂接

档案数字化转换过程中形成的目录数据与图像数据,通过验收确认为"合格"后,在招标方配合下,导入南大之星电系统,批量挂接。

纸质档案数字化过程中分散存储在多台计算机中的目录数据和图像数据,经过质量检查后,按周期汇总到数据服务器端。

3.14数据备份

通过验收通过后的数字化成果(索引目录/图像信息)进行数据的备份,我们将采用阶段性备份的方式进行,在每次阶段性验收后的10个工作日内,由项目经理(或者由项目经理指定人员)负责对本阶段验收的扫描文件进行备份。

1、备份范围:经验收合格的完整数据应及时进行备份。

2、备份方式:为保证数据安全,备份载体的选择应多样化,可采用包括在线备份、光盘备份、硬盘备份。

﹡在线备份

将验收合格的完整数据及时导入管理系统中实行在线存储备份,保证档案的利用与安全。

﹡光盘备份

将加工完成并在多台计算机上检查合格的成品数据刻录到数据光盘(DVD/蓝光光盘)中,并保证光盘读取正确,并可以检索、打印。同时在每片光盘包装盒内及盘片上附光盘标签和光盘目录,标明光盘编号、档案的分类信息和目录信息以及所对应的硬盘编号。

﹡硬盘备份

档案管理员将成品数据采取移动硬盘备份的形式对数据进行一式两份备份,所备份数据要保持一致。如成品数据硬盘出现问题,可及时调用移动备份硬盘。

档案管理员保证硬盘数据备份与光盘数据是一一对应的,如光盘出现问题,可用硬盘还原光盘重新刻录。并且记录移动硬盘盘号、品牌、容量、分区情况、加工技术环境、操作系统、数据库、刻录软件、备份方式、相对应数据的光盘号。

﹡数据检验

包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。

*备份标签

数据备份后应在相应的备份介质上做好标签,以便查找和管理。

*备份登记

填写纸质档案数字化备份管理登记表单,以便利用和管理。

3、备份数据检验:备份数据也应进行检验。备份数据的检验的内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。

3.15 数字化成果管理

经过档案数字化加工后形成的成品完全符合浙江省档案局各项标准。

1)选用在线或离线方式,配合相应的档案管理软件对数字化成果进行管理。

2)加强对纸质档案数字化成果的管理,确保其安全、完整和长期可用。

3)档案数字化成果移交浙江省档案局备份。

4)纸质档案数字化成果提供网上检索利用时,有制作单位的电子标识。

①硬盘存储2套;

②数据成品、扫描加工中形成的交接清单等;

③纸质档案数字化成果交接单。


浙江省杭州市下沙高教园区学源街 | 管理员:金献夫 电话:0571-86835746 | 邮编:310018
 Copyright © 中国计量大学档案馆 2018     备案:浙ICP备09065569号