档案数字化的关键技术
点击蓝字
关注我们

档案数字化的
关键技术
关于档案数字化
档案数字化的每一个阶段都会应用到特定的技术。本章着重述将模拟信息转化为数字信息的数字化加工技术,以及将数字化加工所得信息加以识别以提高计算机处理能力的自动识别技术。数字化档案信息资源的存储、组织、检索和长期维护的技术方法与电子文件存储、组织、检索和长期维护的技术方法趋同。
扫描技术
扫描是通过扫描仪获取档案原文图像的技术。扫描仪的基本工作原理是将光线照到待扫描对象上,感光元件接收到反射光线,再将光波转换为数字信息。
1、扫描仪的技术指标
(1)光学分辨率。
(2)色彩位数。
(3)灰度级。
(4)扫描幅面。
(5)扫描速度。
(6)接口类型。
2、扫描仪的类型
(1)平板式扫描仪。
(2)胶片扫描仪。
(3)鼓式扫描仪。
3.扫描件技术参数的选择
(1)分辨率。
(2)页面大小。
(3)色彩模式和色彩位数。
自动识别技术
目前在档案数字化领域得以应用的自动识别技术主要有光学字符识别技术和图形矢量化技术。另外,语音识别技术也有一定的应用潜力。
(一)光学字符识别技术
1、光学字符识别简介
光学字符识别是指通过扫描仪等光学输人设备读取文字图像信息,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
2、光学字符识别技术的工作过程
(1)图像采集。
(2)图像预处理。
(3)特征抽取。
(4)对比特征。
(5)判断识别。
(6)人工校正。
(7)结果输出。
(二)图形矢量化技术
图形矢量化,是对扫描所得的光栅图像数据加以分析、识别,最终重建其中的图形对象、形成矢量数据的过程。
(三)语音识别技术
语音识别是将语音信号转变为相应的文本或命令的过程。语音识别是一门交叉学科,涉及领域信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等领域。