图书
数字化设备
现在的图书馆数字化和以往的不太一样,甚至说是区别很大因为以往的数字化图书都是要把书拆开一页一页的扫描完成后在把书装订好还回去,这是很麻烦步骤,并且如果是量比较大的话这种方法是不可取的。现代的图书馆数字化都不是之前的高速扫描仪一张一张的扫描了,如今采用的都是非接触式不拆书的扫描设备比如book2net、iscan等等甚至有全自动的扫描机器人kabis可以帮助您来扫描完成成册的图书,一本成册的图书那简直是在谈笑风声间完成。
1、图书内容的分类一本书分为四个部分正文、前言、图片和后记四个部分。1)正文从正文的第一页到正文的最后一页的所有图书页。2)前言正文第一页之前的所有文字页。3)图片 书中不算页码的所有图片。 4)后记正文最后一页到图书结束的所有文字页。
命名规则 正文命名为图书名 -0001 ; 前言命名为图书名 -0002 ; 图片命名为图书名 -0003 ; 后记命名为图书名 -0004 ; 例如:书名为北京市志,一本书按规则将分别命名为: 正文部分为北京市志 -0001 ; 前言部分命名为北京市志 -0002 ; 图片部分命名为北京市志 -0003 ; 后记部分命名为北京市志 -0004 。
扫描时注意阀值,对比度,亮度这三个方面值的调整。这三个值的设置关系到扫描图像的质量和对后期OCR文字处理环节有较大的影响。同时要注意图书页码的顺序,不要缺页,没有重复页码的出现
图像处理及质检1、图像处理 使用专业的书刊扫描仪图像可以自动处理,图像处理环节主要是对扫描的图像进行去黑边、去杂点、校正的处理,保证阅读,同是也是为下一环节OCR文字处理做准备,提高文字识别的正确率。2、图像质检 本环节是对图像处理环节的结果进行质检,进一步保证图像的质量和页码的正确性和对应关系,同时也是进一步提高OCR文字处理环节的文字的识别率。注:如图像处理环节对图像的处理达到标准,此环节可以省略。
数据的保存一定要合理把建立好的目录按时间或者是什么分类进行配置后储存到相应的管理软件中就可以了
图书扫描
图书管理