文档扫描是数字化转型的基石,选择正确的技术对实现理想的结果至关重要。 扫描仪的图像增强功能步进可以显著减少文档的处理时间,还能为自动化工作流程提供更准确的信息。 许多公司都忽略了图像质量相关的瓶颈,但投资于正确技术的回报可以立竿见影。
许多组织都惊讶地发现,准备文档进行数字化的时间和成本比实际扫描流程本身还多。 AIIM 的首席分析师 Bob Larrivee 表示,“当您考虑扫描纸张量时,准备文档可能是一项艰巨的任务。” 他继续说:“我接触过的人中接近四分之一表示,文档准备是他们管理扫描操作时遇到的最大难题,大约相同数量的人表示受到不良文档和异常情况的困扰。”
削减成本、提高效率和优化业务流程让企业压力重重。 关注那些看起来微不足道,但汇集起来可实现大量节省的要素,将会减少扫描的总成本和处理时间。
一个常见挑战是在文档数字化项目中满足利益相关者的图像质量要求。 要求可能因待数字化的文档种类而异;从印刷的表单、信件或嵌入照片的手写应用,或颜色和插图至关重要的图形报告的各种类型之间的输出预期会不同。
询问最终收件人如何在业务工作流程中使用数字化信息:
此类问题的答案将决定最终输出的图像增强需求。
扫描本身是数字化流程中的一小部分。 扫描环境下有一半(或更多)的员工专注于预分类和准备文档的情形并不鲜见。 即使扫描操作中处理的都是相同类型的文档(如发票),操作员面临的挑战也有很多,包括多种不同的纸张类型和文件尺寸,文档包含不同彩色背景或混合横向和纵向。 通常,员工需要花费时间依据这些属性手动分类文档,而不是运用技术处理它们。 理想的扫描仪可自动完成这项工作,从而节省额外的人力成本。
此外,被认为具有挑战性的文档,需要更多的手工操作来分离。 如果工作中遇到难以读取的文档,可通过不同的设置以单独批次的形式进行扫描(通常以更高的分辨率),这会导致不必要的大文件大小或增加背景噪声级别。 常规文档流中没有图像增强功能,如果仍沿袭此处理方式,质控检查人员往往会拒收它们。 这种情况会导致重新扫描,或需要手动编排索引或提取数据。 这是否为典型、令人惊讶的问题,需要应对措施? 扫描操作员需要使用复印机在高对比度设置下重新打印文档。 这是一项繁重的手动工作,会降低操作速度,并增加本可轻松避免的成本。
使用光学字符识别 (OCR) 时,图像质量很关键——扫描的文档模糊不清,图像不清晰或文字浅淡,将导致识别不良,并将影像 OCR 结果。 即使 OCR 读取率只降低一个百分点,进行不必要的异常处理也会产生显著的成本。
如果文档未通过质量控制检查或未成功进行 OCR 识别则需要重新扫描并手动输入索引字段,这需要花费时间和金钱。 异常处理的程度也会对业务效率产生负面影响。它会影响业务成功指标(如索赔处理时间),最终对客户满意度产生连锁反应。
输入刚收到的混合批次文档的能力,无需牺牲速度并确保一致的高质量输出,将为组织带来提高盈利的巨大机遇。 这也大大减少了手动预分类文档所浪费的时间。
Kodak Alaris 高级图像处理团队的目标是随着时间推移彻底消除文档准备过程。 Kodak Alaris 在图像科技方面有着悠久的传承,专注于为各种文档提供无与伦比的图像质量。 完美页面技术可提供先进的图像增强功能,甚至可处理极具挑战的文档和混合文档批次。 本指南其余部分介绍了完美页面技术的所有核心功能。 当您考虑进行下一笔扫描仪投资时,请务必考量技术的方方面面,包括帮助企业节省时间、降低成本和提高扫描操作准确性。 请继续读下去,了解完美页面技术如何增强许多最常见、最具挑战性的各类扫描应用的图像质量的详情。
纠偏和自动裁剪: 外来信件很少能到达井然有序的堆栈,尤其是在混合各种大小文档的情况下。 图像需要校直(或纠偏)才能在未来流程中使用,例如自动识别文本、笔迹或检查标记。 图像校直后文档的四边才能平行于输出图像的边缘。 黑色边框的去留视扫描应用而定。 如下面的第一个图像所示,文档若有明显的黑色背景,则会影响图像的进一步使用。 因此,关键是裁剪图像,采集文档中最具代表性的区域。
糟糕的裁剪会让在表单中查找数据变得困难重重。 大多数软件“查找”数据的方式仍是将文档四个角作为定位点而非“基准点”,这是更好的选择。 对于较长的文档,裁剪需要基于四角分析而非两个角加长度的方法,通过此方法裁剪非完美矩形页面会取得出色的结果,如下面的示例所示。
自动调整方向: 将成批的纵向和横向混合的文档送入扫描仪,并完美定向一系列图像,可大大提升效率。 企业有时需要进行横向扫描来提高吞吐速度,或避免影响进纸的文档问题,如粘性边缘。
大多数时候,首先将横向文档旋转固定的 90 度不失为一个良好的开端。 若准备过程中出现文档滑动,扫描仪必须足够智能才能做到实时方向调整。
自动调整方向应基于内容,检测和纠正文档的方向,而不管它们的进纸方式。 对于横向双面扫描,采用默认旋转和自动调整方向组合是明智之举。 对于从事国际工作的组织来说,无论使用的是什么语言,此方法都需要奏效。
自动校正亮度: 不需要使用复印机来改变低对比度文档的亮度。 扫描技术自动调整图像亮度达到最佳,这在处理彩色和灰度文档时不会降低速度或吞吐量。 此功能可使每幅图像中最明亮的色彩尽可能鲜明,并让最暗的色彩尽可能深,文档的图像质量和可读性都将得到显著提升。 它对于文档的存档非常有益。
锐化: 通过增强图像中边缘的对比度,使图像内的对象显得更加“活跃”。 此功能可改善文档的外观,进而加快 OCR 读取速度。
智能背景颜色平滑: 彩色或灰度图像中的背景色可能不均匀。 图像平滑功能可最大限度地减少色差,同时提供“更干净”的图像,看上去更像数字化文档。 这通常会减少压缩图像的大小。 如果文档或表格需要突出前景(例如文本,线条等),可以通过智能前景突出功能来增强。
去除条纹: 条纹过滤技术解决了最常见的图像质量问题之一——处理原始的非纠偏图像上的垂直黑线。 条纹问题通常缘于扫描仪外壳下面随着时间推移积聚的灰尘。 定期清洁可以避免这种问题的出现,但图像增强技术可以在此问题出现后去除或减少条纹。
减少噪声: 灰尘或纸张质量较低(如再生纸)造成的小(或较大)点(通常称为“噪声”)的出现,是彩色文档转换为黑白图像的另一个常见挑战。 噪声消除算法通过去除单个点(孤立像素)、像素(多数法则)甚或更大的像素组(去除背景噪声)来改善文档外观。
所有颜色滤色: 自动化表单处理过程中的一个标准做法是使用滤色功能,即通过优化黑白图像来提高 OCR 读取率。 企业通常需要使用运用了混合滤色功能的表单。 智能技术可以智能识别并以电子方式去除多种主要或预定义的颜色,从而减少手动操作并确保最佳的读取速率。
双流扫描: 在黑白扫描进行的同时生成彩色扫描是十分重要的。 在是存档和处理过程中,彩色图像通常是各种人工交互的首选。 要自动化处理数据索引或提取,需要优化的双色调(黑白)图像。 双流扫描功能可在扫描过程中创建这两种文件。
照片分割: 文档包含文本和图片(如护照申请或保险索赔)时需要区别对待。 该技术可区分照片和文本区域,对每个区域运用不同的处理技术,然后将照片裁剪功能应用于彩色图像。 如果需要双色调图像,自动抖色技术可使照片看起来像灰度图像,而条形码等其他元素不会被抖色处理,确保了可识别性。
改进 OCR 读取速率和二进制化“智能阈值处理(iThreshholding)”: 二进制化(即彩色图像到黑白图像的转化)是所有数据提取功能的核心,因此也是任何图像处理的基础。 如果一批文档的质量参差不齐,文档彼此的二进制化和增强需求不同。 智能技术可分析文档图像的前景和背景,评估亮度和对比度,然后动态设置最佳的阈值。 这能优化整体图像质量和文件大小,特别是对导致字符识别问题的阴影/半色调文档。
总结
先进的图像处理技术可简化文档准确数字化和交付至业务系统的方式。 完美页面技术提供了提高图像质量的多种技巧,无需在文档的准备或扫描过程中进行繁琐的手动操作。 本文所介绍的完美页面功能只是我们屡获殊荣的文档扫描仪和扫描软件功能的冰山一角。 合作伙伴和客户将完美页面技术视为 Alaris IN2 生态系统中扫描仪和软件的主要优势之一。 当您评估新的文件采集解决方案时,着重考虑上述这些方面将有助于降低您的总体拥有成本。 在您评估供应商时,要求他们演示其图像质量,并评估其对文档的准备流程和后期扫描流程及相关成本的影响。
完美页面技术使您能够:
完美的页面技术是 Alaris IN2 Ecosystem 不可或缺的一部分,并彰显了 Kodak Alaris 相关的卓越图像质量。 Alaris IN2 Ecosystem 集一流的扫描仪、软件、服务和合作伙伴关系于一身,旨在简化信息采集,使客户能够将数据混乱转化为提高效率的关键信息。
Kodak Alaris 是广受认可的数据采集及智能文档处理解决方案的提供商,致力于简化业务流程。我们的宗旨是以数十载的影像科学创新为后盾,通过智能化、互联的解决方案帮助各行各业的用户实现有效的信息利用。在全球直接提供和通过我们的渠道合作伙伴网络提供屡获大奖的扫描仪、软件和服务。
隐私声明 | 法律/网站条款 | 加州收集通知 | 不要分享我的个人信息
© 2024 Kodak Alaris Inc. TM/MC/MR: Alaris、ScanMate。所有商标和商品名称是各自拥有者的财产。柯达商标和商品外观是在取得 Eastman Kodak Company(伊士曼柯达公司)的授权下使用。