書類をスキャンすることはデジタルトランスフォーメーションの最初のステップで、正しい結果を得るためには適切な技術を選択することが重要です。 スキャナーのイメージエンハンスメント機能は、書類をスキャンしてデータとして取得する時間を大幅に削減し、自動化されたワークフローにより正確な情報をにもたらします。 残念ながら、多くの企業では画質にかかわる問題点が見落とされていますが、適切な技術に事前に投資することはすぐに大きな成果をもたらします。
多くの組織は、デジタル化のための書類の準備の方が、実際のスキャンプロセスよりも時間とコストが消費されることが分かると驚きます。 AIIMのチーフアナリストの、Bob Larrivee氏は、「スキャンする紙の量を考慮すると、書類の準備がとても大きな作業になる場合があります。」と語っています。 さらに「私が話した4分の1近くの人は、書類の準備がスキャン作業を管理するうえで最大の課題だと言い、およそ同数の人がコンディションの悪い書類や規格外の書類に悩まされています。」と続けています。
企業は、コストを削減し、効率を高め、ビジネスプロセスを最適化するという圧力に直面しています。 スキャンの総コストは、それ自体はささいなことに思える要素に注意を向けることで、作業処理回数と合わせて削減でき、最終的に大きな節約になります。
共通の課題は、書類のデジタル化プロジェクトの中で、そのステークホルダーの画質要求を満たすことです。 要求はデジタル化する書類の種類によって異なる場合があります。印刷された書式、写真が埋め込まれた通信文や手書きの登録フォーム、色やイラストが重要なグラフィックレポートなど、種類によってアウトプットの要求が異なります。
デジタル化された情報をビジネスワークフローでどのように使用するかをその最終利用者に確認します。
これらのような質問への回答で、最終出力のイメージエンハンスメントの必要性を判断します。
スキャン自体はデジタル化プロセスのごく一部です。 半分(またはそれ以上)の人的スタッフが書類の事前仕分けや準備作業に取り組んでいるのを目にすることは、スキャン作業環境において珍しいことではありません。 請求書など同じ書類タイプを処理するように設定されたスキャンの操作であっても問題はたくさんあります。オペレーターは、複数の異なる用紙の種類や書類サイズ、背景色の違い、横向きと縦向きが混在する書類に対応しなければなりません。 優れたテクノロジーを活用するのではなく、書類の属性別に手作業で仕分けることにスタッフの時間が費やされています。 適切なスキャナーを使えば自動でこの作業を行うことができるため、余分な作業にかかる労働コストを削減できます。
さらに、スキャンが困難そうな書類を選り分けるといった作業もあります。 読みにくい書類がジョブ中に見つかると、異なる設定(多くの場合、より高い解像度で)の個別バッチでスキャンさせるため、その結果、無駄に大きなファイルサイズになったり、背景ノイズのレベルが上がったりします。 イメージエンハンスメント無しで書類を標準フローのままスキャンすると、品質管理チェックによって書類は拒否されることがあります。 これにより、再スキャンを行うことになったり、インデックス処理やデータ抽出を手動で行う必要が生じたりします。 この問題への驚くべき解決方法は、スキャンのオペレーターが、コピー機を使ってコントラストの設定を高くして書類をコピーしたものを再度スキャンすることです。 この対応は作業を遅らせコストがかさむ大変な手作業ですが、こうしたことを解消する方法があります。
光学式文字認識(OCR)を使用する際は画質が重要です。染が付いていたり、画像が不鮮明であったり、テキストが明るすぎたりして、ぼんやりと不完全にスキャンされた書類は認識しにくく、OCR結果の精度が損なわれます。 OCR読み取り速度が1%下がっただけでも、不要な例外処理に相当なコストが発生する可能性があります。
品質管理チェックをパスできなかった書類とOCR処理中に認識されなかった書類には、再スキャンとインデックスフィールドの手作業での入力が必要となるため、時間とお金の両方がかかります。 例外処理の程度によってはビジネス効率にさらなる悪影響を及ぼします。これは、請求処理などのビジネス処理に影響し、最終的に顧客満足度にも悪影響を及ぼします。
速度を犠牲にすることなく、一貫した高品質な出力を確保しつつ、混在したバッチを最初と同じように給紙する機能は、企業収益を向上させる大きな機会を提供します。 手動での書類の事前仕分けに費やす無駄な時間も大幅にカットできます。
傾き修正および自動クロッピング: 送られてきた書類が、きちんと整理された状態で届くことはめったにありません。書類のサイズが入り混じっている場合は特にそうです。 テキスト、手書き文字、チェックマークの自動認識といったプロセスで使用するため、イメージを真っ直ぐに(または傾き修正)する必要があります。 書類の端が出力イメージの縁と平行になるようにイメージを真っ直ぐにする必要があります。 スキャン用途によって、黒枠が必要な場合や必要ない場合があります。 下の最初の画像で示すように黒が多い背景の書類は、その画像をさらに使用する際に影響を及ぼします。 そのため、単に書類だけの領域をキャプチャするためにイメージをクロッピングすることが重要です。
不適切なクロッピングによって、フォーム上のデータの検索に問題が生じる場合があります。 ほとんどのソフトウェアは未だに、より良いオプションにもかかわらず「基準」ではなく、書類の角をロケーターポイントとして使用してデータを「検索」しています。 長尺原稿の場合、クロッピングは2つのコーナー+長さの方法ではなく4つのコーナー分析に基づく必要があります。これは下の例に示すように、完全な四角ではないページに対して優れた結果をもたらします。
自動方向検出: 縦方向や横方向の書類が混在するバッチをスキャナーに給紙しても上下方向が統一された一連のイメージを実現する機能は、効率が大幅に向上します。 ビジネスの現場では、読み取り速度を速めるために横向きにスキャンする、または端がべたついているなど給紙に影響する書類の問題を避ける必要があります。
大抵の場合、適切な最初のステップとして横向きの書類の回転を90°に固定します。 準備中に書類がスリップした場合に、すぐに方向調整を行える機能がスキャナーには必要です。
自動方向検出は、書類の給紙方法に関わらずその向きを検出して修正するため、コンテンツベースである必要があります。 横向きの両面スキャンの場合は、デフォルト回転と自動方向検出の併用をお勧めします。 また、グローバル企業の場合は、使用言語にかかわらずこの機能が必須となるでしょう。
明るさの自動調整: 低コントラストの書類の明るさを変更するのにコピー機を使う必要はありません。 独自のスキャニングテクノロジーにより自動的にイメージの明るさを最適に調整します。これはカラーおよびグレースケール書類で、スピードまたは生産性を損なうことなく機能します。 各イメージの一番明るい色を可能な限り明るく、一番暗い色を可能な限り暗くすることで、画像の認識と書類の読みやすさの両方が大幅に向上します。 この機能は書類の保管に有効です。
シャープニング: イメージ内のエッジのコントラストを上げることで、自動シャープニングはイメージのオブジェクトを「より鮮明」にします。 これにより、OCR読み取り速度を上げるため書類のテキストが強調されます。
インテリジェントな背景色のスムージング: カラーイメージまたはグレースケールイメージの背景色は不均一です。 イメージのスムージングにより色のばらつきを最小限にして、デジタルで作成した書類のように見える「よりきれいな」イメージを実現します。 通常、圧縮イメージのサイズも縮小します。 前景(例えば、テキスト、線など)をさらに目立たせる必要のある書類やフォームは、インテリジェントな前景強調によって強調できます。
縦縞除去: 縦縞フィルタリング テクノロジーは、最も一般的な画質の問題の1つ(傾き修正されていない元のイメージ上の黒い縦線)に対処します。 これは、時間とともにスキャナーのハウジングの下に積もった埃によって頻繁に引き起こされます。 これを避けるには定期的なクリーニングが必要ですが、縦縞が発生した場合はイメージエンハンスメント テクノロジーによってそれを除去または削減できます。
ノイズ低減: カラー書類を白黒イメージに変換する際のもう1つの課題は、ゴミや再生紙のような低い紙質に起因する、一般に「ノイズ」と呼ばれる小さな(またはより大きな)ドットの出現です。 ノイズ除去アルゴリズムは、単一ドット(孤立ピクセル)、ピクセルグループ(マジョリティルール)、またはさらに大きなピクセルグループ(背景ノイズ)を除去し、画質を改善します。
全カラードロップアウト: カラードロップアウトは、OCRの読み取り速度を向上させるために最適化されたモノクロイメージがフォーム処理中に使用される標準的な技法です。 企業では、しばしば異なるドロップアウトカラーを混在させたフォームを使用します。 インテリジェントカラードロップアウトは、複数の主調色または事前に定義された色を識別し電子的に除去して手作業による作業を減らし最適な読み取り速度を確保します。
デュアルストリーム: カラースキャンと同時に白黒でデータを生成することは重要です。 カラーイメージは、通常、保管目的およびスキャン処理中のやり取りに便利です。 データのインデックス処理または抽出を自動処理する場合は、最適化された2色(モノクロ)イメージが必要です。 デュアルストリーム機能でスキャン処理中に両方の種類のファイルを生成します。
フォトセグメンテーション: パスポート申請や保険金請求のようなテキストと写真の両方を含む書類は、別々に取り扱う必要があります。 写真をテキスト領域と区別することで、各領域に異なる処理技術を適用し、カラーイメージにフォトクロッピングを適用することができます。 モノクロイメージが必要な場合は、自動ディザリング技術を使用して写真をグレースケール画像のように見せることができますが、バーコードなどの他の要素は認識部分を確保するためにディザリングされません。
OCR読み取り速度の向上と「iThreshholding」の二値化: 二値化、すなわちカラー画像から白黒2階調画像への変換は、すべてのデータ抽出機能の中核であり、そのためすべての画像処理の基礎となります。 異なる品質の書類が混在するバッチでは、二値化とエンハンスメントの要件が書類ごとに異なります。 インテリジェントテクノロジーは、書類画像の前景と背景を分析し、明るさとコントラストを計算して、最適なしきい値を動的に設定します。 これにより、特に文字認識に問題のある影付き/ハーフトーン書類の場合、全体的な画質とファイルサイズが最適化されます。
結論
高度な画像処理により、書類が正確にデジタル化され、ビジネスプロセスに受け渡す方法を効率化することができます。 パーフェクトページ テクノロジーは、書類の準備中またはスキャンプロセスをさらに進める中での多くの面倒な手作業を必要とせずに、画質を向上する多くのテクノロジーを提供します。 本稿で説明した機能は、当社の受賞歴のあるドキュメントスキャナーとスキャニングソフトウェアのラインアップで利用可能なパーフェクトページ機能のほんの一部です。 パートナーとお客様は、パーフェクトページをAlaris IN2 Ecosystemの一部であるスキャナーとソフトウェアの重要な要素の1つとみなしています。 新しいドキュメントキャプチャソリューションを評価する際には、総所有コスト(TOC)に与える影響の観点から、必ずこれらの側面を重視してください。 お取引のあるベンダーに実際の画質の確認、書類の準備とスキャン後のプロセスへの影響、および関連コストのレビューをご依頼ください。
パーフェクトページ テクノロジーでできること:
パーフェクトページテクノロジーは、Alaris IN2 Ecosystemの中核となる要素であり、コダックアラリスの優れた画質を支えています。 Alaris IN2 Ecosystemは、情報キャプチャの複雑さを取り除くために設計された最高クラスのスキャナー、ソフトウェア、サービス、パートナーシップの強力な組み合わせであり、お客様はデータの混乱を重要な情報に変えて効率性を高めることができます。
コダック アラリスは、ビジネスプロセスを簡素化する情報キャプチャおよび インテリジェントドキュメントプロセッシングソリューションの大手プロバイダーです。 数十年にわたるイメージサイエンスの革新がもたらしたスマートな コネクテッドソリューションで、世界中の人々が情報を活用できるようお手伝いします。 コダックの受賞歴のあるソフトウェア、スキャナー、プロフェッショナルサービスは、 世界中のチャネルパートナーを通じてご利用いただけます。
プライバシーに関する通知 | 法律/サイト規約 | カリフォルニア州の収集に関する通知 | 個人情報を共有しないでください
© 2024 Kodak Alaris Inc. TM/MC/MR:Alaris, ScanMate. 使用されているすべての商標および商品名は、各権利保持者の所有物です。コダックの商標およびトレードドレスはイーストマンコダック社の許可のもとに使用しています。