光学文字認識へのガイド

OCRとは何か、その仕組み、そしてOCRが私たちの私生活および職業生活に非常に重要である理由を学びましょう。

あなたは知らないかもしれませんが、あなたは専門家が古いテキストや古代の歴史的テキストを解読するのを助ける重要な役割を果たしてきました。あなたが人間であることを証明するためにWebサイトでCaptchaに入力するたびに、あなたはこの貴重なプロジェクトに貢献しています。さらに、光学式文字認識(OCR)と呼ばれる最新のテキスト変換テクノロジーにも関与しています。 それでは、OCRとは何でしょうか? それはあなたの生活の中で他にどのような隠された役割を果たしていますか? この重要な最先端テクノロジーについて知っておくべきことは次のとおりです。

OCR文字認識機能は、毎日使用するたくさんのツールを支える最先端のテクノロジーです。簡単に言えば、スキャンしたドキュメントをコンピュータが読み取れる形式に「変換」するソフトウェアの一種です。

OCRがないと、コンピュータはスキャンした各ドキュメントを1つの画像として認識します。これは、写真や芸術作品の見方です。その形式では、コンピュータは個々の文字、単語、またはフレーズを認識できません。このため、コンピュータ、つまりあなたや他のユーザーがドキュメントを操作する方法が制限されます。

OCRスキャンソフトウェアを使用すると、コンピュータは、Word、Excel、または同等のプログラムで作成するテキストベースのドキュメントと同じように、スキャンしたドキュメントを「見る」ことができます。これにより、コンピュータが有効になり、その結果、元のデジタルドキュメントと同じようにスキャンされたドキュメントを操作できるようになります。これには以下が含まれます。

  • 検索機能の使用
  • 編集
  • 比較および分析ツールの使用
  • 情報の処理、保存、取得、共有

OCR文字認識機能を使用して、印刷されたテキストを変換できます。これには、手書きデータと人間がマークしたデータをキャプチャするように設計された2つの関連プロセスが含まれます。

  • インテリジェント文字認識機能 (ICR):構造化されたフォームなどの、印刷された文字や手書きの文字をキャプチャして変換するプロセス
  • 光学式マーク認識機能 (OMR):多肢選択式の調査、アンケート、テストなどのドキュメントフォームから人間がマークしたデータを線または影付きの領域でキャプチャするプロセス

これらの認識ソフトウェアソリューションを組み合わせることで、さまざまな用途や状況で役立ちます。

OCRの動作

1. 拡張機能
OCRソフトウェアがドキュメントを間違いなく翻訳できるように、業界をリードするKodak Alaris のパーフェクトページテクノロジーなどの画像エンハンスソフトウェアが、まずスキャンを「クリーンアップ」し、ドキュメント上の不要なノイズを低減し、データを増強します。画像が鮮明であればあるほど、翻訳は良いものかつ正確なものとなるため、パーフェクトページテクノロジーは以下のような一般的なスキャンおよびドキュメントのエラーまたは問題を自動的に見つけたり訂正したりします。

  • 傾いたまたは歪んだスキャンの調整
  • コンピュータの「表示」で点、線、およびその他の印刷上の欠陥を取り除く
  • 染みおよびその他の印刷されないページ上の欠陥を補う
  • 欄、画像、表、およびその他のフィーチャーのレイアウトを分析

パーフェクトページテクノロジーはKodak Alarisスキャナーのポートフォリオに組み込まれており、可能な限り小さなファイルサイズを作成する一方で、データの明瞭さを最適化しOCR精度を最大化します。その結果、Kodak Alarisのスキャナーは競合相手より20~70%速い* OCR読み取り速度を提供し、競合デバイスのおよそ半分のファイルサイズを作成します。

2. 分類
データが変換されてエンハンスされると、OCRプロセスの次の手順は、どのドキュメントの種類がシステムに入っているのかを理解し、そのドキュメントの種類に対する次の手順を決定することです。

OCR、ICR、およびOMRにより、Kodak Capture ProおよびKodak Info Input Solutionなどのキャプチャソフトウェアがどの種類のドキュメントが取り込まれたのかを判断できます。続いて、ソフトウェアは画像を取得してドキュメントの内容、ドキュメントのレイアウト、バーコード、またはインデックス作成データに基づいて分類規則を実施します。

分類は、ドキュメントが例えば、請求書、患者記録、融資ファイル、または納税記録かどうかを判断します。そして、当社のInfo Input Solutionは、ドキュメントの分類が「できるように」たった1つまたは2つのサンプルで高度なドキュメントキャプチャを行うことができます。

Kodak Alarisは、特許を取得した機械学習アルゴリズムを通じてこれを達成しました。システムは、コンテンツ、画像、バーコードの検索、および1つのドキュメントのマージなどデータを分類するために様々な技法を使用します。分類する何らかのドキュメントにおけるシステムの信頼性が低い場合、確認のために人間のオペレーターを要請することができます。これはちょうどコンピューターがCaptchaを使用して解読できない古いテキストを確認するよう要請されるようなものです。

3. データの抽出
OCR プロセスにおける最後の手順は、データの抽出です。

メタデータまたはインデックスデータとしてドキュメントから最も重要な情報を抽出することは、検索および処理にとって極めて重要です。規則に基づいた自動分類は、どの主要情報が文書内に存在すべきで、多くの場合、この情報がどこに配置されるべきかをシステムに伝達します。

Kodak Alarisのソフトウェアソリューションは、パターンおよびフィーチャー認識機能を使用して文書内のテキストを特定することができます。スキャン中の言語を特定し、テキストを個々の文字、単語、文章、および段落にソートします。

次に、その情報を展開しコピーを作成して、プロセスの次の段階のメタデータとして使用します。ドキュメントの場合、メタデータはドキュメントを整理、検索、および/または別の種類の業務システムに給紙するために使用できます。

これらのソリューションを使用して、データベースの検索を通じて企業が必要とする業務上の規則および情報に基づいてデータを抽出することができます。インデクシングプロセスをセットアップして、ドキュメントから主要データを自動的に抽出し(バーコード、OCR、ICR、またはOMRを使用)、処理時間を短縮することができます。

OCRが重要な理由

OCRテクノロジーは、個人的な領域と専門的な領域の両方で多くの利益をもたらします。OCR文字認識ソフトウェアを使用すると、ほとんどすべての素材から印刷されたテキストを翻訳し、以下が可能になります。

    絶版本やその他のテキストのスキャンされたコピーを含むドキュメントを検索する
  • スキャンしたドキュメントをすばやく正確に分析、編集、比較する
  • 他の方法ではできなかった情報を共有する
  • スキャンしたドキュメントに音声読み上げソフトウェアを適用して、他の方法では読むことができなかった聴衆がドキュメントにアクセスできるようにする
  • ドキュメントをよりコンパクトな形式で保存し、重要なドキュメントの安価なデジタルバックアップを保持する
  • セキュリティと認証の目的で、ドキュメントをリアルタイムでデジタル処理する
  • 職場での時間のかかるエラーが発生しやすいデータ入力の必要性を軽減する
  • オンラインで検索可能な系図データベースに歴史的文書をアップロードする

あなたがそれに気付いているか否かに関わらず、これらの機能の多くを毎日使用しています。さらに、それを使用する他の従業員や組織からも恩恵を受けます。 例えば、自動車のナンバープレートを識別するためにOCR技術を警察が使用することで私たちの安全を維持する彼らの任務に役立ちます。銀行が使用するOCRの形式のデジタル署名認識は、個人情報窃盗の予備群によるあなたの財産の入手および浪費を防ぎます。

様々な業界におけるサービスプロバイダーは、OCRを使用して契約書をスキャン、アップロード、比較、および編集することができるため、これらのすべての手順に対して個々に料金を支払う必要がなく、お手頃な価格と高速なサービス提供できます。旅行中にGoogle翻訳などのアプリを使用して看板やラベルを翻訳するたびに、あなたはOCRの恩恵を受けます。

職場におけるOCR

OCRは、職場において特に効果的です。例えば、企業はOCRソフトウェアで既存のドキュメントをスキャンして音声変換プログラムと互換性のあるフォーマットに直ちに変換することができます。

これにより、目標を達成するために長い年月および莫大なお金とスタッフの時間を必要とすることなく、企業がADA承認基準を満たすことができます。さらに、これにより企業は視覚障害を持つお客様の要求にリアルタイムで応えることができます。

医療等の他の業界において、OCRテクノロジーは文字通り生命を救うことができます。OCR用のスキャンソフトウェアは、患者の病歴における膨大な情報をアクセスしやすくしたり危険なミスを防いだりする方法で節約、検索、および検証を可能にすることができます。

Kodak AlarisとOCR

Kodak Alarisは、個人用であれ専門家用であれ、ドキュメントのスキャンにおいてOCRが果たす重要な役割を理解しています。そのため、すべてのスキャナーに無料で高度なOCRソフトウェアを提供しています。

当社のスキャナーは、他のデジタルツールとシームレスに連携するように設計されています。スマートデバイスからアプリ、メールなどの古いスタンバイまで、当社のプログラムはすべてのデジタルインフラストラクチャで機能します。情報がシステムに入る方法や場所に関係なく、情報の移動、保存、共有を簡単に行うことができます。

Kodak AlarisのOCRスキャンソフトウェアは、以下のことに対してお客様を支援してきました。

  • ビジネスの成長
  • 革新
  • 節約
  • 効率を上げる
  • サービスと顧客満足度を向上させる
  • 環境フットプリントを最小限に抑える

当社の技術は、一流の技術支援プログラムに支えられ、購入によって毎回最大限のメリットを得られるようになっています。Kodak Alarisの個人向けまたは専門家向けアプリケーションに関心があるかどうかにかかわらず、当社は適切なハードウェアソフトウェア、およびサポートソリューションを提供します。

関連項目アラリスがスキャンテクノロジーを使ってどのように革新するのか

詳細

Kodak AlarisのOCR文字認識ソフトウェアは、スキャンを基本的なものから素晴らしいものへと変えます。Kodak Alarisのソフトウェアとスキャナーが現在提供できるものに関する詳細は、最寄り代理店のパートナーをご覧ください。

* Kodak Alarisが委託し、BLIが実施したサードパーティのテストに基づいています。試験はKodak Alarisによって設計され、すべてのデバイスが同様の操作条件で試験され、同様の操作方法で試験されました。

関連ソリューション

Alaris Capture Pro

Capture Pro ソフトウェア

  • 紙を多用するビジネスでの用途に最適
  • ECMシステムとの広範囲にわたる統合
  • ネットワークモジュールおよびインポートモジュールが利用可能
smart touch

スマートタッチアプリケーション

  • ワンタッチのシンプルさで複雑な複数の手順のスキャンプロセスを排除
  • 特定のスキャンニーズに合わせて最大20の異なる機能を設定
  • ドキュメントをファイルの場所または一般的なクラウドサービスに簡単にスキャン

連絡先

お問い合わせは、下記の情報リクエストフォームにご記入ください。すぐにご連絡いたします。

「お問い合わせにおける個人情報の取扱いについて」