Guide to Optical Character Recognition

Nov 18, 2020

Sie wissen es vielleicht nicht, aber Sie haben eine Schlüsselrolle dabei gespielt, Experten bei der Entschlüsselung alter und sogar uralter historischer Texte zu helfen. Jedes Mal, wenn Sie auf einer Website ein Captcha ausfüllen, um zu beweisen, dass Sie ein Mensch sind, tragen Sie zu diesem wertvollen Projekt bei. Darüber hinaus sind Sie Teil einer modernen Textumwandlungstechnologie, der optischen Zeichenerkennung (OCR). Aber was ist OCR? Welche anderen versteckten Rollen spielt es in Ihrem Leben? Hier erfahren Sie, was Sie über diese wichtige hochmoderne Technologie wissen müssen.

Optische Zeichenerkennung ist eine hochmoderne Technologie, auf die Dutzende von Werkzeugen zugreifen, die Sie jeden Tag verwenden. Einfach ausgedrückt, handelt es sich um eine Art Software, die gescannte Dokumente in ein Format „übersetzt“, das Ihr Computer lesen kann.

Ohne OCR nimmt Ihr Computer jedes Dokument, das Sie scannen, als ein einzelnes Bild wahr, so wie wir Fotos oder Kunstwerke sehen. In diesem Format kann Ihr Computer keine einzelnen Buchstaben, Wörter oder Sätze erkennen. Dies schränkt die Möglichkeiten ein, wie Ihr Computer, und damit Sie und andere Benutzer, mit dem Dokument interagieren können.

OCR-Scansoftware ermöglicht es Ihrem Computer, ein gescanntes Dokument auf die gleiche Weise zu „sehen“, wie er textbasierte Dokumente sieht, die Sie in Word, Excel oder ähnlichen Programmen erstellen. Dies ermöglicht es Ihrem Computer und damit auch Ihnen, mit gescannten Dokumenten genauso umzugehen wie mit digitalen Originaldokumenten. Dazu zählen u. a.:

  • Suchfunktionen verwenden
  • Bearbeiten
  • Verwendung von Vergleichs- und Analysetools
  • Verarbeiten, Speichern, Abrufen und Weitergeben von Informationen

Die optische Zeichenerkennung kann verwendet werden, um gedruckten Text zu übersetzen, und umfasst zwei verwandte Verfahren, die für die Erfassung von Handschrift und von durch Menschen markierte Daten entwickelt wurden:

  • Intelligente Zeichenerkennung (Intelligent Character Recognition, ICR): Der Prozess des Erfassens und Übersetzens von handschriftlichen und geschriebenen Zeichen, wie z. B. auf strukturierten Formularen
  • Optische Markierungserkennung (Optical Mark Recognition, OMR): Der Prozess der Erfassung von durch Menschen markierte Daten aus Dokumentenformularen wie Multiple-Choice-Umfragen, Fragebögen und Tests in Form von Linien oder schattierten Bereichen

Zusammen sind diese Erkennungssoftwarelösungen in einer Vielzahl von Anwendungen und Situationen nützlich.

Wie funktioniert OCR?

1. Verbesserung
Damit eine OCR-Software ein Dokument erfolgreich übersetzen kann, wird eine Bildverbesserungssoftware wie die branchenführende Perfect Page Technologie von Kodak Alaris Ihre Scans zunächst „bereinigen“, um unnötiges Farbrauschen auf einem Dokument zu reduzieren und die Daten klarer darszustellen. Je sauberer das Bild, desto besser und genauer die Übersetzung. Daher sucht und korrigiert die Perfect Page Technologie automatisch gängige Scan- und Dokumentenfehler oder Probleme wie z. B.:

  • Abgleich für schräge oder verzerrte Scans
  • Entfernen von Flecken, Linien und anderen Druckfehlern nach „Ansicht“ des Computers
  • Kompensieren von Flecken und anderen nicht gedruckten Unregelmäßigkeiten auf der Seite
  • Analysieren des Layouts von Spalten, Bildern, Tabellen und anderen Funktionen

Die Perfect Page Technologie ist in das Kodak Alaris Portfolio von Scannern integriert ist, um die Datenklarheit zu optimieren und die OCR-Genauigkeit zu maximieren, während gleichzeitig die kleinstmöglichen Dateigrößen erzeugt werden. Das Ergebnis: Scanner von Kodak Alaris bieten eine um 20-70 % bessere* OCR-Leserate als die Konkurrenz und erzeugen Dateigrößen, die fast halb so groß sind wie die von Konkurrenzgeräten.

2. Klassifizierung:
Sobald die Daten konvertiert und erweitert sind, besteht der nächste Schritt im OCR-Prozess darin, zu erkennen, welcher Dokumententyp in das System gelangt ist, und den nächsten Schritt für diesen Dokumententyp zu bestimmen.

OCR, ICR und OMR ermöglichen es Erfassungssoftware wie Kodak Capture Pro und Kodak Info Input Solution zu bestimmen, welche Art von Dokument eingelesen wurde. Dann kann die Software die Bilder nehmen und Klassifizierungsregeln auf der Basis von Dokumenteninhalt, Dokumentenlayout, Barcodes oder Indexierungsdaten durchsetzen.

Anhand der Klassifizierung wird ermittelt, ob es sich bei einem Dokument z. B. um eine Rechnung, eine Patientenakte, eine Darlehensakte oder einen Steuerdatensatz handelt. Unsere Info Input Solution kann zudem eine erweiterte Dokumentenerfassung mit nur einer oder zwei Vorlagen durchführen, um die Klassifizierung der Dokumente zu „erlernen“.

Kodak Alaris erreicht dies über patentierte maschinelle Lernalgorithmen. Das System nutzt eine Vielzahl von Techniken zur Klassifizierung der Daten: Suchinhalte, Bilder, Barcodes und die Zusammenführung zu einem Dokument. Wenn das System nur ein geringes Vertrauen in ein Dokument hat, das es zu klassifizieren versucht, kann der Prozess einen menschlichen Bediener zur Bestätigung heranziehen - so wie wir aufgefordert werden, alte Texte, die Computer nicht entziffern können, mit Captcha zu verifizieren.

3. Datenextraktion
Der letzte Schritt im OCR-Prozess ist die Datenextraktion.

Das Extrahieren der wichtigsten Informationen aus einem Dokument für deren Verwendung als Metadaten oder Indexdaten ist von entscheidender Bedeutung für das Abrufen und Verarbeiten. Eine automatisierte, auf Regeln basierende Klassifizierung informiert das System darüber, welche Schlüsselinformationen in einem Dokument vorhanden sein sollten und häufig auch darüber, wo diese Informationen zu finden sein sollten.

Softwarelösungen von Kodak Alaris können den Text in Ihrem Dokument mithilfe von Muster- und Merkmalserkennung identifizieren. Sie identifizieren die Sprache des zu scannenden Dokuments und sortieren den Text in einzelne Buchstaben, Wörter, Sätze und Absätze.

Danach extrahiert die Software die Informationen und erstellt eine Kopie davon, um sie als Metadaten für die nächste Phase des Prozesses zu verwenden. Im Falle von Dokumenten können Metadaten verwendet werden, um Dokumente zu sortieren, zu suchen und/oder in eine andere Art von Geschäftssystem einzuspeisen.

Mit diesen Lösungen können Sie die Daten auf der Grundlage von Geschäftsregeln und Informationen, die ein Unternehmen benötigt, durch Datenbankabfragen extrahieren. Benutzer können den Indexierungsprozess so einrichten, dass Schlüsseldaten automatisch aus Dokumenten extrahiert werden (über Strichcode, OCR, ICR oder OMR), wodurch die Verarbeitungszeit verkürzt wird.

Warum OCR wichtig ist

Die OCR-Technologie bietet sowohl im privaten als auch im beruflichen Bereich eine Fülle von Vorteilen. Optische Zeichenerkennungssoftware macht es möglich, gedruckten Text von fast jedem Material zu übersetzen und:

    Ihre Dokumente zu durchsuchen, einschließlich gescannter Kopien von vergriffenen Büchern und anderen Texten
  • gescannte Dokumente schnell und genau zu analysieren, zu bearbeiten und zu vergleichen
  • Informationen zu teilen, die Sie sonst nicht teilen könnten
  • Text-to-Speech-Software auf gescannte Dokumente anzuwenden und sie so für Zielgruppen zugänglich zu machen, die sie sonst nicht lesen könnten
  • Dokumente in kompakterer Form zu speichern und kostengünstige digitale Backups von wichtigen Dokumenten aufzubewahren
  • Dokumente digital in Echtzeit für Sicherheits- und Authentifizierungszwecke zu verarbeiten
  • den Bedarf an zeitaufwändiger und fehleranfälliger Dateneingabe am Arbeitsplatz zu reduzieren
  • historische Dokumente in durchsuchbare Genealogie-Datenbanken im Internet hochzuladen

Ob Sie sich dessen bewusst sind oder nicht, Sie nutzen viele dieser Funktionalitäten jeden Tag. Sie profitieren auch davon, wenn andere Menschen und Organisationen es ebenfalls anwenden. So nutzt die Polizei beispielsweise die OCR-Technologie zur Identifizierung von Nummernschildern, um unsere Sicherheit zu gewährleisten. Der Einsatz der digitalen Unterschriftserkennung, einer Form der OCR, durch die Banken verhindern, dass Möchtegern-Identitätsdiebe auf Ihr Geld zugreifen und es ausgeben können.

Dienstleister in verschiedenen Branchen können Ihnen bessere Preise und einen schnelleren Service bieten, da sie in der Lage sind, OCR zum Scannen, Hochladen, Vergleichen und Bearbeiten von Verträgen zu verwenden, anstatt einzelne Mitarbeiter für jeden dieser Schritte zu bezahlen. Wann immer Sie unterwegs eine App wie Google Translate verwenden, um ein Schild oder eine Beschriftung zu übersetzen, profitieren Sie von OCR.

OCR am Arbeitsplatz

OCR kann besonders am Arbeitsplatz von Vorteil sein. So können Unternehmen zum Beispiel vorhandene Dokumente durch eine OCR-Software scannen und sie sofort in Formate umwandeln, die mit Text-to-Speech-Programmen kompatibel sind.

Dies kann Unternehmen dabei helfen, die ADA-Standards zu erfüllen, ohne dass dafür jahrelang Zeit und enorme Mengen an Geld und Personalstunden benötigt werden. Außerdem ermöglicht es Unternehmen, die Bedürfnisse sehbehinderter Kunden in Echtzeit zu erfüllen.

In anderen Branchen, wie dem Gesundheitswesen, kann die OCR-Technologie buchstäblich Leben retten. Scansoftware für OCR kann die enorme Menge an Informationen in der Krankengeschichte eines Patienten auf eine Weise speicherbar, durchsuchbar und überprüfbar machen, die die Zugänglichkeit verbessert und gefährliche Fehler verhindert.

Kodak Alaris und OCR

Kodak Alaris weiß um die entscheidende Rolle, die OCR beim Scannen Ihrer Dokumente spielt, seien sie privat oder beruflich. Deshalb liefern wir mit jedem Scanner eine kostenlose und erweiterte OCR-Software.

Unsere Scanner sind so konzipiert, dass sie sich nahtlos in Ihre anderen digitalen Werkzeuge integrieren lassen. Von intelligenten Geräten über Apps bis hin zu alten Klassikern wie E-Mail - unsere Programme arbeiten mit all Ihren digitalen Infrastrukturen. Wir machen es Ihnen leicht, Informationen zu verschieben, zu speichern und weiterzugeben, ganz gleich, wie oder wo sie in Ihr System gelangen.

OCR-Scansoftware von Kodak Alaris hat unseren Kunden geholfen:

  • ihr Unternehmen wachsen zu lassen
  • bei innovativen Themen
  • Kosten einzusparen
  • die Effizienz zu erhöhen
  • Service und Kundenzufriedenheit zu verbessern
  • ihren ökologischen Fußabdruck zu minimieren

Unsere Technologie wird durch unser erstklassiges technisches Hilfsprogramm unterstützt, das sicherstellt, dass Sie jedes Mal das Beste aus Ihrem Kauf herausholen. Egal, ob Sie sich für Kodak Alaris für private oder professionelle Anwendungen interessieren, wir haben die richtige Hardware, Software und Support-Lösungen für Sie.

Hierzu: Wie Alaris für Innovationen in der Scantechnologie sorgt

Weitere Informationen

Die optische Zeichenerkennungssoftware von Kodak Alaris verbessert Ihre Scans von grundlegend auf brillant. Besuchen Sie einen Handelspartner vor Ort, um mehr darüber zu erfahren, was Software und Scanner von Kodak Alaris Ihnen heute bieten können.

*Basierend auf Tests von Drittanbietern, die von BLI durchgeführt und von Kodak Alaris in Auftrag gegeben wurden. Der Test wurde von Kodak Alaris konzipiert und alle Geräte wurden unter ähnlichen Betriebsbedingungen und mit ähnlichen Betriebsmethoden getestet.

Verwandte Lösungen

Alaris Capture Pro

Capture Pro Software

  • Ideal für papierintensive Geschäftsanwendungen
  • Umfassende Integration in ECM-Systeme
  • Netzwerk- und Importmodule verfügbar
smart touch

Smart Touch-Technologie

  • Komplizierte Multi-Step-Scan-Prozesse mit One-Touch-Einfachheit beseitigen
  • Konfigurierung von bis zu 20 verschiedene Funktionen, um Ihre spezifischen Scananforderungen zu erfüllen
  • Einfaches Einscannen von Dokumenten an einen Speicherort oder gängige Cloud-Dienste

Kontakt

Wenn Sie mit uns Kontakt aufnehmen möchten, füllen Sie bitte das unten stehende Formular aus, und wir werden uns bald mit Ihnen in Verbindung setzen.

Datenschutzrichtlinie von Kodak Alaris anzeigen