Wir mögen das Scannen von Dokumenten für eine ausgereifte Technologie halten, doch in der Praxis kann es große Unterschiede bei der Implementierung in moderne Technologien geben. Dies zeigte kürzlich eine KI-Implementierung bei einer internationalen Bank, die Zweigstellen in ganz Europa und Lateinamerika unterhält.
“Unsere Datenextraktionssoftware arbeitete fehlerfrei, als wir sie getestet und dann in Betrieb genommen haben. Doch als wir sie in den Filialen einführten, nahm die Qualität der Extraktion ab—die Genauigkeit fiel von 95 % auf etwa 30 %,” so Sinuhé Arroyo, Gründer und CEO des in Singapur ansässigen KI-Spezialisten TAIGER. “Als ich diese Information erhielt, machte ich mir ein umfassendes Bild und kam zu dem Schluss, dass die in den Filialen eingesetzten Scanner von schlechterer Qualität waren. Die Ergebnisse bestätigten das alte Sprichwort ‘„Garbage in, garbage out“.’ Deshalb haben wir die Scanner ausgetauscht und das Problem war gelöst.”
Die Lösung des Problems führte zur Zusammenarbeit mit Alaris, dem Geschäftsbereich für Information Management (welcher auch die Herstellung von Scannern umfasst) von Kodak Alaris. TAIGER und Alaris gaben kürzlich eine strategische Partnerschaft auf globaler Ebene bekannt, in deren Rahmen TAIGER seine Software in Alaris Scanner integrieren und diese als Teil seiner Datenextraktionslösungen anbieten wird. Zunächst wird TAIGER sich auf die Zertifizierung von zwei Netzwerkscannern konzentrieren, der Kodak Scan Station 730EX und des Alaris S2060w.
“Die Netzwerkscanner entsprechen den Anforderungen eines bestimmten Kunden und ermöglichen es uns, die TAIGER Lösung in die Benutzeroberfläche des Geräts einzubetten,” so Vanilda Grando, Direktorin für Global Sales Development bei Alaris. “So kamen wir zu unserem anfänglichen Vertriebsmodell, jedoch sind wir nicht notwendigerweise darauf beschränkt, nur mit TAIGER an Netzwerkscannern zu arbeiten.”
Die hohe Bildqualität, die die Scanner produzieren, war aus Arroyos’ Sicht der Dealmaker. “Die Technologie, welche Alaris im Bereich der Bildverarbeitung mitbringt, war dem überlegen, was wir von anderen Unternehmen sahen,” berichtete er. “Alaris stach damit wirklich heraus.”
TAIGER (ausgesprochen “tiger”) ist einer von mehreren KI-Spezialisten, mit denen wir in der letzten Zeit sprachen, die ihre Technologie bei der Dokumentenerfassung einsetzen. Arroyo gründete das Unternehmen im Jahr 2009. “Ich begann, in BASIC zu programmieren, als ich 10 Jahre alt war,” erzählte Arroyo. “Später studierte ich Informatik und promovierte in KI. Ich arbeitete in Bereichen wie Machine Learning (maschinelles Lernen) und Automated Reasoning (automatisierte Logik). Einer der Fachbereiche war Natural Language Processing (maschinelle Verarbeitung natürlicher Sprache).
“Als ich nach Wegen suchte, meine Forschungen auf die Branche anzuwenden, stellte ich fest, dass Textverständnis ein Bereich war, in dem es zahlreiche ungelöste Probleme gab. Mit TAIGER näherten wir uns diesem Bereich zunächst mit Suchtechnologie an und erweiterten unsere Technologie dann um einen Chatbot. Später kam Informationsextraktion hinzu, mit der Dokumente gelesen und Informationen extrahiert werden können. Wir konvertieren diese Informationen in Daten, die von Informationssystemen aufgenommen werden.”
TAIGER ist in Singapur ansässig und dort Teil einer wachsenden Tech-Szene. Im Jahr 2017 schloss TAIGER eine Finanzierungsrunde über umgerechnet 5,87 Millionen USD ab. (Erst in dieser Woche kündigte TAIGER eine Serie-B-Finanzierungsrunde in Höhe von 25 Millionen USD an, welche das Unternehmen auf einen Wert von 110 Millionen USD schätzt.) Das Unternehmen unterhält derzeit Außenstellen in New York, Madrid, Hongkong und Sydney und plant, weltweit weiter zu expandieren. “Bis jetzt haben wir uns hauptsächlich auf den Finanzdienstleistungsmarkt konzentriert, wobei wir fünf der sieben größten globalen Banken zu unseren Kunden zählen,” so Arroyo. “Zudem haben wir einige exklusive Staatsaufträge und arbeiten seit Kurzem mit mehreren Anwaltskanzleien zusammen.”
TAIGER besitzt drei separate Produktlinien: iSearch, iConverse für Chatbots und iMatch zur Datenextraktion. “Unsere Extraktionstechnologie kann mit Dokumenten in digitalen oder physischen Formaten arbeiten,” sagte Arroyo. “Handelt es sich bei dem Dokument um eine E-Mail oder eine andere Art von elektronischer Datei, so muss es nicht gescannt werden. Liegt es ’hingegen in Papierform vor, so sind wir auf einen Scanner angewiesen, der eine Bilddatei erzeugt. Auf diese wenden wir optische Zeichenerkennung (Optical Character Recognition, OCR) an. Wir arbeiten dann mit dem ASCII-Text, um das Dokument zugunsten der festgelegten Anwendung auszuwerten.” (Zur optischen Zeichenerkennung verwendet TAIGER aktuell nicht die Alaris’ Capture Pro Software, Arroyo berichtete jedoch, dass diese Option derzeit stark in Betracht gezogen werde.)
Arroyo zufolge liegt das Hauptunterscheidungsmerkmal zwischen iMatch und der herkömmlichen Erfassung im Spektrum der Dokumente, mit welchen iMatch es aufnehmen kann. “Die herkömmliche Erfassung kommt mit strukturierten und halbstrukturierten Dokumenten gut zurecht, vorausgesetzt, dass diese sich nicht zu stark voneinander unterscheiden und nicht zu komplex sind,” sagte er. “Komplett unstrukturierte Dokumente —liegen dagegen komplett außerhalb des Möglichen. Die Machine Learning-Technologie der herkömmlichen Erfassung kann nicht mit der Präzision mithalten, die wir erreichen, deshalb können die Anbieter nicht die KPIs gewährleisten, die wir garantieren können. Wir bieten eine Genauigkeit von 90-95 % ohne Fehlermeldungen, das ist ’ein enormer Wert.”
Für die oben genannte globale Bank hat TAIGER iMatch bereitgestellt, um den Onboarding-Prozess zu vereinfachen. Für Firmenkunden bedeutet dieser Prozess die Erfassung von Daten aus mindestens 10 verschiedenen Dokumenten, worunter sich auch unstrukturierte Dokumente wie Vollmachten und Satzungen befinden. Die spezifische Formulierung, die beispielsweise ein Unternehmen bei der Erteilung einer Einzelvollmacht nutzt, kann je nach Verfasser des Formulars sehr unterschiedlich ausfallen.
“Eine der Herausforderungen in Bezug auf Sprache ist, dass die Bedeutung einer Aussage je nach Kontext stark variieren kann,” so Arroyo. “Wenn ich Sie zum Beispiel frage, wo Sie leben, so kann diese Frage sowohl auf das Stadtviertel bezogen sein, in welchem Ihr Haus steht, als auch auf die Stadt oder das Land. Genauso könnte man dieselbe Frage auch anders formulieren. Aus diesem Grund funktioniert Mustererkennung bei der Extraktion von unstrukturierten Dokumenten nicht. Der Baum der Möglichkeiten kann riesig sein. “Unsere Technologie ist dazu in der Lage, Subjekte, Prädikate, Objekte und andere Satzteile zu identifizieren. Sie wendet dann semantisches Verständnis an, um zu ermitteln, welche der fünf bis sieben unterschiedlichen Bedeutungen korrekt ist. Dann versuchen wir, den Satz innerhalb des Dokuments zu kontextualisieren, um seine Bedeutung erfassen zu können.”
Arroyo erklärte, dass sich eine iMatch-Implementierung aus drei Elementen zusammensetzt. “Da ist zunächst der darunter liegende Motor, der immer der gleiche ist,” sagte er. “Das zweite Element bilden die Dokumente. Und zuletzt gibt es eine Wissensdatenbank, wie zum Beispiel eine Ontologie, die den Motor darauf trimmt, eine bestimmte Art von Dokument zu verarbeiten. Das Leistungsversprechen besteht in der äußerst präzisen Erfassung unternehmenskritischer Daten und der Garantie, dass keine Fehler auftreten werden.”
Die Anwendung bei der globalen Bank führte dazu, dass sich die Onboardingzeit für Firmenkunden von mehreren Wochen in einigen Fällen auf nur noch sieben Minuten verkürzte. Die Kosten des Kunden-Onboardings konnten zudem um 85 % gesenkt werden. Auch Fehler konnten reduziert werden.
iMatch unterstützt aktuell die Erfassung von Daten auf Englisch, Spanisch und Chinesisch. “Wir arbeiten an der Unterstützung vieler weiterer Sprachen,” so Arroyo. “Es ist’ im Grunde kein komplizierter Prozess. Das Hinzufügen einer neuen Sprache nimmt lediglich ein paar Monate in Anspruch.”
Bislang wurde iMatch nur lokal bereitgestellt, TAIGER strebt jedoch eine Verlagerung der Technologie in die Cloud an. “Derzeit wollen vor allem auf dem Finanzdienstleistungsmarkt viele Unternehmen auf cloudbasierte Software umsteigen,” so Arroyo. “Ich denke, davon profitieren alle, da die Markteinführungszeiten verkürzt und die Kosten für die Implementierung gesenkt werden. Die Zusammenarbeit mit den Netzwerkscannern von Alaris ist ein Kinderspiel, wenn es um die Integration der Cloud-Software geht.”
TAIGER entwickelt seine Technologie laufend weiter und erweiterte sie kürzlich um neue Bearbeitungsfunktionen. “Die Einführung neuer Funktionen und die potenzielle Verlagerung unserer Technologie in die Cloud sollten es uns ermöglichen, in der Zukunft besser auf den Mittelstand als Zielgruppe einzugehen. Allerdings gehe ich nicht davon aus’, dass wir uns weiter nach unten bewegen werden,” so Arroyo. “Wir sind ein echtes B2B-Unternehmen.”
Zunächst wird Alaris nach Möglichkeiten Ausschau halten, die TAIGER Software ihren Kunden zu empfehlen. “Wir werden nicht als Vertriebspartner agieren,” so Grando von Alaris.’ “Es handelt sich hierbei jedoch um ein Beispiel für die Art von globalen Allianzen, die wir aufbauen wollen. Die Kombination der Software von TAIGER’ mit unseren Scannern ermöglicht es uns, etwas zu schaffen, das auf dem Markt wirklich außergewöhnlich ist. Ich pflege zu sagen, dass wir der Kraftstoff sind und sie der Motor. Wir starten den Prozess, indem wir ihren Motor mit qualitativ hochwertigen Bildern versorgen, was von großer Bedeutung dafür ist, wie gut sie Transaktionen automatisieren können.”
Weitere Informationen finden Sie unter: https://www.documentimagingreport.com/?p=6312; http://bit.ly/TaigerSeriesB
Document Imaging Report (DIR) ist der führende Management- und Marketing-Newsletter zu Chancen und Trends bei der Umstellung von Papierprozessen auf elektronische Formate. DIR ist ein achtseitiger Newsletter, der zweimal monatlich erscheint, Sie in wenigen Minuten über alle entscheidenden Entwicklungen informiert – und Ihnen somit jeden Monat viele Stunden an Recherchearbeit erspart. Der Newsletter adressiert Anbieter, Endbenutzer und den Vertriebskanal für die Imaging-Branche gleichermaßen. DIR versorgt Sie mit den genauesten und objektivsten Insiderinformationen auf dem Markt und hält Sie über branchenspezifische Veränderungen und Weiterentwicklungen auf dem Laufenden. Um den DIR zu abonnieren oder kostenlos zu testen, besuchen Sie https://www.documentimagingreport.com/?page_id=1345
Kodak Alaris ist ein führender Anbieter von Informationserfassungs- und intelligenten Dokumentenverarbeitungslösungen, die Geschäftsprozesse vereinfachen. Wir unterstützen Unternehmen, Informationen sinnvoll mit intelligenten, vernetzten Lösungen zu nutzen, basierend auf innovativer Bildwissenschaft, die seit Jahrzehnten unsere Kernkompetenz darstellt. Unsere ausgezeichneten Scanner, Software und Services sind weltweit über unser Netzwerk an Vertriebspartnern verfügbar.
Datenschutzerklärung | Rechtliche/Website-Bedingungen | Hinweis zur Abholung in Kalifornien | Meine persönlichen Daten nicht weitergeben | Impressum
© 2024 Kodak Alaris Inc. TM/MC/MR: Alaris, ScanMate. Alle Marken und Markennamen sind Eigentum ihrer jeweiligen Inhaber. Die Marke Kodak und das Logo von Kodak werden unter Lizenz von der Eastman Kodak Company verwendet.