我们普遍认为文档扫描是一种成熟的技术,但在各种先进的技术实施中,其应用仍然千变万化。 一家业务遍布欧洲和拉丁美洲的国际银行在最近实施了人工智能,充分说明了这一点。
““无论是在测试还是生产中,我们的数据采集软件都表现良好;但是将其推广到下属分支机构后,数据采集质量明显下降 — 准确率从 95% 下降到约 30%。”新加坡 AI 专业公司 TAIGER 的创始人兼 CEO Sinuhé Arroyo 说道。 ““了解这种情况后,我开始调查实际情况,发现分支机构的扫描仪质量欠佳。 调查结果完全证明了‘胡乱输入产生胡乱输出’的道理。‘’ 于是我们更换了扫描仪,问题得以解决。””
该问题的解决促使我们与 Alaris(柯达乐芮的信息管理部)建立战略合作关系。 TAIGER 和 Alaris 最近宣布建立一个全球战略联盟,TAIGER 将其软件与 Alaris 扫描仪集成,并将集成后的产品作为数据采集解决方案的一部分提供。 最初,TAIGER 将专注于认证两款网络扫描仪,即 Kodak Scan Station 730Ex 和 Alaris S2060w。
““网络扫描仪可以满足特定客户的需求,让我们能够将 TAIGER 解决方案嵌入到设备的接口中。””Alaris 全球销售开发总监 Vanilda Grando 说道。 ““这让我们确定了初始的销售模式,但我们与 TAIGER 的合作并非仅限于网络扫描仪。””
在 Arroyo 看来,这些扫描仪生成的高质量图像是一大卖点。’ ““在图像处理领域,Alaris 带来的技术优于其他竞争对手的技术。””他说道。 ““高质量的图像让他们脱颖而出。””
TAIGER(发音为 “tiger”)是我们最近访谈过的几家 AI 专业公司之一,这些公司正在应用其技术进行文档采集工作。 Arroyo 于 2009 年创立该公司。 “Arroyo 表示:“我 10 岁时就开始使用 BASIC 编程。 “我不断学习计算机科学并获得了 AI 博士学位。 我曾从事过机器学习和自动化推理等领域的工作。 自然语言处理是其中的学科之一。
“当我开始寻求途径将研究成果商业化时,我认识到文本理解在很大程度上仍是一个尚未解决的问题领域。 成立 TAIGER 后,我们最初专注于搜索技术,随后增加聊天机器人助理。 后来增加了信息提取技术,这项技术可读取文档并从中提取信息。 我们将这些信息转换为可供信息系统采集的数据。””
TAIGER 总部位于新加坡,是当地不断发展的科技行业的缩影。 2017 年,TAIGER 完成了一轮高达 587 万美元的融资。 (就在本周,TAIGER 宣布启动高达 2500 万美元的 B 轮融资,该公司的估值达到了 1.1 亿美元。) 该公司最近在纽约、马德里、香港和悉尼开设了分支机构,并计划在全球开设更多分支机构。 ““目前,我们主要专注于金融服务市场,7 家最大的全球银行中的 5 家都是我们的客户”。”Arroyo 说道。 ““我们还有一些高价值的政府合约,并且已经开始与一些法律公司合作。””
TAIGER 有 3 条不同的产品线:iSearch、聊天机器人 iConverse 和数据采集 iMatch。 ““我们的数据采集技术可以处理数字格式或实物形式的文档。”Arroyo 表示。 ““如果文档是一封电子邮件或其他类型的电子文件,则不需要扫描它。 如果’文档是纸质的,我们依靠扫描仪生成图像文件,对其应用 OCR。 然后根据既定用途,使用 ASCII 文本来解读文档。”” (TAIGER 目前并未使用 Alaris ’的 Capture Pro 软件进行 OCR,但 Arroyo 表示正考虑使用该软件。)
Arroyo 表示,iMatch 与传统采集技术的主要区别在于 iMatch 可以处理的文档范围。 ““传统采集非常适合结构化文档和半结构化文档,文档的变化程度或复杂度不能太大。””他说道。 ““对于完全非结构化的文档,它们基本上无能为力。 它的机器学习技术无法实现我们的准确度,所以供应商根本无法保证我们所能实现的 KPI。 我们可以提供 90-95% 的准确度,而且没有误报,’这对用户而言具有很高的价值。””
对于上述提及的全球性银行,TAIGER 通过部署 iMatch 来帮助他们执行受理流程。 对于企业客户,这涉及到从至少 10 个不同的文档中采集数据,包括授权书和公司章程等非结构化文档。 例如,根据拟定授权书的人员不同,授予公司个人各项权利的具体措辞可能会有很大差异。
““在语言表达上还有一个问题,您说的某句话的含义可能因上下文的不同而有很大的差异。””Arroyo 说道。 ““例如,如果我询问您住在何处,可能表示我想知道您的住在哪个街区,或者在哪个城市。 或者,我们可以使用不同的措辞来询问相同的问题。 这正是模式匹配不适合从非结构化文档提取内容的原因。 因为存在许多种可能。 “我们的技术能识别句子的主语、谓语、宾语等。 然后运用语义理解来确定 5 到 7 种不同含义中的哪一种是正确的。 之后我们尝试将该短语置于文档的上下文中,以真正尝试理解其含义。””
Arroyo 解释道,实施 iMatch 有 3 大要素。 ““您要拥有基础引擎,这个引擎在每个句子中都一样。””他说道。 ““然后,您要拥有各种文档。 最后要有一个知识库,比如肿瘤学库,可以帮助调优该引擎来处理特定类型的文档。 我们的价值定位是能够非常准确地采集任务关键型数据,并保证不会存在误报。””
全球银行采用我们的技术后,在某些情况下企业客户的受理时间从几周缩短到仅 7 分钟。 客户受理工作的成本降低了 85%。 错误也大幅减少。
iMatch 目前支持采集英语、西班牙语和中文数据。 ““我们正在实现对更多语言的支持。””Arroyo 说道。 ““这’并不是一个很难的过程。 我们只需几个月即可添加一种新语言。””
目前,iMatch 仅支持部署在企业内部,但 TAIGER 正努力将其技术迁移到云中。 ““我们看到很多企业,尤其是在金融服务行业,他们正考虑迁移到基于云的软件。”Arroyo 说道。 ““我认为,通过减少市场投放准备时间并降低客户实施成本,各方都能从中受益。 实现与云软件的集成后,使用 Alaris 网络扫描仪将会非常简单。””
TAIGER 不断开发新技术,并在最近增加了新的校订功能。 ““随着我们不断增加新功能并可能将技术迁移到云,我们将会更好地抓住中端市场,但我认为我们不会进入更下游的市场。”Arroyo 表示。 ““我们其实是一家 B2B 公司。””
最初,Alaris 会寻求机会向其客户推荐 TAIGER 软件。 ““我们并不准备充当分销商。””Alaris 的 Grando ’说道。 ““但这正是我们希望发展的全球联盟方式。 将 TAIGER 的软件与我们的扫描仪相结合,我们就能在市场中真正提供与众不同的价值。 我想说的是,我们就像是汽油,他们就像是引擎。 在合作过程中,我们首先为他们的引擎提供高品质图像,这对他们的事务自动化程度有着很大的影响。””
了解更多详情: https://www.documentimagingreport.com/?p=6312; http://bit.ly/TaigerSeriesB
Document Imaging Report (DIR) 是知名的管理和营销时事通讯,专门发掘将纸质流程转换为电子格式的机会与趋势。 DIR 是一种半月刊 8 页时事通讯,能帮助您在几分钟内及时了解重要行业新闻 - 每月节省数小时的阅读和研究时间。 它专为影像行业的供应商、最终用户和经销渠道量身定制。 DIR 提供市场上最准确最公正的内幕信息,让您能抢先了解行业变化与发展。 要订阅 DIR 或免费试读,请访问 https://www.documentimagingreport.com/?page_id=1345
Kodak Alaris 是广受认可的数据采集及智能文档处理解决方案的提供商,致力于简化业务流程。我们的宗旨是以数十载的影像科学创新为后盾,通过智能化、互联的解决方案帮助各行各业的用户实现有效的信息利用。在全球直接提供和通过我们的渠道合作伙伴网络提供屡获大奖的扫描仪、软件和服务。
隐私声明 | 法律/网站条款 | 加州收集通知 | 不要分享我的个人信息
© 2024 Kodak Alaris Inc. TM/MC/MR: Alaris、ScanMate。所有商标和商品名称是各自拥有者的财产。柯达商标和商品外观是在取得 Eastman Kodak Company(伊士曼柯达公司)的授权下使用。