yh86银河国际-首页欢迎您

犀语播报 | 犀语OCR-助力企业数智化转型

OCR概述

 
 
 
 

OCR,全称是Optical Character Recognition, 即光学字符识别,面向扫描文件。但是由于现在数字图像的普及,也包含场景文字识别(Scene Text Recognition, STR), 面向自然场景。这里泛指文字检测和识别,包括扫描文档和自然场景的文字识别,文本是人类最重要的信息来源之一,自然场景中充满了形形色色的文字符号。

传统的OCR是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。随着人工智能技术的发展,犀语OCR技术采用深度学习模型对印刷体、手写体等各类光学字符进行识别。

 
 
 
 

OCR应用场景

 
 
 
 

OCR技术广泛应用在金融、保险、税务、银行、政务、工商管理、审计等需要及时便利地处理大量表格、票据、文档等行业信息采集的领域,实现了各式文档的自动化录入、存储和管理,为各行业提供高效、智能、便捷的个性化解决方案。

根据识别场景,可大致将OCR分为识别特定场景的专用OCR和识别多种场景的通用OCR,如证件识别和车牌识别就是专用OCR的典型实例。通用OCR可以用于更复杂的场景如图片、表格、板式、版面等,也具有更大的应用潜力,但由于场景不固定,文字布局多样,版式需要处理页眉页脚、自然段、表格、图表等,表格需要处理每个单元格内容、单元格的填充或合并,因此难度更高。

 
 
 
 

OCR可解决哪些痛点

 
 
 
 

随着时代的快速发展,信息量也日益膨胀,信息来源和结构也越来越多样化。现如今各类信息充斥在多种格式的文档,图片,视频等载体,非结构化的图像资料暴增,而信息结构化的手段还只是通过人工加工,对各类非结构化数据进行结构化转换才能应用到实际场景。使用OCR技术可避免在人工录入时容易出错问题,并可大量减少人力成本和时间成本,提高工作效率减少成本。

 

但因信息的多源异构性,OCR本身也面临着诸多问题和挑战:

  • 文字的多样性:中文,英文等语言多样。

  • 字体的多样性:印刷体识别和手写识别等。

  • 场景的多样性:文档、图片及场景图片。

  • 图像质量:图像的质量低导致目标被误分类。

  • 语音视频噪音:各类噪声导致识别难度增大。

  • 内容不规整:扭曲、旋转等情况使同一个文字不同角度可能导致识别错误。

  • 印章识别:印章颜色、形状、清晰度等都会印象识别效果。

 
 
 
 

犀语OCR技术

 
 
 
 

犀语OCR引擎:犀语深度学习技术的研究和积累及使得OCR技术拓展到图表、单证的广泛识别。

 

犀语 OCR-Sight:OCR-Sight是犀语自研的适宜灵活小批量单证、表格的内容识别的模型,同时也支持各种定制化等等,服务于各类应用场景。

 
 
 
 

犀语OCR解决方案

 
 
 
 

犀语提供OCR全套解决方案,从产品、模型和服务三个方面进行。

产品:

  • 持各类OCR应用开发、上线、运维、管理的平台产品

  • 针对本地化部署需求的客户提供更低TCO的软硬一体化产品

  • 支持Saas服务,帮助开发者快速搭建OCR应用

模型:

  • 面向特定业务场景的模型应用,快速识别非结构化的图像文档内容并输出结构化数据,辅助业务流程的自动化、智能化以及业务效率的提升

  • 既支持通用的OCR场景应用,也可基于业务场景提供定制化的模型。

服务:

  • 联合优质合作伙伴为客户提供端到端的服务,包括数据标注、模型开发、 应用开发、应用上线、模型调优、运维升级等

  • 通过先进的产品及丰厚的技术沉淀帮助客户找到OCR应用建设的效率和 效果的最佳平衡点。

 

犀语除了提供专业的解决方案和定制化业务,也提供从流程搭建、语料标注、模型训练到模型发布的OCR全流程的技术服务。

流程搭建:根据特定需求,定制模型全流程平台。

语料标注:文件解析、语料标注、语料管理、训练语料生成。

模型训练:图像分类、文本标框、文本识别。

模型发布:特定的图像特点进行模型调整与定制,完善的模型封装,灵活的接口调用。

创建数据集 – 可单笔或批量上传图片样本。

 

数据标注 - 为数据集标注,支持多类型多场景标注

 

模型训练 – 可自行配置训练参数,一键自动训练,提供训练日志

 

模型发布 -进行模型调整与定制,完善的模型封装,灵活的接口调用

 
 
 
 

OCR您需要那种

Level1:

  • OCR需求场景少

  • 需求简单、能快速上线应用。

  • 企业自身应用开发维护资源有限。

Level2:

  • OCR场景众多,需要维护管理多个应用。

  • 业务规模持续增长,底层算力资源会持续扩展,需要有效的管理。

  • 企业研发资源有限,但具备足够的应用运维管理能力。

Level3:

  • 图像定制化场景较多。

  • 按场景逐个采购外包服务建设,建设成本高、周期长。

  • 企业自身有较高的自主开发图像模型应用能力,需要灵活且开放的平台支持各类图像场景的研发。

 

 

END

 

 

 

公司介绍

yh86银河国际采用领先的自然语言处理(NLP)、图像识别(OCR)、知识图谱(KG)、大数据(BD)分析技术,通过深入分析企业的数智化转型需求,形成从底层文本的数据清洗和数据结构化到算法模型的训练管理以及行业智能化应用的完整Al生态,打造技术中台、文档智能化应用、数智化解决方案三大方向产品。

 

联系我们

商务咨询(需求对接、产品试用)

请联系:电话400-920-3707

或邮箱 marketing@alphainsight.ai

 

 
往期推荐
 

 

 

 

戳这里,了解更多犀语OCR能力

首页    犀语播报    犀语播报 | 犀语OCR-助力企业数智化转型
创建时间:2022-08-08 10:12
浏览量:0