一、产品概述

OCR图文识别系统,是武汉冠兴科技自主研发的一套可部署至本地服务器的文字识别服务,支持主流 CPU/GPU 环境及国产化系统部署,可对各种OCR原子化识别能力和应用服务进行统一的接入、调度、路由和安全控制。常见的OCR能力包括PDF文件识别、图片文字识别、截图识别、票证识别、图片转Excel等功能,一键解析、高效识别。

 

二、产品优势

先进技术:自主研发的管理平台,与先进技术保持同步,持续进行技术研究和产品创新;

成熟平台:成熟的开放式应用平台,提供开箱即用的场景化服务;

稳定性强:系统具备高可用,支持分布式部署,易扩展;

经验成熟:多年行业客户服务经验,深耕教育行业应用场景,积累了良好的客户口碑和实施经验;

效能提升:基于深度学习算法的OCRNLP技术融合应用,提升产品应用的速度、精度和广度。

 

三、产品架构

 

项目总体架构图如下:

系统采用统一的OCR服务接入和管理、即插即用;

开放式微服务管理平台,可集成各种AI产品。

 

四、产品功能特点

1.高效识别文字

平台采用先进的OCR识别技术,通用场景下的整图文字检测和识别服务,支持图片、PDF指定页识别,支持PDF全文档识别,支持指定文本框或文本整行返回识别结果,图片/PDF传参支持URL格式或BASE64字符串格式。高达95%的识别精度,轻松实现文档数字化。

支持 TIFF JPEG PNG BMP 格式图像的读取;

支持 avi rmvb rm mp4 3gp 等视频格式。

 

 

2.多国语言识别

支持多国语言识别,一键识别生成各国家语言文字。识别图片中的文字信息及文字区域的坐标信息,支持中文简体、中文繁体、英文、日文等20种语种识别。

3.敏感词内容检测

系统可通过OCR技术自动生成关键词,并根据检索关键词内容对图片、文档、视频等教学研究数据进行敏感词定位或安全性检查。精准识别各类场景中涉政人物、政治事件、宗教、反动分裂以及恐怖主义等违规文本。

4.自动解析图文

平台对图文混排的文档具有自动分析功能,将文字区域划分出来后自动进行识别。

5.文件批量识别

支持文件一键批量识别,杜绝重复劳动,提高工作学习效率。

6.精准检索纠错

平台提供更强大的文字识别纠错技术,精准地检测出文档样式、标题等内容化。

7.人像比对分析

采用AI技术,根据图像特征及关键字自动匹配模板,通过人脸图像采集及检测、人脸图像匹配与识别,实现面部特征识别。

8.系统管理

系统管理模块提供配置工具,允许管理员用户依据自身管理需要,对后台数据进行配置。

9.接口管理

平台具备标准的统一身份认证接口,可与通用的认证系统进行集成。

10.集群化部署

支持CPUGPU单多卡,可根据服务器配置情况,设置预测最大并行数,多路并行请求同时响应处理,充分利用服务器算力资源,满足多并发场景的识别需求。支持多服务器集群化部署,满足高并发场景的识别需求。

11.私有化部署、多操作系统支持

提供标准的镜像部署包,支持在Linux Window 等服务器操作系统上的私有化部署。