AIAS/1_image_sdks/ocr_sdks/ocr_v3_sdk
2024-01-22 11:12:53 +08:00
..
build/output ocr tool kit. 2024-01-22 11:12:53 +08:00
src ocr tool kit. 2024-01-22 11:12:53 +08:00
pom.xml ocr tool kit. 2024-01-22 11:12:53 +08:00
README.md ocr tool kit. 2024-01-22 11:12:53 +08:00

官网:

官网链接

下载模型放置于models目录

文字识别OCR工具箱

文字识别OCR目前在多个行业中得到了广泛应用比如金融行业的单据识别输入餐饮行业中的发票识别 交通领域的车票识别,企业中各种表单识别,以及日常工作生活中常用的身份证,驾驶证,护照识别等等。 OCR文字识别是目前常用的一种AI能力。

OCR工具箱功能:

文字识别SDK (原生支持旋转倾斜文本, 如果需要图像预处理SDK可以作为辅助)

1. 文本检测 - OcrV3DetExample
  • 中文文本检测
  • 英文文本检测
  • 多语言文本检测 OcrV3DetExample
2. 文本识别 - OcrV3RecExample

支持的语言模型:

  • 中文简体
  • 中文繁体
  • 英文
  • 韩语
  • 日语
  • 阿拉伯
  • 梵文
  • 泰米尔语
  • 泰卢固语
  • 卡纳达文
  • 斯拉夫

OcrV3RecExample1

OcrV3RecExample2

3. 多线程文本识别 - OcrV3MultiThreadRecExample

CPU2.3 GHz 四核 Intel Core i5 同样图片单线程运行时间1172 ms 多线程运行时间707 ms 图片检测框较多时,多线程可以显著提升识别速度。

开源算法

1. sdk使用的开源算法

2. 模型如何导出 ?

(readme.md 里提供了推理模型的下载链接)

帮助文档: