AIAS/1_image_sdks/text_recognition/ocr_sdk/README_cn.md

2.7 KiB
Raw Blame History

官网:

官网链接

下载模型放置于models目录

文字识别OCR工具箱

文字识别OCR目前在多个行业中得到了广泛应用比如金融行业的单据识别输入餐饮行业中的发票识别 交通领域的车票识别,企业中各种表单识别,以及日常工作生活中常用的身份证,驾驶证,护照识别等等。 OCR文字识别是目前常用的一种AI能力。

OCR工具箱功能:

1. 方向检测

  • OcrDirectionExample
  • 0度
  • 90度
  • 180度
  • 270度
    detect_direction

2. 图片旋转

  • RotationExample

3. 文字识别 (原生支持倾斜文本, 1 & 2 需要时可以作为辅助)

  • OcrV3RecognitionExample

4. 图片旋转

运行OCR识别例子

1.1 文字识别:

  • 例子代码: OcrV3RecognitionExample.java
  • 运行成功后,命令行应该看到下面的信息:
time: 766
time: 2221
烦恼!
无数个
吃饱了就有
烦恼
没有吃饱只有一个
  • 输出图片效果如下: text_with_angle

2. 图片旋转:

每调用一次rotateImg方法会使图片逆时针旋转90度。

  • 例子代码: RotationExample.java
  • 旋转前图片: ticket_0
  • 旋转后图片效果如下: rotate_result

3 多线程文字识别:

  • 例子代码: OcrV3MultiThreadRecExample.java

更新说明

  1. 表格识别暂时归档至项目 AIAS_Archive - image_sdks/ocr_sdk
  2. 引擎切换为onnx提升性能

开源算法

sdk使用的开源算法

  • PaddleOCR
  • PaddleOCR转ONNX (方向检测模型转换onnx模型存在问题,所以继续用paddle格式且其不是性能的瓶颈)

Git地址

Github链接
Gitee链接

帮助文档: