mirror of
https://gitee.com/mymagicpower/AIAS.git
synced 2024-11-30 03:08:24 +08:00
2.7 KiB
2.7 KiB
官网:
下载模型,放置于models目录
文字识别(OCR)工具箱
文字识别(OCR)目前在多个行业中得到了广泛应用,比如金融行业的单据识别输入,餐饮行业中的发票识别, 交通领域的车票识别,企业中各种表单识别,以及日常工作生活中常用的身份证,驾驶证,护照识别等等。 OCR(文字识别)是目前常用的一种AI能力。
OCR工具箱功能:
1. 方向检测
2. 图片旋转
- RotationExample
3. 文字识别 (原生支持倾斜文本, 1 & 2 需要时可以作为辅助)
- OcrV3RecognitionExample
4. 图片旋转
运行OCR识别例子
1.1 文字识别:
- 例子代码: OcrV3RecognitionExample.java
- 运行成功后,命令行应该看到下面的信息:
time: 766
time: 2221
烦恼!
无数个
吃饱了就有
烦恼
没有吃饱只有一个
2. 图片旋转:
每调用一次rotateImg方法,会使图片逆时针旋转90度。
3 多线程文字识别:
- 例子代码: OcrV3MultiThreadRecExample.java
更新说明
- 表格识别暂时归档至项目 AIAS_Archive - image_sdks/ocr_sdk
- 引擎切换为onnx提升性能
开源算法
sdk使用的开源算法
- PaddleOCR
- PaddleOCR转ONNX (方向检测模型转换onnx模型存在问题,所以继续用paddle格式,且其不是性能的瓶颈)
Git地址:
帮助文档:
- https://aias.top/guides.html
- 1.性能优化常见问题:
- https://aias.top/AIAS/guides/performance.html
- 2.引擎配置(包括CPU,GPU在线自动加载,及本地配置):
- https://aias.top/AIAS/guides/engine_config.html
- 3.模型加载方式(在线自动加载,及本地配置):
- https://aias.top/AIAS/guides/load_model.html
- 4.Windows环境常见问题:
- https://aias.top/AIAS/guides/windows.html