AIAS/README.md at 458314aa8874b9457a5145c50bffe6a0166455b5

test/AIAS

Fork 0

mirror of https://gitee.com/mymagicpower/AIAS.git synced 2024-11-30 03:08:24 +08:00

Calvin 458314aa88 更新模型加载说明

2024-11-13 10:21:20 +08:00

5.0 KiB

Raw Blame History

下载模型, 更新配置yml文件 ocr_backend\src\main\resources\application-xxx.yml

链接：https://pan.baidu.com/s/1-OEOcYHjSeqbfu7XD3ASgw?pwd=f43t

model:
  # 设置为 CPU 核心数 (Core Number)
  poolSize: 4
  table:
    # 表格数据集训练的版面分析模型，支持中英文文档表格区域的检测
    layout: D:\\ai_projects\\AIAS\\6_web_app\\ocr_web_app\\ocr_backend\\models\\picodet_lcnet_x1_0_fgd_layout_table_infer_onnx.zip
    # 英文表格识别
    rec: D:\\ai_projects\\AIAS\\6_web_app\\ocr_web_app\\ocr_backend\\models\\en_ppstructure_mobile_v2.0_SLANet_infer.zip
    # 中文表格识别
    # D:\\ai_projects\\AIAS\\6_web_app\\ocr_web_app\\ocr_backend\\models\\ch_ppstructure_mobile_v2.0_SLANet_infer.zip
  ocrv4:
    # server detection model URI
    det: D:\\ai_projects\\AIAS\\6_web_app\\ocr_web_app\\ocr_backend\\models\\ch_PP-OCRv4_det_infer.zip
    # server recognition model URI
    rec: D:\\ai_projects\\AIAS\\6_web_app\\ocr_web_app\\ocr_backend\\models\\ch_PP-OCRv4_rec_infer.zip
  mlsd:
    # mlsd model URI
    model: D:\\ai_projects\\AIAS\\6_web_app\\ocr_web_app\\ocr_backend\\models\\mlsd_traced_model_onnx.zip

OCR Web应用

文字识别（OCR）目前在多个行业中得到了广泛应用，比如金融行业的单据识别输入，餐饮行业中的发票识别，交通领域的车票识别，企业中各种表单识别，以及日常工作生活中常用的身份证，驾驶证，护照识别等等。 OCR（文字识别）是目前常用的一种AI能力。

当前版本包含了下面功能：

自由文本识别（支持旋转、倾斜的图片）
文本图片转正（一般情况下不需要，因为ocr 原生支持旋转、倾斜的图片）
表格文本识别（图片需是剪切好的单表格图片）
表格自动检测文本识别（支持表格文字混编，自动检测表格识别文字，支持多表格）

1. 前端部署

1.1 直接运行：

npm run dev

1.2 构建dist安装包：

npm run build:prod

1.3 nginx部署运行(mac环境部署管理前端为例)：

cd /usr/local/etc/nginx/
vi /usr/local/etc/nginx/nginx.conf
# 编辑nginx.conf

    server {
        listen       8080;
        server_name  localhost;

        location / {
            root   /Users/calvin/ocr_ui/dist/;
            index  index.html index.htm;
        }
     ......
     
# 重新加载配置：
sudo nginx -s reload 

# 部署应用后，重启：
cd /usr/local/Cellar/nginx/1.19.6/bin

# 快速停止
sudo nginx -s stop

# 启动
sudo nginx

2. 后端部署

2.1 环境要求：

系统JDK 1.8+，建议11

2.2 下载模型：

### 模型下载地址：
链接：https://pan.baidu.com/s/1-OEOcYHjSeqbfu7XD3ASgw?pwd=f43t

### 假设系统为linux,假设路径如下：
/home/models/ocr/

2.3 更新模型地址：

### 配置文件路径：
ocr\ocr_backend\src\main\resources

### 选择系统配置文件，替换成实际的模型路径，以linux为例：
model:
  ......
  table:
    # 表格数据集训练的版面分析模型，支持中英文文档表格区域的检测
    layout: /home/models/iocr/picodet_lcnet_x1_0_fgd_layout_table_infer_onnx.zip
    # 英文表格识别
    rec: /home/models/iocr/en_ppstructure_mobile_v2.0_SLANet_infer.zip
    # 中文表格识别
    # rec: /home/models/iocr/ch_ppstructure_mobile_v2.0_SLANet_infer.zip
  ocrv4:
    # server detection model URI
    det: /home/models/iocr/ch_PP-OCRv4_det_infer.zip
    # server recognition model URI
    rec: /home/models/iocr/ch_PP-OCRv4_rec_infer.zip

2.4 其它模型加载方式，参考下面的文档：

模型加载方式（在线自动加载，及本地配置）:
https://aias.top/AIAS/guides/load_model.html

3. 运行程序：

运行编译后的jar：

# 运行程序  
# -Dfile.encoding=utf-8 参数可以解决操作系统默认编码导致的中文乱码问题
nohup java -Dfile.encoding=utf-8 -jar xxxxx.jar > log.txt 2>&1 &

4. 打开浏览器

输入地址： http://localhost:8089

1. 通用文本识别

2. 文本转正

3. 中英文表格文字识别

帮助文档：

https://aias.top/guides.html
1.性能优化常见问题:
https://aias.top/AIAS/guides/performance.html
2.引擎配置（包括CPU，GPU在线自动加载，及本地配置）:
https://aias.top/AIAS/guides/engine_config.html
3.模型加载方式（在线自动加载，及本地配置）:
https://aias.top/AIAS/guides/load_model.html
4.Windows环境常见问题:
https://aias.top/AIAS/guides/windows.html

5.0 KiB Raw Blame History Unescape Escape

目录：