no message

This commit is contained in:
Calvin 2024-10-20 14:57:05 +08:00
parent dde408a380
commit d8059c305a

499
README.md
View File

@ -89,8 +89,9 @@
<tr>
<td style="width:220px">
<div align="left">
<p>OCR工具箱 1OCR方向检测与旋转 - ocr_sdks/ocr_direction_det_sdk</p>
OCR图像预处理。
<p>OCR工具箱 1方向检测</p>
- ocr_sdks/<br>ocr_direction_det_sdk<br>
- OCR图像预处理。
</div>
</td>
<td>
@ -102,12 +103,13 @@
<tr>
<td style="width:220px">
<div align="left">
<p>OCR工具箱 2OCR文字识别 - ocr_sdks/ocr_v3_sdk</p>
1. V3 文本检测: <br>
<p>OCR工具箱 2OCR文字识别</p>
1. ocr_sdks/ocr_v3_sdk<br>
1). V3 文本检测: <br>
- 中文文本检测<br>
- 英文文本检测<br>
- 多语言文本检测<br>
2. V3 文本识别:<br>
2). V3 文本识别:<br>
- 中文简体<br>
- 中文繁体<br>
- 英文<br>
@ -119,20 +121,10 @@
- 泰卢固语<br>
- 卡纳达文<br>
- 斯拉夫<br>
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/OCR/images/OcrV3RecExample2.jpeg" width = "400px"/>
</div>
</td>
</tr>
<tr>
<tr>
<td style="width:220px">
<div align="left">
<p>OCR工具箱 3OCR文字识别 - ocr_sdks/ocr_v4_sdk</p>
原生支持旋转倾斜文本文字识别。
2. ocr_sdks/ocr_v4_sdk<br>
- 原生支持倾斜文本文字识别。<br>
- 更高的识别精度<br>
- 支持中英文。
</div>
</td>
<td>
@ -144,11 +136,12 @@
<tr>
<td style="width:220px">
<div align="left">
<p>OCR工具箱 4版面分析 - ocr_sdks/ocr_layout_sdk</p>
可以用于配合文字识别,表格识别的流水线处理使用。 <br>
1. 中文版面分析<br>
2. 英文版面分析<br>
3. 中英文文档 - 表格区域检测<br>
<p>OCR工具箱 4版面分析</p>
- ocr_sdks/ocr_layout_sdk<br>
可以用于配合文字识别,<br>表格识别的流水线处理使用。<br>
1). 中文版面分析<br>
2). 英文版面分析<br>
3). 中英文文档 - 表格区域检测<br>
</div>
</td>
<td>
@ -161,8 +154,9 @@
<tr>
<td style="width:220px">
<div align="left">
<p>OCR工具箱 5 表格识别 - ocr_sdks/ocr_table_sdk</p>
中英文表格识别。
<p>OCR工具箱 5 表格识别 </p>
- ocr_sdks/ocr_table_sdk<br>
- 中英文表格识别。
</div>
</td>
<td>
@ -171,25 +165,23 @@
</div>
</td>
</tr>
<tr>
<tr>
<td style="width:220px">
<div align="left">
<p>OCR工具箱 6 led文字识别 - ocr_sdks/ocr_led_sdk</p>
led表盘文字识别。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/OCR/images/led_rec_result.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>人脸工具箱 1人脸检测(含5个人脸关键点) - face_sdks/face_detection_sdk</p>
人脸检测(含5个人脸关键点)提供了两个模型的实现。
<p>人脸工具箱 face_sdks</p>
1人脸检测(含关键点) <br>
- face_detection_sdk<br>
2人脸对齐<br>
- face_alignment_sdk<br>
- 根据人脸关键点对齐。<br>
3人脸特征提取与比对
- face_feature_sdk<br>
4人脸分辨率提升<br>
- face_sr_sdk<br>
5图片人脸修复<br>
- face_restoration_sdk<br>
6口罩检测 <br>
- mask_sdk
</div>
</td>
<td>
@ -197,75 +189,6 @@
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/face_sdk/images/retinaface_detected.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>人脸工具箱 2人脸对齐- face_sdks/face_alignment_sdk</p>
根据人脸关键点对齐人脸。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/face_sdk/images/face_align.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>人脸工具箱 3人脸特征提取与比对- face_sdks/face_feature_sdk</p>
人脸识别完整的pipeline人脸检测(含人脸关键点) --> 人脸对齐 --> 人脸特征提取 --> 人脸比对
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/face_sdk/images/face_feature.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>人脸工具箱 4人脸分辨率提升- face_sdks/face_sr_sdk</p>
包含两个功能:<br>
1.单张人脸图片超分辨。<br>
2.自动检测人脸,然后对齐人脸后提升分辨率。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/face_sdk/images/single_face_sr.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>人脸工具箱 5图片人脸修复- face_sdks/face_restoration_sdk</p>
- 自动检测人脸及关键地,然后抠图,然后根据人脸关键点转正对齐。<br>
- 对所有转正对齐的人脸提升分辨率。<br>
- 使用分割模型提取人脸,逆向变换后贴回原图。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/face_sdk/images/face_res.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>人脸工具箱 6口罩检测 - face_sdks/mask_sdk</p>
口罩检测,给出检测框。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/mask_sdk/face-masks.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td>
@ -319,19 +242,6 @@
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>反光衣检测 - reflective_vest_sdk</p>
实现施工区域或者危险区域人员穿戴检测。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/sec_sdks/images/reflective_detect_result.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
@ -516,32 +426,6 @@
<div align="center">
<table>
<tr>
<td style="width:220px">
<div align="left">
<p>fastText - kits/fasttext_sdk</p>
fastText是一个快速文本分类算法。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/nlp_sdks/fastText.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>解析npy/npz文件 - kits/npy_npz_sdk</p>
java读取python numpy保存的npz、npy文件。。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/nlp_sdks/numpy.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
@ -571,21 +455,15 @@
<tr>
<td style="width:220px">
<div align="left">
<p>词法分析SDK [中文] - lexical_analysis/lac_sdk</p>
词法分析模型能整体性地完成中文分词、词性标注、专名识别任务。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/nlp_sdks/lac_network.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>202种语言互相翻译 - translation/trans_nllb_sdk</p>
支持202种语言互相翻译,支持 CPU / GPU。
<p>机器翻译</p>
1. 202种语言互相翻译<br>
- translation/trans_nllb_sdk<br>
- 支持202种语言互相翻译,<br>
- 支持 CPU / GPU。 <br>
2. 中英互相翻译 <br>
- translation/translation_sdk <br>
- 可以进行英语和中文之间的翻译,<br>
- 支持 CPU / GPU。
</div>
</td>
<td>
@ -594,61 +472,24 @@
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>中英互相翻译 - translation/translation_sdk</p>
可以进行英语和中文之间的翻译,支持 CPU / GPU。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/nlp_sdks/translation.jpeg" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>代码特征向量提取工具箱 - embedding/*</p>
3个SDK<br>
1.code2vec_sdk<br>
2.codet5p_110m_sdk<br>
3.mpnet_base_v2_sdk<br>
自然语言与代码特征提取工具箱提供3个SDK以满足不同精度与速度的需要。。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/nlp_sdks/Universal-Sentence-Encoder.png" width = "400px"/>
</div>
</td>
</tr>
</tr>
<td style="width:220px">
<div align="left">
<p>文本特征提取向量工具箱【中文】 - embedding/*</p>
文本语义特征提取工具箱提供4个 SDK<br>
1.m3e_cn_sdk<br>
2.text2vec_base_chinese_sdk<br>
3.text2vec_base_chinese_sentence_sdk<br>
4.text2vec_base_chinese_paraphrase_sdk
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/nlp_sdks/Universal-Sentence-Encoder.png" width = "400px"/>
</div>
</td>
</tr>
</tr>
<td style="width:220px">
<div align="left">
<p>文本特征提取向量工具箱【中文】 - embedding/*</p>
文本语义特征向量提取工具箱【多语言】提供 3 个 SDK<br>
1.sentence_encoder_15_sdk支持 15 种语言)<br>
2.sentence_encoder_100_sdk支持100种语言<br>
3.text2vec_base_multilingual_sdk支持50+种语言)
<p>文本特征提取向量工具箱</p>
- embedding/*<br>
-1. 4个中文SDK<br>
1).m3e_cn_sdk<br>
2).text2vec_base_chinese_sdk<br>
3).text2vec_base_chinese_sentence_sdk<br>
4).text2vec_base_chinese_paraphrase_sdk
-2. 3个多语言SDK<br>
1).sentence_encoder_15_sdk<br>(支持 15 种语言)<br>
2).sentence_encoder_100_sdk<br>支持100种语言<br>
3).text2vec_base_multilingual_sdk<br>支持50+种语言)
-3. 3个代码语义SDK<br>
1).code2vec_sdk<br>
2).codet5p_110m_sdk<br>
3).mpnet_base_v2_sdk<br>
</div>
</td>
<td>
@ -676,21 +517,11 @@
<tr>
<td>
<div align="left">
<p>语音识别ASR【短语音】 - asr_whisper_sdk</p>
中文语音识别。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/voice_sdks/asr.jpeg" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td>
<div align="left">
<p>语音识别ASR【长语音】 - asr_whisper_long_sdk</p>
中文语音识别。
<p>中文语音识别ASR</p>
1. 短语音 <br>
- asr_whisper_sdk<br>
2. 长语音 <br>
- asr_whisper_long_sdk
</div>
</td>
<td>
@ -702,21 +533,9 @@
<tr>
<td style="width:220px">
<div align="left">
<p>语音处理包Librosa- librosa_sdk</p>
python语音处理库librosa的java实现。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/voice_sdks/phoneme.jpeg" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>TTS 文本转为语音 - tts_sdk</p>
TTS 文本转为语音。
<p>TTS 文本转为语音 </p>
- tts_sdk<br>
- TTS 文本转为语音。
</div>
</td>
<td>
@ -742,34 +561,13 @@
<tr>
<td style="width:220px">
<div align="left">
<p>摄像头口罩检测 - camera_facemask_sdk</p>
读取本地摄像头,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/mask_sdk/face-masks.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>MP4检测口罩 - mp4_facemask_sdk</p>
读取本地MP4文件实时需要有显卡的台式机否则会比较卡顿检测口罩。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/mask_sdk/face-masks.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>rtsp取流检测口罩 - rtsp_facemask_sdk</p>
通过rtsp取流实时需要有显卡的台式机否则会比较卡顿检测口罩。
<p>视频流分析</p>
1. 摄像头口罩检测 <br>
- camera_facemask_sdk<br>
2. MP4检测口罩 <br>
- mp4_facemask_sdk<br>
3. rtsp取流检测口罩 <br>
- rtsp_facemask_sdk
</div>
</td>
<td>
@ -794,23 +592,13 @@
<tr>
<td style="width:220px">
<div align="left">
<p>flink-情感倾向分析【英文】SDK - flink_sentiment_analysis_sdk</p>
情感倾向分析Sentiment Classification
针对带有主观描述的文本,可自动判断该文本的情感极性类别并给出相应的置信度。
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/nlp_sdks/sentiment_analysis.jpeg" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td style="width:220px">
<div align="left">
<p>kafka-情感倾向分析【英文】SDK - kafka_sentiment_analysis_sdk</p>
情感倾向分析Sentiment Classification
针对带有主观描述的文本,可自动判断该文本的情感极性类别并给出相应的置信度。
<p>大数据分析</p>
flink-情感倾向分析<br>
flink_sentiment_analysis_sdk<br>
kafka-情感倾向分析<br>
kafka_sentiment_analysis_sdk<br>
针对带有主观描述的文本,<br>
可自动判断该文本的情感极性类别并给出相应的置信度。
</div>
</td>
<td>
@ -825,6 +613,14 @@
- 6. 6_web_app - [Web应用前端VUE后端Springboot]
```text
1). 训练引擎
2). 代码语义搜索
3). 机器翻译
4). 一键抠图
5). 图像分辨率增强
6). 图像&文本的跨模态相似性比对检索【支持40种语言】
7). 文本向量搜索,可配合大模型使用
8). 人像搜索
9). 语音识别
...
```
@ -833,7 +629,7 @@
<tr>
<td>
<div align="left">
<p>AI 训练平台 - training</p>
<p>AI 训练平台 <br>- training</p>
AI训练平台提供分类模型训练能力。<br>
并以REST API形式为上层应用提供接口。<br>
</div>
@ -847,31 +643,25 @@
<tr>
<td>
<div align="left">
<p>代码语义搜索 - code_search</p>
用于软件开发过程中的,代码搜代码,语义搜代码。<br>s
1. 代码语义搜索【无向量引擎版】 <br>
- simple_code_search<br>
主要特性<br>
- 支持100万以内的数据量<br>
- 随时对数据进行插入、删除、搜索、更新等操作<br>
2. 代码语义搜索【向量引擎版】 - code_search<br>
主要特性<br>
<p>代码语义搜索 <br>- code_search</p>
用于软件开发过程中的,<br>代码搜代码,语义搜代码。<br>
主要特性:<br>
- 底层使用特征向量相似度搜索<br>
- 单台服务器十亿级数据的毫秒级搜索<br>
- 近实时搜索,支持分布式部署<br>
- 随时对数据进行插入、删除、搜索、更新等操作
- 随时对数据进行插入、<br>删除、搜索、更新等操作
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/data/images/code_search_arc.png" width = "400px"/>
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/data/images/codesearch.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td>
<div align="left">
<p>202种语言互相翻译 Web 应用 - text_translation</p>
<p>机器翻译<br>- text_translation</p>
- 支持202种语言互相翻译。<br>
- 支持 CPU / GPU<br>
</div>
@ -885,7 +675,7 @@
<tr>
<td>
<div align="left">
<p>一键抠图 Web 应用 - image_seg</p>
<p>一键抠图 Web 应用<br>- image_seg</p>
当前版本包含了下面功能:<br>
- 1. 通用一键抠图<br>
- 2. 人体一键抠图<br>
@ -901,7 +691,7 @@
<tr>
<td>
<div align="left">
<p>图片一键高清- image_gan</p>
<p>图片一键高清<br>- image_gan</p>
当前版本包含了下面功能:<br>
- 图片一键高清: 提升图片4倍分辨率。<br>
- 头像一键高清<br>
@ -917,17 +707,9 @@
<tr>
<td>
<div align="left">
<p>图像&文本的跨模态相似性比对检索【支持40种语言】<br>
<p>图像&文本的跨模态检索<br>
- image_text_search</p>
- 包含两个项目,满足不同场景的需要<br>
- 1. 图像&文本的跨模态相似性比对检索<br>
【无向量引擎版】 <br>
- simple_image_text_search<br>
- 支持100万以内的数据量<br>
- 随时对数据进行插入、删除、搜索、更新等操作<br>
- 2. 图像&文本的跨模态相似性比对检索<br>
【向量引擎版】 <br>
- image_text_search<br>
- 支持40种语言<br>
- 以图搜图:上传图片搜索<br>
- 以文搜图:输入文本搜索<br>
- 数据管理:提供图像压缩包(zip格式)上传<br>
@ -942,16 +724,11 @@
<tr>
<td>
<div align="left">
<p>文本向量搜索 - text_search</p>
- 包含两个项目,满足不同场景的需要<br>
- 1. 文本向量搜索【无向量引擎版】 <br>
- simple_text_search <br>
- 2. 文本向量搜索【向量引擎版】 <br>
- text_search<br>
<p>文本向量搜索 <br>- text_search</p>
- 语义搜索,通过句向量相似性,<br>检索语料库中与query最匹配的文本 <br>
- 文本聚类,文本转为定长向量,<br>通过聚类模型可无监督聚集相似文本 <br>
- 文本分类,表示成句向量,<br>直接用简单分类器即训练文本分类器 <br>
- RAG 用于大模型搜索增强生成
- RAG用于大模型搜索增强生成
</div>
</td>
<td>
@ -963,24 +740,19 @@
<tr>
<td>
<div align="left">
<p>人像搜索 - face_search</p>
- 包含两个项目,满足不同场景的需要<br>
- 1. 人像搜索【精简版】 <br>
- simple_face_search <br>
- 2. 人像搜索【完整版】<br>
- face_search<br>
- 搜索管理:提供通用图像搜索,<br>人像搜索,图像信息查看<br>
- 存储管理:提供图像压缩包(zip格式)上传,<br>人像特征提取,通用特征提取<br>
- 用户管理:提供用户的相关配置,<br>新增用户后默认密码为123456<br>
- 角色管理:对权限与菜单进行分配,<br>可根据部门设置角色的数据权限<br>
- 菜单管理:已实现菜单动态路由,<br>后端可配置化,支持多级菜单<br>
- 部门管理:可配置系统组织架构,<br>树形表格展示<br>
- 岗位管理:配置各个部门的职位<br>
- 字典管理:可维护常用一些固定的数据,<br>如:状态,性别等<br>
- 系统日志:记录用户操作日志与异常日志,<br>方便开发人员定位排错<br>
- SQL监控采用druid 监控数据库访问性能,<br>默认用户名admin密码123456<br>
- 定时任务整合Quartz做定时任务<br>加入任务日志,任务运行情况一目了然<br>
- 服务监控:监控服务器的负载情况
<p>人像搜索 <br>- face_search</p>
- 搜索管理<br>
- 存储管理<br>
- 用户管理<br>
- 角色管理<br>
- 菜单管理<br>
- 部门管理<br>
- 岗位管理<br>
- 字典管理<br>
- 系统日志<br>
- SQL监控<br>
- 定时任务<br>
- 服务监控
</div>
</td>
<td>
@ -992,8 +764,9 @@
<tr>
<td>
<div align="left">
<p>语音识别Web 应用 - asr</p>
- 本例子提供了英文语音识别,<br>中文语音识别。
<p>语音识别Web 应用 <br>- asr</p>
- 英文语音识别,<br>
- 中文语音识别。
</div>
</td>
<td>
@ -1202,34 +975,12 @@
<tr>
<td>
<div align="left">
<p>1. 文生图:输入提示词(仅支持英文),<br>生成图片(仅支持英文)</p>
1. 文生图<br>
- txt2image_sdk<br>
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/9_aigc/stable_diffusion/astronaut.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td>
<div align="left">
<p>2. 图生图:根据图片及提示词<br>(仅支持英文)生成图片</p>
- image2image_sdk<br>
</div>
</td>
<td>
<div align="center">
<img src="https://aias-home.oss-cn-beijing.aliyuncs.com/AIAS/9_aigc/stable_diffusion/astronaut.png" width = "400px"/>
</div>
</td>
</tr>
<tr>
<td>
<div align="left">
<p>3. Lora 文生图</p>
- lora_sdk<br>
- 输入提示词(英文),<br>生成图片(英文)<br>
2. 图生图<br>
- 根据图片及提示词(英文)<br>生成图片<br>
- image2image_sdk
</div>
</td>
<td>
@ -1409,7 +1160,7 @@
<tr>
<td>
<div align="left">
<p>大模型离线桌面App - desktop_app_llm</p>
<p>大模型离线桌面App <br>- desktop_app_llm</p>
- 支持中/英文
- 模型支持chatglm3llama3alpaca3等<br>
- 支持4位8位量化16位半精度模型。<br>
@ -1426,7 +1177,7 @@
<tr>
<td>
<div align="left">
<p>OCR文字识别桌面App - desktop_app_ocr</p>
<p>OCR文字识别桌面App <br>- desktop_app_ocr</p>
- 图片文字识别<br>
- 支持windows, linux, mac 一键安装
</div>
@ -1440,7 +1191,7 @@
<tr>
<td>
<div align="left">
<p>图像高清放大桌面App - desktop_app_upscale</p>
<p>图像高清放大桌面App <br>- desktop_app_upscale</p>
- 单张图片分辨率放大<br>
- 批量图片分辨率放大<br>
- 支持 windows, macos, ubuntu<br>