24 KiB
|
|
|
|
项目清单:
-
- 1_image_sdks - [图像识别 SDK]
1). 工具箱系列:图像处理工具箱(静态图像)
2). 目标检测:目标检测、目标跟踪、人脸检测&识别
3). 图像分割:图像分割、医疗影像
4). 行为分析:行为识别、姿态估计
5). GAN: 超分辨率、动作驱动、风格迁移、图像生成
6). 其它类别:OCR、深度估计、视频理解、图像检索
...
OCR工具箱 1:OCR方向检测与旋转 - ocr_sdks/ocr_direction_det_sdk OCR图像预处理。 |
|
OCR工具箱 2:OCR文字识别 - ocr_sdks/ocr_v3_sdk 1. V3 文本检测:- 中文文本检测 - 英文文本检测 - 多语言文本检测 2. V3 文本识别: - 中文简体 - 中文繁体 - 英文 - 韩语 - 日语 - 阿拉伯 - 梵文 - 泰米尔语 - 泰卢固语 - 卡纳达文 - 斯拉夫 |
|
OCR工具箱 3:OCR文字识别 - ocr_sdks/ocr_v4_sdk 原生支持旋转倾斜文本文字识别。 |
|
OCR工具箱 4:版面分析 - ocr_sdks/ocr_layout_sdk 可以用于配合文字识别,表格识别的流水线处理使用。1. 中文版面分析 2. 英文版面分析 3. 中英文文档 - 表格区域检测 |
|
OCR工具箱 5: 表格识别 - ocr_sdks/ocr_table_sdk 中英文表格识别。 |
|
OCR工具箱 6: led文字识别 - ocr_sdks/ocr_led_sdk led表盘文字识别。 |
|
人脸工具箱 1:人脸检测(含5个人脸关键点) - face_sdks/face_detection_sdk 人脸检测(含5个人脸关键点)提供了两个模型的实现。 |
|
人脸工具箱 2:人脸对齐- face_sdks/face_alignment_sdk 根据人脸关键点对齐人脸。 |
|
人脸工具箱 3:人脸特征提取与比对- face_sdks/face_feature_sdk 人脸识别完整的pipeline:人脸检测(含人脸关键点) --> 人脸对齐 --> 人脸特征提取 --> 人脸比对 |
|
人脸工具箱 4:人脸分辨率提升- face_sdks/face_sr_sdk 包含两个功能:1.单张人脸图片超分辨。 2.自动检测人脸,然后对齐人脸后提升分辨率。 |
|
人脸工具箱 5:图片人脸修复- face_sdks/face_restoration_sdk - 自动检测人脸及关键地,然后抠图,然后根据人脸关键点转正对齐。- 对所有转正对齐的人脸提升分辨率。 - 使用分割模型提取人脸,逆向变换后贴回原图。 |
|
人脸工具箱 6:口罩检测 - face_sdks/mask_sdk 口罩检测,给出检测框。 |
|
动物分类识别 - classification/animal_sdk 动物识别sdk,支持7978种动物的分类识别。 |
|
菜品分类识别 - classification/dish_sdk 菜品识别sdk,支持8416种菜品的分类识别。 |
|
烟火检测 - fire_smoke_sdk 烟火检测,给出检测框和置信度。 |
|
行人检测 - pedestrian_sdk 行人检测,给出检测框和置信度。 |
|
反光衣检测 - reflective_vest_sdk 实现施工区域或者危险区域人员穿戴检测。 |
|
智慧工地检测 - smart_construction_sdk 支持检测的类别:人体,安全帽。 |
|
车辆检测 - vehicle_sdk 车辆检测,给出检测框和置信度。 |
|
-
- 2_nlp_sdks - [自然语言 SDK]
1). 工具箱系列:sentencepiece,fastText,npy/npz文件处理等。
2). 大模型
3). 词向量
4). 机器翻译
...
fastText - kits/fasttext_sdk fastText是一个快速文本分类算法。 |
|
解析npy/npz文件 - kits/npy_npz_sdk java读取python numpy保存的npz、npy文件。。 |
|
Sentencepiece分词 - kits/sentencepiece_sdk Sentencepiece分词的Java实现。 |
|
jieba分词 - lexical_analysis/jieba_sdk jieba分词java版本的简化实现。 |
|
词法分析SDK [中文] - lexical_analysis/lac_sdk 词法分析模型能整体性地完成中文分词、词性标注、专名识别任务。 |
|
202种语言互相翻译 - translation/trans_nllb_sdk 支持202种语言互相翻译,支持 CPU / GPU。 |
|
中英互相翻译 - translation/translation_sdk 可以进行英语和中文之间的翻译,支持 CPU / GPU。 |
|
-
- 3_audio_sdks - [语音处理 SDK]
1). 工具箱系列:音素工具箱,librosa,java sound,javacv ffmpeg, fft, vad工具箱等。
2). 声音克隆
3). 语音合成
4). 声纹识别
5). 语音识别
...
语音识别(ASR)【短语音】 - asr_whisper_sdk 中文语音识别。 |
|
语音识别(ASR)【长语音】 - asr_whisper_long_sdk 中文语音识别。 |
|
语音处理包Librosa- librosa_sdk python语音处理库librosa的java实现。 |
|
TTS 文本转为语音 - tts_sdk TTS 文本转为语音。 |
|
-
- 4_video_sdks - [视频解析SDK]
1). 摄像头口罩检测 - camera_facemask_sdk
2). MP4检测口罩 - mp4_facemask_sdk
3). rtsp取流检测口罩 - rtsp_facemask_sdk
摄像头口罩检测 - camera_facemask_sdk 读取本地摄像头,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。 |
|
MP4检测口罩 - mp4_facemask_sdk 读取本地MP4文件,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。 |
|
rtsp取流检测口罩 - rtsp_facemask_sdk 通过rtsp取流,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。 |
|
-
- 5_bigdata_sdks - [大数据SDK]
1). flink-情感倾向分析【英文】- flink_sentence_encoder_sdk
2). kafka-情感倾向分析【英文】- kafka_sentiment_analysis_sdk
...
flink-情感倾向分析【英文】SDK - flink_sentiment_analysis_sdk 情感倾向分析(Sentiment Classification) 针对带有主观描述的文本,可自动判断该文本的情感极性类别并给出相应的置信度。 |
|
kafka-情感倾向分析【英文】SDK - kafka_sentiment_analysis_sdk 情感倾向分析(Sentiment Classification) 针对带有主观描述的文本,可自动判断该文本的情感极性类别并给出相应的置信度。 |
|
-
- 6_metaverse - [2D虚拟人]
1). Live2DDemo
...
2D虚拟人APP - Live2DDemo 最近元宇宙的概念越来越火。虚拟人技术是其中重要的组成部分。 其原理是通过视频来捕捉人脸,并且将人的面部动作同步到人物身上。人们只需要一个摄像头就可以制造出一个生动活泼的虚拟形象了。 |
|
-
- 7_engine_hub - [平台引擎]
1). 训练引擎
...
AI 训练平台 - training AI训练平台提供分类模型训练能力。并以REST API形式为上层应用提供接口。 |
|
-
- 8_aigc - [图像生成]
1). 图像生成 stable_diffusion
...
java版StableDiffusion - stable_diffusion 文生图:输入提示词(仅支持英文),生成图片(仅支持英文) 图生图:根据图片及提示词(仅支持英文)生成图片 |
|
- 9 9_desktop_app - [桌面App]
1). 大模型离线桌面App
2). OCR文字识别桌面App
3). 图像高清放大桌面App
...
大模型离线桌面App - desktop_app_llm - 支持中/英文 - 模型支持chatglm3,llama3,alpaca3等- 支持4位,8位量化,16位半精度模型。 - 支持windows及mac系统 - 支持CPU,GPU |
|
OCR文字识别桌面App - desktop_app_ocr - 图片文字识别- 支持windows, linux, mac 一键安装 |
|
图像高清放大桌面App - desktop_app_upscale - 单张图片分辨率放大- 批量图片分辨率放大 - 支持 windows, macos, ubuntu |
|
1. 官网:
2. 开源地址:
3. 人工智能算法:
4. 其它研究专题:
1). AI + 量子计算
- 官网: http://www.qubits.top/
- Gitee: https://gitee.com/mymagicpower/qubits
- GitHub: https://github.com/mymagicpower/qubits