AIAS/README.md
2023-10-15 23:28:24 +08:00

28 KiB
Raw Blame History

star fork

中文 | English

官网:

联系方式:

AIAS (AI Acceleration Suite - AI算法落地加速器套件)

  • AIAS提供的参考能力:
1. SDK包含了对各Model Hub以及GitHub优选模型的支持。
2. 平台引擎包含了API平台引擎搜索引擎训练引擎边缘计算引擎等。
3. 场景套件包含了面向ToBToCToG各场景的套件比如生物医药套件。
  • AIAS的目标:
1. 加速算法落地
2. 为集成商赋能
3. 为企业内部项目赋能

项目清单:

    1. 1_image_sdks - [图像识别 SDK]
  1). 工具箱系列:图像处理工具箱(静态图像)
  2). 目标检测:目标检测、目标跟踪、人脸检测&识别
  3). 图像分割:图像分割、遥感图像、医疗影像
  4). 行为分析:行为识别、姿态估计
  5). GAN    超分辨率、动作驱动、风格迁移、图像生成
  6). 其它类别OCR、SLAM、深度估计、自动驾驶、强化学习、视频理解、图像融合、图像检索
      ...

动物分类识别 - classification/animal_sdk

动物识别sdk支持7978种动物的分类识别。

菜品分类识别 - classification/dish_sdk

菜品识别sdk支持8416种菜品的分类识别。

单目深度估计 - depth_estimation_sdk

MiDaS_Small实现单目深度估计模型可通过输入图像估计其中的深度信息。

动作驱动 - first_order_sdk

sdk以一段动作视频去驱动一张图片运动。可以驱动任意类型的运动。

实例分割 - instance_segmentation_sdk

支持对图片中80个分类的目标进行实例分割。

OCR文字识别 - ocr_v4_sdk

原生支持旋转倾斜文本文字识别。

人群密度检测 - security/crowd_sdk

统计人数,计算密度图。

人脸关键点 - security/face_landmark_sdk

识别输入图片中的所有人脸关键点每张人脸检测出68个关键点。

人脸检测 - security/face_sdk

识别输入图片中的所有人脸,给出检测框。

烟火检测 - security/fire_smoke_sdk

烟火检测,给出检测框和置信度。

口罩检测 - security/mask_sdk

口罩检测,给出检测框。

行人检测 - security/pedestrian_sdk

行人检测,给出检测框和置信度。

反光衣检测 - security/reflective_vest_sdk

实现施工区域或者危险区域人员穿戴检测。

智慧工地检测 - security/smart_construction_sdk

支持检测的类别:人体,安全帽。

车辆检测 - security/vehicle_sdk

车辆检测,给出检测框和置信度。
    1. 2_nlp_sdks - [自然语言 SDK]
  1). 工具箱系列TokenizersentencepiecefastTextnpy/npz文件处理等。
  2). 文本生成
  3). 词向量
  4). 机器翻译
  5). 语义模型
  6). 情感分析
  7). 句法分析
  8). 词法分析
  9). 文本审核
      ...

轻量句向量SDK【英文】 - embedding/sentence_encoder_en_sdk

句向量是指将语句映射至固定维度的实数向量。

词向量SDK【中文】- embedding/word_encoder_cn_sdk

词向量/词嵌入Word embedding是自然语言处理NLP中语言模型与表征学习技术的统称。

词向量SDK【英文】- embedding/word_encoder_en_sdk

每个单词或词组被映射为实数域上的向量。

fastText - kits/fasttext_sdk

fastText是一个快速文本分类算法。

解析npy/npz文件 - kits/npy_npz_sdk

java读取python numpy保存的npz、npy文件。。

Sentencepiece分词 - kits/sentencepiece_sdk

Sentencepiece分词的Java实现。

huggingface分词 - kits/tokenizer_sdk

huggingface Tokenizer。

jieba分词 - lexical_analysis/jieba_sdk

jieba分词java版本的简化实现。

词法分析SDK [中文] - lexical_analysis/lac_sdk

词法分析模型能整体性地完成中文分词、词性标注、专名识别任务。

短文本相似度SDK [中文] - semantic_simnet_bow_sdk

计算两个句子的cosin相似度。

情感分析SDK [中文]- sentiment_analysis/senta_bilstm_sdk

判断该文本的情感极性类别并给出相应的置信度。

对话情绪识别SDK [中文] - sentiment_analysis/senta_textcnn_sdk

对话情绪识别Emotion Detection专注于识别智能对话场景中用户的情绪 针对智能对话场景中的用户文本,自动判断该文本的情绪类别并给出相应的置信度。

情感倾向分析SDK - sentiment_analysis/sentiment_analysis_sdk

情感倾向分析Sentiment Classification针对带有主观描述的中文文本可自动判断该文本的情感极性类别并给出相应的置信度。

文本审核SDK [中文] - porn_detection_sdk

色情检测模型可自动判别文本是否涉黄并给出相应的置信度,对文本中的色情描述、低俗交友、污秽文爱进行识别。

中文翻译为英文 - translation_zh_en_sdk

中文翻译为英文SDK。
    1. 3_audio_sdks - [语音处理 SDK]
  1). 工具箱系列音素工具箱librosajava soundjavacv ffmpeg, fft, vad工具箱等。
  2). 声音克隆
  3). 语音合成
  4). 声纹识别
  5). 语音识别
      ...

语音识别ASR【短语音】 - asr_sdk

中文语音识别。

语音处理包Librosa- librosa_sdk

python语音处理库librosa的java实现。

音素相关的文本处理- ph_sdk

音素相关的文本处理工具箱。适用于中文、英文和中英混合的音素,其中汉字拼音采用清华大学的音素, 英文字符分字母和英文。

音特征编码器提取特征向量 - sv2tts_speakencoder_sdk

声音特征编码器。

提取mel(梅尔)频谱 - tacotron_stft_sdk

TacotronSTFT 提取mel(梅尔)频谱。

基于目标音色的梅尔频谱图 - tacotron2_sdk

模型生成文本基于目标音色的梅尔频谱图。

TTS 文本转为语音 - tts_sdk

TTS 文本转为语音。

声纹识别 - voiceprint_sdk

声纹特征向量提取,声纹相似度计算。
    1. 4_video_sdks - [视频解析SDK]
  1). 摄像头人脸检测 - camera_face_sdk
  2). 摄像头口罩检测 - camera_facemask_sdk
  3). MP4检测人脸 - mp4_face_sdk
  4). MP4检测口罩 - mp4_facemask_sdk
      ...

摄像头人脸检测 - camera_face_sdk

读取本地摄像头,实时(需要有显卡的台式机,否则会比较卡顿)检测人脸。

摄像头口罩检测 - camera_facemask_sdk

读取本地摄像头,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。

MP4检测人脸 - mp4_face_sdk

读取本地MP4文件实时需要有显卡的台式机否则会比较卡顿检测人脸。

MP4检测口罩 - mp4_facemask_sdk

读取本地MP4文件实时需要有显卡的台式机否则会比较卡顿检测口罩。

rtsp取流检测人脸 - rtsp_face_sdk

通过rtsp取流实时需要有显卡的台式机否则会比较卡顿检测人脸。

rtsp取流检测口罩 - rtsp_facemask_sdk

通过rtsp取流实时需要有显卡的台式机否则会比较卡顿检测口罩。
    1. 5_bigdata_sdks - [大数据SDK]
  1). 摄像头人脸检测 - flink_face_sdk
  2). 摄像头口罩检测 - flink_sentence_encoder_sdk
  3). MP4检测人脸 - flink_sentiment_analysis_sdk
  4). MP4检测口罩 - kafka_face_sdk
      ...

kafka,flink,人脸识别 - flink_face_sdk

图像识别结合kafka,flink协同工作检测人脸。

flink-情感倾向分析【英文】SDK - flink_sentiment_analysis_sdk

情感倾向分析Sentiment Classification 针对带有主观描述的文本,可自动判断该文本的情感极性类别并给出相应的置信度。

kafka-人脸检测SDK - kafka_face_sdk

读取图片转成base64格式发送给kafka。consumer接受到图片的base64数据, 转换成图片并解析。

kafka-情感倾向分析【英文】SDK - kafka_sentiment_analysis_sdk

情感倾向分析Sentiment Classification 针对带有主观描述的文本,可自动判断该文本的情感极性类别并给出相应的置信度。
    1. 6_metaverse - [2D虚拟人]
  1). Live2DDemo
      ...

2D虚拟人APP - Live2DDemo

最近元宇宙的概念越来越火。虚拟人技术是其中重要的组成部分。 其原理是通过视频来捕捉人脸,并且将人的面部动作同步到人物身上。人们只需要一个摄像头就可以制造出一个生动活泼的虚拟形象了。
    1. 7_engine_hub - [平台引擎]
  1). 训练引擎
      ...

AI 训练平台 - training

AI训练平台提供分类模型训练能力。并以REST API形式为上层应用提供接口。
    1. 8_aigc - [图像生成]
  1). 图像生成 stable_diffusion
      ...

java版StableDiffusion - stable_diffusion

文生图:输入提示词(仅支持英文),生成图片(仅支持英文) 图生图:根据图片及提示词(仅支持英文)生成图片
    1. archive_sdks - [归档不再维护的项目]

帮助文档:

其它研究专题:

1. AI + 量子计算

2. AI + 生物医药