AIAS/3_audio_sdks
2024-11-25 10:43:10 +08:00
..
asr_sdk no message 2024-11-25 10:43:10 +08:00
ffmpeg_audio_sdk no message 2024-11-25 10:43:10 +08:00
fft_sdk no message 2024-11-25 10:43:10 +08:00
librosa_sdk no message 2024-11-06 16:08:03 +08:00
ph_sdk no message 2024-11-25 10:43:10 +08:00
silero_vad_sdk no message 2024-11-25 10:43:10 +08:00
sound_sdk no message 2024-11-25 10:43:10 +08:00
sv2tts_speakencoder_sdk no message 2024-11-25 10:43:10 +08:00
tacotron2_sdk no message 2024-11-25 10:43:10 +08:00
tacotron_stft_sdk no message 2024-11-25 10:43:10 +08:00
tts_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
voiceprint_sdk no message 2024-11-25 10:43:10 +08:00
webrtc_vad_sdk update VAD (voice activity detector) 2023-11-30 15:16:37 +08:00
README_CN.md update readme. 2024-10-20 14:01:45 +08:00
README.md update readme 2024-10-20 16:27:54 +08:00

项目清单:

  • 3_audio_sdks - [语音处理 SDK]
  1). 工具箱系列音素工具箱librosajava soundjavacv ffmpeg, fft, vad工具箱等。
  2). 声音克隆
  3). 语音合成
  4). 声纹识别
  5). 语音识别
      ...

语音识别ASR【短语音】 - asr_whisper_sdk

中文语音识别。

语音识别ASR【长语音】 - asr_whisper_long_sdk

中文语音识别。

语音处理包Librosa- librosa_sdk

python语音处理库librosa的java实现。

TTS 文本转为语音 - tts_sdk

TTS 文本转为语音。