AIAS/3_audio_sdks/ph_sdk/README.md

78 lines
2.3 KiB
Markdown
Raw Normal View History

2021-10-03 22:46:11 +08:00
## 音素相关的文本处理 SDK
音素相关的文本处理工具箱。适用于中文、英文和中英混合的音素,其中汉字拼音采用清华大学的音素,
英文字符分字母和英文。
### SDK包含的工具
#### SequenceUtils:
- 文本转为拼音
- 拼音转为音素
- 文本转为音素
- 文本转为ID列表
#### NumberUtils:
数字读法 - 按数值大小读,一个一个数字读。
#### ConvertUtils
文本转换 - 全角半角转换,简体繁体转换。
## 运行例子 - SequenceExample
运行成功后,命令行应该看到下面的信息:
```text
...
# SequenceUtils.text2pinyin("文本转为拼音。")
wen2 ben3 zhuan3 wei4 pin1 yin1 。
# SequenceUtils.pinyin2phoneme(SequenceUtils.text2pinyin("拼音转为音素。")
[p, in, 1, -, ii, in, 1, -, zh, uan, 3, -, uu, ui, 4, -, ii, in, 1, -, s, u, 4, -, ., -, ~, _]
# SequenceUtils.text2phoneme("文本转为音素。")
[uu, un, 2, -, b, en, 2, -, zh, uan, 3, -, uu, ui, 4, -, ii, in, 1, -, s, u, 4, -, ., -, ~, _]
# SequenceUtils.text2sequence("文本转为ID列表。")
[25, 63, 72, 2, 4, 37, 72, 2, 29, 59, 73, 2, 25, 62, 74, 2, 2, 15, 45, 74, 2, 4, 44, 73, 2, 130, 2, 1, 0]
```
## 运行例子 - NumberExample
运行成功后,命令行应该看到下面的信息:
```text
...
# NumberUtils.sayDigit("1234567890123456")
一二三四五六七八九零一二三四五六
# NumberUtils.sayNumber("123456")
十二万三千四百五十六
# NumberUtils.sayDecimal("3.14")
三点一四
```
## 运行例子 - ConvertExample
运行成功后,命令行应该看到下面的信息:
```text
...
# 半角转全角 ConvertUtils.ban2quan("aA1 ,:$。、")
aA1 ,:$。、
# 全角转半角 ConvertUtils.quan2ban("aA1 ,:$。、")
aA1 ,:$。、
# 简体转繁体 ConvertUtils.jian2fan("中国语言")
中國語言
# 繁体转简体 ConvertUtils.fan2jian("中國語言")
中国语言
```
2021-10-27 16:46:10 +08:00
### 帮助
引擎定制化配置,可以提升首次运行的引擎下载速度,解决外网无法访问或者带宽过低的问题。
[引擎定制化配置](http://aias.top/engine_cpu.html)
2021-10-29 10:29:42 +08:00
### 官网:
[官网链接](http://www.aias.top/)
### Git地址
[Github链接](https://github.com/mymagicpower/AIAS)
[Gitee链接](https://gitee.com/mymagicpower/AIAS)