mirror of
https://gitee.com/mymagicpower/AIAS.git
synced 2024-12-03 12:48:12 +08:00
.. | ||
src/main | ||
ph_sdk.iml | ||
pom.xml | ||
README.md |
音素相关的文本处理 SDK
音素相关的文本处理工具箱。适用于中文、英文和中英混合的音素,其中汉字拼音采用清华大学的音素, 英文字符分字母和英文。
SDK包含的工具:
SequenceUtils:
- 文本转为拼音
- 拼音转为音素
- 文本转为音素
- 文本转为ID列表
NumberUtils:
数字读法 - 按数值大小读,一个一个数字读。
ConvertUtils
文本转换 - 全角半角转换,简体繁体转换。
运行例子 - SequenceExample
运行成功后,命令行应该看到下面的信息:
...
# SequenceUtils.text2pinyin("文本转为拼音。")
wen2 ben3 zhuan3 wei4 pin1 yin1 。
# SequenceUtils.pinyin2phoneme(SequenceUtils.text2pinyin("拼音转为音素。")
[p, in, 1, -, ii, in, 1, -, zh, uan, 3, -, uu, ui, 4, -, ii, in, 1, -, s, u, 4, -, ., -, ~, _]
# SequenceUtils.text2phoneme("文本转为音素。")
[uu, un, 2, -, b, en, 2, -, zh, uan, 3, -, uu, ui, 4, -, ii, in, 1, -, s, u, 4, -, ., -, ~, _]
# SequenceUtils.text2sequence("文本转为ID列表。")
[25, 63, 72, 2, 4, 37, 72, 2, 29, 59, 73, 2, 25, 62, 74, 2, 2, 15, 45, 74, 2, 4, 44, 73, 2, 130, 2, 1, 0]
运行例子 - NumberExample
运行成功后,命令行应该看到下面的信息:
...
# NumberUtils.sayDigit("1234567890123456")
一二三四五六七八九零一二三四五六
# NumberUtils.sayNumber("123456")
十二万三千四百五十六
# NumberUtils.sayDecimal("3.14")
三点一四
运行例子 - ConvertExample
运行成功后,命令行应该看到下面的信息:
...
# 半角转全角 ConvertUtils.ban2quan("aA1 ,:$。、")
aA1 ,:$。、
# 全角转半角 ConvertUtils.quan2ban("aA1 ,:$。、")
aA1 ,:$。、
# 简体转繁体 ConvertUtils.jian2fan("中国语言")
中國語言
# 繁体转简体 ConvertUtils.fan2jian("中國語言")
中国语言
帮助
引擎定制化配置,可以提升首次运行的引擎下载速度,解决外网无法访问或者带宽过低的问题。
引擎定制化配置