awtk/docs/how_to_update_gpinyin_data.md
2020-08-16 09:10:01 +08:00

36 lines
759 B
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 如何更新拼音输入法字典和联想字库
有的情况下,可能需要自己更新拼音输入法字典和联想词库。比如:
* 使用更好的字典数据。
* 去掉一些不需要的汉字。
* 使用更完善的联想字库。
## 1.更新拼音输入法字典
### 1.1 根据自己的需要编辑下列文件:
* 3rd/gpinyin/data/rawdict\_utf16\_65105\_freq.txt
* 3rd/gpinyin/data/valid\_utf16.txt
### 1.2 重新生成数据
```
./bin/gpinyingen
```
### 1.3 拷贝3rd/gpinyin/data/gpinyin.dat到资源目录的data目录。
```
cp 3rd/gpinyin/data/gpinyin.dat design/default/data/gpinyin.dat
```
## 2.更新联想词库
联想词库是抓取网页通过分词工具自动生成的。请参考tools/word_gen/README.md