awtk/docs/manual/utf8_t.md

178 lines
5.0 KiB
Markdown
Raw Normal View History

2019-11-15 09:48:41 +08:00
## utf8\_t
### 概述
2019-12-14 13:25:56 +08:00
wchar_t和char类型转换接口。
示例:
```c
const char* str = "hello";
const wchar_t* wstr = L"hello";
char res_str[128];
wchar_t res_wstr[128];
tk_utf8_to_utf16(str, res_wstr, ARRAY_SIZE(res_wstr));
tk_utf8_from_utf16(wstr, res_str, ARRAY_SIZE(res_str));
2019-12-14 13:25:56 +08:00
```
2019-11-15 09:48:41 +08:00
----------------------------------
### 函数
<p id="utf8_t_methods">
| 函数名称 | 说明 |
| -------- | ------------ |
2021-05-11 15:53:22 +08:00
| <a href="#utf8_t_tk_utf8_dup_utf16">tk\_utf8\_dup\_utf16</a> | 把ucs字符串转成UTF8字符串。 |
2019-12-30 12:44:15 +08:00
| <a href="#utf8_t_tk_utf8_from_utf16">tk\_utf8\_from\_utf16</a> | 把ucs字符串转成UTF8字符串。 |
| <a href="#utf8_t_tk_utf8_from_utf16_ex">tk\_utf8\_from\_utf16\_ex</a> | 把ucs字符串转成UTF8字符串。 |
2022-04-22 18:59:41 +08:00
| <a href="#utf8_t_tk_utf8_get_bytes_of_leading">tk\_utf8\_get\_bytes\_of\_leading</a> | 获取第一个字节为c的字符的字节数。 |
2019-12-18 15:40:09 +08:00
| <a href="#utf8_t_tk_utf8_to_utf16">tk\_utf8\_to\_utf16</a> | 将char类型转换为wchar_t类型。 |
2021-05-11 15:53:22 +08:00
| <a href="#utf8_t_tk_utf8_to_utf16_ex">tk\_utf8\_to\_utf16\_ex</a> | 将char类型转换为wchar_t类型。 |
2022-12-05 12:10:53 +08:00
| <a href="#utf8_t_tk_utf8_trim_invalid_char">tk\_utf8\_trim\_invalid\_char</a> | 如果字符串最后一个字符串是无效的,删掉该无效字符。 |
2021-05-11 15:53:22 +08:00
#### tk\_utf8\_dup\_utf16 函数
-----------------------
* 函数功能:
> <p id="utf8_t_tk_utf8_dup_utf16">把ucs字符串转成UTF8字符串。
> 由调用者释放返回的指针。
* 函数原型:
```
char* tk_utf8_dup_utf16 (const wchar_t* in, int32_t size);
```
* 参数说明:
| 参数 | 类型 | 说明 |
| -------- | ----- | --------- |
| 返回值 | char* | 返回UTF8字符串。 |
| in | const wchar\_t* | 输入字符串。 |
| size | int32\_t | 字符串长度。 |
2019-12-18 15:40:09 +08:00
#### tk\_utf8\_from\_utf16 函数
2019-11-15 09:48:41 +08:00
-----------------------
* 函数功能:
2019-12-30 12:44:15 +08:00
> <p id="utf8_t_tk_utf8_from_utf16">把ucs字符串转成UTF8字符串。
2019-11-15 09:48:41 +08:00
* 函数原型:
```
2019-12-30 12:44:15 +08:00
char* tk_utf8_from_utf16 (const wchar_t* in, const char* out, uint32_t out_size);
2019-11-15 09:48:41 +08:00
```
* 参数说明:
| 参数 | 类型 | 说明 |
| -------- | ----- | --------- |
2019-12-30 12:44:15 +08:00
| 返回值 | char* | 返回UTF8字符串。 |
| in | const wchar\_t* | 输入字符串。 |
| out | const char* | 输出字符串。 |
| out\_size | uint32\_t | 输出字符串的最大长度。 |
#### tk\_utf8\_from\_utf16\_ex 函数
-----------------------
* 函数功能:
> <p id="utf8_t_tk_utf8_from_utf16_ex">把ucs字符串转成UTF8字符串。
* 函数原型:
```
char* tk_utf8_from_utf16_ex (const wchar_t* in, uint32_t in_size, const char* out, uint32_t out_size);
```
* 参数说明:
| 参数 | 类型 | 说明 |
| -------- | ----- | --------- |
| 返回值 | char* | 返回UTF8字符串。 |
| in | const wchar\_t* | 输入字符串。 |
| in\_size | uint32\_t | 输入字符串的长度。 |
| out | const char* | 输出字符串。 |
| out\_size | uint32\_t | 输出字符串的最大长度。 |
2022-04-22 18:59:41 +08:00
#### tk\_utf8\_get\_bytes\_of\_leading 函数
-----------------------
* 函数功能:
> <p id="utf8_t_tk_utf8_get_bytes_of_leading">获取第一个字节为c的字符的字节数。
* 函数原型:
```
uint32_t tk_utf8_get_bytes_of_leading (uint8_t c);
```
* 参数说明:
| 参数 | 类型 | 说明 |
| -------- | ----- | --------- |
| 返回值 | uint32\_t | 返回字符的字节数。 |
| c | uint8\_t | 字符的第一个字节。 |
2019-12-18 15:40:09 +08:00
#### tk\_utf8\_to\_utf16 函数
2019-11-15 09:48:41 +08:00
-----------------------
* 函数功能:
2019-12-18 15:40:09 +08:00
> <p id="utf8_t_tk_utf8_to_utf16">将char类型转换为wchar_t类型。
2019-11-15 09:48:41 +08:00
* 函数原型:
```
wchar_t* tk_utf8_to_utf16 (const char* str, const wchar_t* out, uint32_t size);
2019-11-15 09:48:41 +08:00
```
* 参数说明:
| 参数 | 类型 | 说明 |
| -------- | ----- | --------- |
| 返回值 | wchar\_t* | 值。 |
| str | const char* | str。 |
| out | const wchar\_t* | 返回结果缓冲区。 |
| size | uint32\_t | 缓冲区大小。 |
2021-05-11 15:53:22 +08:00
#### tk\_utf8\_to\_utf16\_ex 函数
-----------------------
* 函数功能:
> <p id="utf8_t_tk_utf8_to_utf16_ex">将char类型转换为wchar_t类型。
* 函数原型:
```
wchar_t* tk_utf8_to_utf16_ex (const char* str, uint32_t size, const wchar_t* out, uint32_t out_size);
```
* 参数说明:
| 参数 | 类型 | 说明 |
| -------- | ----- | --------- |
| 返回值 | wchar\_t* | 值。 |
| str | const char* | str。 |
| size | uint32\_t | 缓冲区大小。 |
| out | const wchar\_t* | 返回结果缓冲区。 |
| out\_size | uint32\_t | 缓冲区大小。 |
2022-12-05 12:10:53 +08:00
#### tk\_utf8\_trim\_invalid\_char 函数
-----------------------
* 函数功能:
> <p id="utf8_t_tk_utf8_trim_invalid_char">如果字符串最后一个字符串是无效的,删掉该无效字符。
> 对于用strncpy/snprintf等生成字符串时如果目标字符串内存大小不够
> 可能最后一个字符被从中间截断导致该字符是无效的这可能会触发assert
> 本函数可以用来删除最后一个无效字符。
* 函数原型:
```
char* tk_utf8_trim_invalid_char (const char* str);
```
* 参数说明:
| 参数 | 类型 | 说明 |
| -------- | ----- | --------- |
| 返回值 | char* | 返回UTF8字符串。 |
| str | const char* | 输入字符串。 |