gf/g/encoding/gjson/gjson.go

701 lines
22 KiB
Go
Raw Normal View History

2017-12-29 16:03:30 +08:00
// Copyright 2017 gf Author(https://gitee.com/johng/gf). All Rights Reserved.
//
// This Source Code Form is subject to the terms of the MIT License.
// If a copy of the MIT was not distributed with this file,
// You can obtain one at https://gitee.com/johng/gf.
2018-04-12 14:09:33 +08:00
// JSON解析/封装.
// 单元测试请参考gpaser包.
2017-11-23 10:21:28 +08:00
package gjson
import (
"strings"
"strconv"
"io/ioutil"
"encoding/json"
2018-01-19 15:26:28 +08:00
"gitee.com/johng/gf/g/os/gfile"
"gitee.com/johng/gf/g/util/gconv"
2018-01-19 15:26:28 +08:00
"gitee.com/johng/gf/g/encoding/gxml"
"gitee.com/johng/gf/g/encoding/gyaml"
"gitee.com/johng/gf/g/encoding/gtoml"
"gitee.com/johng/gf/g/util/gstr"
"time"
"gitee.com/johng/gf/g/encoding/gjson/internal/rwmutex"
"fmt"
"github.com/pkg/errors"
2017-11-23 10:21:28 +08:00
)
2018-04-12 14:09:33 +08:00
const (
gDEFAULT_SPLIT_CHAR = '.' // 默认层级分隔符号
)
2017-11-23 10:21:28 +08:00
// json解析结果存放数组
type Json struct {
mu *rwmutex.RWMutex
p *interface{} // 注意这是一个指针
2018-04-12 14:09:33 +08:00
c byte // 层级分隔符,默认为"."
2018-07-01 00:38:35 +08:00
vc bool // 层级检索是否执行分隔符冲突检测(默认为false检测会比较影响检索效率)
2017-11-23 10:21:28 +08:00
}
2018-04-12 14:09:33 +08:00
// 将变量转换为Json对象进行处理该变量至少应当是一个map或者array否者转换没有意义
func New(value interface{}, safe...bool) *Json {
j := (*Json)(nil)
switch value.(type) {
case map[string]interface{}, []interface{}, nil:
j = &Json{
p : &value,
c : byte(gDEFAULT_SPLIT_CHAR),
vc : false ,
}
default:
// 这里效率会比较低
b, _ := Encode(value)
v, _ := Decode(b)
j = &Json{
p : &v,
c : byte(gDEFAULT_SPLIT_CHAR),
vc : false,
}
2018-04-12 14:09:33 +08:00
}
j.mu = rwmutex.New(safe...)
return j
2018-04-12 14:09:33 +08:00
}
// 创建一个非并发安全的Json对象
func NewUnsafe(value...interface{}) *Json {
if len(value) > 0 {
return New(value[0], false)
}
return New(nil, false)
}
2017-11-23 10:21:28 +08:00
// 编码go变量为json字符串并返回json字符串指针
func Encode (v interface{}) ([]byte, error) {
return json.Marshal(v)
2017-11-23 10:21:28 +08:00
}
// 解码字符串为interface{}变量
func Decode (b []byte) (interface{}, error) {
2017-11-23 10:21:28 +08:00
var v interface{}
if err := DecodeTo(b, &v); err != nil {
2017-12-13 17:35:43 +08:00
return nil, err
} else {
return v, nil
2017-11-23 10:21:28 +08:00
}
}
2018-01-19 15:26:28 +08:00
// 解析json字符串为go变量注意第二个参数为指针(任意结构的变量)
func DecodeTo (b []byte, v interface{}) error {
return json.Unmarshal(b, v)
2017-11-23 10:21:28 +08:00
}
// 解析json字符串为gjson.Json对象并返回操作对象指针
func DecodeToJson (b []byte) (*Json, error) {
if v, err := Decode(b); err != nil {
2017-12-13 17:35:43 +08:00
return nil, err
} else {
2018-04-12 14:09:33 +08:00
return New(v), nil
2017-11-23 10:21:28 +08:00
}
}
2018-01-19 15:26:28 +08:00
// 支持多种配置文件类型转换为json格式内容并解析为gjson.Json对象
func Load (path string) (*Json, error) {
data, err := ioutil.ReadFile(path)
if err != nil {
return nil, err
}
return LoadContent(data, gfile.Ext(path))
}
// 支持的配置文件格式xml, json, yaml/yml, toml默认为json
2018-06-30 22:50:21 +08:00
func LoadContent (data []byte, dataType...string) (*Json, error) {
var err error
var result interface{}
2018-06-30 22:50:21 +08:00
t := "json"
if len(dataType) > 0 {
t = dataType[0]
}
switch t {
case "xml": fallthrough
2018-01-19 15:26:28 +08:00
case ".xml":
data, err = gxml.ToJson(data)
if err != nil {
return nil, err
}
case "yml": fallthrough
case "yaml": fallthrough
case ".yml": fallthrough
case ".yaml":
data, err = gyaml.ToJson(data)
if err != nil {
return nil, err
}
case "toml": fallthrough
case ".toml":
data, err = gtoml.ToJson(data)
if err != nil {
return nil, err
}
2018-01-19 15:26:28 +08:00
}
if err := json.Unmarshal(data, &result); err != nil {
return nil, err
}
2018-04-12 14:09:33 +08:00
return New(result), nil
2017-11-23 10:21:28 +08:00
}
// 设置自定义的层级分隔符号
func (j *Json) SetSplitChar(char byte) {
j.mu.Lock()
j.c = char
j.mu.Unlock()
}
// 设置是否执行层级冲突检查,当键名中存在层级符号时需要开启该特性,默认为关闭。
// 开启比较耗性能,也不建议允许键名中存在分隔符,最好在应用端避免这种情况。
func (j *Json) SetViolenceCheck(check bool) {
j.mu.Lock()
j.vc = check
j.mu.Unlock()
}
2017-11-23 10:21:28 +08:00
// 将指定的json内容转换为指定结构返回查找失败或者转换失败目标对象转换为nil
2018-04-12 14:09:33 +08:00
// 注意第二个参数需要给的是**变量地址**
func (j *Json) GetToVar(pattern string, v interface{}) error {
r := j.Get(pattern)
2017-11-23 10:21:28 +08:00
if r != nil {
2017-12-13 17:35:43 +08:00
if t, err := Encode(r); err == nil {
return DecodeTo(t, v)
} else {
return err
}
2017-11-23 10:21:28 +08:00
} else {
v = nil
}
return nil
}
// 获得一个键值对关联数组/哈希表,方便操作,不需要自己做类型转换
// 注意如果获取的值不存在或者类型与json类型不匹配那么将会返回nil
func (j *Json) GetMap(pattern string) map[string]interface{} {
result := j.Get(pattern)
2017-11-23 10:21:28 +08:00
if result != nil {
if r, ok := result.(map[string]interface{}); ok {
return r
}
}
return nil
}
// 将检索值转换为Json对象指针返回
func (j *Json) GetJson(pattern string) *Json {
result := j.Get(pattern)
if result != nil {
2018-04-12 14:09:33 +08:00
return New(result)
}
return nil
}
2017-11-23 10:21:28 +08:00
// 获得一个数组[]interface{},方便操作,不需要自己做类型转换
// 注意如果获取的值不存在或者类型与json类型不匹配那么将会返回nil
func (j *Json) GetArray(pattern string) []interface{} {
result := j.Get(pattern)
2017-11-23 10:21:28 +08:00
if result != nil {
if r, ok := result.([]interface{}); ok {
return r
}
}
return nil
}
// 返回指定json中的string
func (j *Json) GetString(pattern string) string {
return gconv.String(j.Get(pattern))
2017-11-23 10:21:28 +08:00
}
// 返回指定json中的strings(转换为[]string数组)
func (j *Json) GetStrings(pattern string) []string {
return gconv.Strings(j.Get(pattern))
}
func (j *Json) GetTime(pattern string, format ... string) time.Time {
return gconv.Time(j.Get(pattern), format...)
}
func (j *Json) GetTimeDuration(pattern string) time.Duration {
return gconv.TimeDuration(j.Get(pattern))
}
2017-12-31 11:09:16 +08:00
// 返回指定json中的bool(false:"", 0, false, off)
func (j *Json) GetBool(pattern string) bool {
return gconv.Bool(j.Get(pattern))
2017-11-23 10:21:28 +08:00
}
func (j *Json) GetInt(pattern string) int {
return gconv.Int(j.Get(pattern))
2017-11-23 10:21:28 +08:00
}
func (j *Json) GetInt8(pattern string) int8 {
return gconv.Int8(j.Get(pattern))
}
func (j *Json) GetInt16(pattern string) int16 {
return gconv.Int16(j.Get(pattern))
}
func (j *Json) GetInt32(pattern string) int32 {
return gconv.Int32(j.Get(pattern))
}
func (j *Json) GetInt64(pattern string) int64 {
return gconv.Int64(j.Get(pattern))
}
func (j *Json) GetUint(pattern string) uint {
return gconv.Uint(j.Get(pattern))
2017-11-23 10:21:28 +08:00
}
func (j *Json) GetUint8(pattern string) uint8 {
return gconv.Uint8(j.Get(pattern))
}
func (j *Json) GetUint16(pattern string) uint16 {
return gconv.Uint16(j.Get(pattern))
}
func (j *Json) GetUint32(pattern string) uint32 {
return gconv.Uint32(j.Get(pattern))
}
func (j *Json) GetUint64(pattern string) uint64 {
return gconv.Uint64(j.Get(pattern))
}
func (j *Json) GetFloat32(pattern string) float32 {
return gconv.Float32(j.Get(pattern))
2017-12-31 11:09:16 +08:00
}
func (j *Json) GetFloat64(pattern string) float64 {
return gconv.Float64(j.Get(pattern))
2017-11-23 10:21:28 +08:00
}
// 动态设置层级变量
func (j *Json) Set(pattern string, value interface{}) error {
return j.setValue(pattern, value, false)
}
// 动态删除层级变量
func (j *Json) Remove(pattern string) error {
return j.setValue(pattern, nil, true)
}
// 根据pattern查找并设置数据
2018-01-23 16:40:48 +08:00
// 注意:
2018-04-12 14:09:33 +08:00
// 1、写入的value为nil且removed为true时表示删除;
// 2、里面的层级处理比较复杂逻辑较复杂的地方在于层级检索及节点创建叶子赋值;
func (j *Json) setValue(pattern string, value interface{}, removed bool) error {
2018-04-12 14:09:33 +08:00
array := strings.Split(pattern, string(j.c))
length := len(array)
value = j.convertValue(value)
2018-01-23 18:23:05 +08:00
// 初始化判断
if *j.p == nil {
if gstr.IsNumeric(array[0]) {
2018-01-23 18:23:05 +08:00
*j.p = make([]interface{}, 0)
} else {
*j.p = make(map[string]interface{})
}
}
2018-04-12 14:09:33 +08:00
var pparent *interface{} = nil // 父级元素项(设置时需要根据子级的内容确定数据类型,所以必须记录父级)
var pointer *interface{} = j.p // 当前操作层级项
j.mu.Lock()
2018-04-12 17:22:12 +08:00
defer j.mu.Unlock()
2017-11-23 10:21:28 +08:00
for i:= 0; i < length; i++ {
switch (*pointer).(type) {
case map[string]interface{}:
if i == length - 1 {
if removed && value == nil {
2018-01-25 17:43:07 +08:00
// 删除map元素
2018-01-23 16:40:48 +08:00
delete((*pointer).(map[string]interface{}), array[i])
} else {
(*pointer).(map[string]interface{})[array[i]] = value
}
2017-11-23 10:21:28 +08:00
} else {
2018-01-25 17:43:07 +08:00
// 当键名不存在的情况这里会进行处理
2018-04-12 17:22:12 +08:00
if v, ok := (*pointer).(map[string]interface{})[array[i]]; !ok {
if removed && value == nil {
goto done
}
2018-04-12 17:22:12 +08:00
// 创建新节点
if gstr.IsNumeric(array[i + 1]) {
2018-04-12 17:22:12 +08:00
// 创建array节点
n, _ := strconv.Atoi(array[i + 1])
var v interface{} = make([]interface{}, n + 1)
pparent = j.setPointerWithValue(pointer, array[i], v)
pointer = &v
} else {
// 创建map节点
var v interface{} = make(map[string]interface{})
pparent = j.setPointerWithValue(pointer, array[i], v)
pointer = &v
2018-01-23 18:23:05 +08:00
}
2018-04-12 17:22:12 +08:00
} else {
pparent = pointer
pointer = &v
}
2017-11-23 10:21:28 +08:00
}
2018-01-25 17:43:07 +08:00
2017-11-23 10:21:28 +08:00
case []interface{}:
2018-04-12 17:22:12 +08:00
// 键名与当前指针类型不符合,需要执行**覆盖操作**
if !gstr.IsNumeric(array[i]) {
2018-04-12 17:22:12 +08:00
if i == length - 1 {
*pointer = map[string]interface{}{ array[i] : value }
} else {
var v interface{} = make(map[string]interface{})
*pointer = v
pparent = pointer
pointer = &v
}
continue
}
2018-04-12 17:22:12 +08:00
valn, err := strconv.Atoi(array[i])
if err != nil {
return err
}
// 叶子节点
if i == length - 1 {
if len((*pointer).([]interface{})) > valn {
if removed && value == nil {
// 删除数据元素
j.setPointerWithValue(pparent, array[i - 1], append((*pointer).([]interface{})[ : valn], (*pointer).([]interface{})[valn + 1 : ]...))
2017-11-23 10:21:28 +08:00
} else {
2018-04-12 17:22:12 +08:00
(*pointer).([]interface{})[valn] = value
2017-11-23 10:21:28 +08:00
}
} else {
if removed && value == nil {
goto done
}
if pparent == nil {
// 表示根节点
j.setPointerWithValue(pointer, array[i], value)
} else {
// 非根节点
s := make([]interface{}, valn + 1)
copy(s, (*pointer).([]interface{}))
s[valn] = value
j.setPointerWithValue(pparent, array[i - 1], s)
}
2017-11-23 10:21:28 +08:00
}
} else {
if gstr.IsNumeric(array[i + 1]) {
2018-04-12 17:22:12 +08:00
n, _ := strconv.Atoi(array[i + 1])
if len((*pointer).([]interface{})) > valn {
(*pointer).([]interface{})[valn] = make([]interface{}, n + 1)
pparent = pointer
pointer = &(*pointer).([]interface{})[valn]
} else {
if removed && value == nil {
goto done
}
2018-04-12 17:22:12 +08:00
var v interface{} = make([]interface{}, n + 1)
pparent = j.setPointerWithValue(pointer, array[i], v)
pointer = &v
}
} else {
2018-04-12 17:22:12 +08:00
var v interface{} = make(map[string]interface{})
pparent = j.setPointerWithValue(pointer, array[i], v)
pointer = &v
}
}
2018-01-25 17:43:07 +08:00
2018-04-12 17:22:12 +08:00
// 如果当前指针指向的变量不是引用类型的,
// 那么修改变量必须通过父级进行修改,即 pparent
2018-01-25 17:43:07 +08:00
default:
if removed && value == nil {
2018-01-25 17:43:07 +08:00
goto done
}
if gstr.IsNumeric(array[i]) {
2018-04-12 17:22:12 +08:00
n, _ := strconv.Atoi(array[i])
s := make([]interface{}, n + 1)
if i == length - 1 {
s[n] = value
}
if pparent != nil {
pparent = j.setPointerWithValue(pparent, array[i - 1], s)
} else {
2018-04-12 17:22:12 +08:00
*pointer = s
pparent = pointer
2018-01-25 17:43:07 +08:00
}
} else {
2018-04-12 17:22:12 +08:00
var v interface{} = make(map[string]interface{})
2018-01-25 17:43:07 +08:00
if i == length - 1 {
v = map[string]interface{}{
array[i] : value,
}
}
if pparent != nil {
pparent = j.setPointerWithValue(pparent, array[i - 1], v)
} else {
*pointer = v
pparent = pointer
}
pointer = &v
2018-01-25 17:43:07 +08:00
}
2018-04-12 17:22:12 +08:00
}
}
2018-01-23 18:23:05 +08:00
done:
return nil
}
// 数据结构转换map参数必须转换为map[string]interface{},数组参数必须转换为[]interface{}
func (j *Json) convertValue(value interface{}) interface{} {
switch value.(type) {
case map[string]interface{}:
return value
case []interface{}:
return value
default:
// 这里效率会比较低,当然比直接用反射也不会差到哪儿去
// 为了操作的灵活性,牺牲了一定的效率
b, _ := Encode(value)
v, _ := Decode(b)
return v
}
return value
}
// 用于Set方法中对指针指向的内存地址进行赋值
// 返回修改后的父级指针
func (j *Json) setPointerWithValue(pointer *interface{}, key string, value interface{}) *interface{} {
switch (*pointer).(type) {
case map[string]interface{}:
(*pointer).(map[string]interface{})[key] = value
return &value
case []interface{}:
n, _ := strconv.Atoi(key)
if len((*pointer).([]interface{})) > n {
(*pointer).([]interface{})[n] = value
return &(*pointer).([]interface{})[n]
} else {
s := make([]interface{}, n + 1)
copy(s, (*pointer).([]interface{}))
s[n] = value
*pointer = s
return &s[n]
}
2018-04-12 17:22:12 +08:00
default:
*pointer = value
}
return pointer
}
// 根据约定字符串方式访问json解析数据参数形如 "items.name.first", "list.0"; 当pattern为空时表示获取所有数据;
// 返回的结果类型的interface{},因此需要自己做类型转换;
// 如果找不到对应节点的数据返回nil;
func (j *Json) Get(pattern...string) interface{} {
j.mu.RLock()
defer j.mu.RUnlock()
2018-04-12 14:09:33 +08:00
queryPattern := ""
if len(pattern) > 0 {
queryPattern = pattern[0]
}
2018-04-12 14:09:33 +08:00
var result *interface{}
if j.vc {
result = j.getPointerByPattern(queryPattern)
2018-04-12 14:09:33 +08:00
} else {
result = j.getPointerByPatternWithoutSplitCharViolenceCheck(queryPattern)
2018-04-12 14:09:33 +08:00
}
if result != nil {
return *result
}
return nil
}
// 计算指定pattern的元素长度(pattern对应数据类型为map[string]interface{}/[]interface{}时有效)
func (j *Json) Len(pattern string) int {
p := j.getPointerByPattern(pattern)
if p != nil {
switch (*p).(type) {
case map[string]interface{}:
return len((*p).(map[string]interface{}))
case []interface{}:
return len((*p).([]interface{}))
default:
return -1
}
}
return -1
}
// 指定pattern追加元素
func (j *Json) Append(pattern string, value interface{}) error {
length := j.Len(pattern)
if length != -1 {
return j.Set(fmt.Sprintf("%s.%d", pattern, length), value)
}
return errors.New(fmt.Sprintf("cannot find item for pattern: %s", pattern))
}
2018-04-12 14:09:33 +08:00
// 根据pattern层级查找**变量指针**
// 检索方式:例如检索 a.a.a 值为1
// 1. 检索 a.a.a.a 是否存在对应map的键名
// 2. 检索 a.a.a 是否存在对应map的键名
// 3. 检索 a.a 是否存在对应map的键名
// 4. 检索 a 是否存在对应map的键名如果检索出这是一个map假如为变量m1
// 5. 在m1中检索 a.a.a 否存在对应map的键名
// 6. 在m1中检索 a.a 否存在对应map的键名
// 7. 在m1中检索 a 否存在对应map的键名如果检索出这是一个map假如为变量m2
// 8. 在m2中检索 a.a 否存在对应map的键名
// 9. 在m2中检索 a 否存在对应map的键名检索到有值值为1
// 这样检索的复杂度很高,主要是为了避免键名中存在分隔符号(默认为".")的情况,避免歧义。
func (j *Json) getPointerByPattern(pattern string) *interface{} {
index := len(pattern)
2018-04-10 15:36:35 +08:00
start := 0
length := 0
pointer := j.p
2018-04-10 15:36:35 +08:00
if index == 0 {
return pointer
}
for {
if r := j.checkPatternByPointer(pattern[start:index], pointer); r != nil {
length += index - start
if start > 0 {
length += 1
}
start = index + 1
index = len(pattern)
if length == len(pattern) {
return r
} else {
pointer = r
}
} else {
2018-04-12 14:09:33 +08:00
// 查找下一个分割符号的索引位置
index = strings.LastIndexByte(pattern[start:index], j.c)
2018-01-23 15:43:16 +08:00
if index != -1 && length > 0 {
index += length + 1
}
}
if start >= index {
break
2017-11-23 10:21:28 +08:00
}
}
return nil
}
2018-04-12 14:09:33 +08:00
// 层级检索,内部不执行分隔符冲突检查,检索效率会有所提高,但是冲突需要开发者自己根据自定义的分隔符来进行解决
func (j *Json) getPointerByPatternWithoutSplitCharViolenceCheck(pattern string) *interface{} {
pointer := j.p
if len(pattern) == 0 {
return pointer
}
array := strings.Split(pattern, string(j.c))
for k, v := range array {
if r := j.checkPatternByPointer(v, pointer); r != nil {
if k == len(array) - 1 {
return r
} else {
pointer = r
}
} else {
break
}
}
return nil
}
// 判断给定的key在当前的pointer下是否有值并返回对应的pointer
// 注意这里返回的指针都是临时变量的内存地址
2018-04-12 14:09:33 +08:00
func (j *Json) checkPatternByPointer(key string, pointer *interface{}) *interface{} {
switch (*pointer).(type) {
case map[string]interface{}:
2018-04-12 14:09:33 +08:00
if v, ok := (*pointer).(map[string]interface{})[key]; ok {
return &v
}
case []interface{}:
if gstr.IsNumeric(key) {
2018-04-12 14:09:33 +08:00
n, err := strconv.Atoi(key)
if err == nil && len((*pointer).([]interface{})) > n {
return &(*pointer).([]interface{})[n]
}
}
}
return nil
2017-11-23 10:21:28 +08:00
}
// 转换为map[string]interface{}类型,如果转换失败返回nil
func (j *Json) ToMap() map[string]interface{} {
j.mu.RLock()
defer j.mu.RUnlock()
switch (*(j.p)).(type) {
2017-11-23 10:21:28 +08:00
case map[string]interface{}:
return (*(j.p)).(map[string]interface{})
2017-11-23 10:21:28 +08:00
default:
return nil
}
}
// 转换为[]interface{}类型,如果转换失败返回nil
func (j *Json) ToArray() []interface{} {
j.mu.RLock()
defer j.mu.RUnlock()
switch (*(j.p)).(type) {
2017-11-23 10:21:28 +08:00
case []interface{}:
return (*(j.p)).([]interface{})
2017-11-23 10:21:28 +08:00
default:
return nil
}
}
func (j *Json) ToXml(rootTag...string) ([]byte, error) {
return gxml.Encode(j.ToMap(), rootTag...)
}
func (j *Json) ToXmlIndent(rootTag...string) ([]byte, error) {
return gxml.EncodeWithIndent(j.ToMap(), rootTag...)
}
func (j *Json) ToJson() ([]byte, error) {
j.mu.RLock()
defer j.mu.RUnlock()
return Encode(*(j.p))
}
func (j *Json) ToJsonIndent() ([]byte, error) {
j.mu.RLock()
defer j.mu.RUnlock()
return json.MarshalIndent(*(j.p), "", "\t")
}
func (j *Json) ToYaml() ([]byte, error) {
j.mu.RLock()
defer j.mu.RUnlock()
return gyaml.Encode(*(j.p))
}
2017-11-23 10:21:28 +08:00
func (j *Json) ToToml() ([]byte, error) {
j.mu.RLock()
defer j.mu.RUnlock()
return gtoml.Encode(*(j.p))
}
// 转换为指定的struct对象
func (j *Json) ToStruct(o interface{}) error {
j.mu.RLock()
defer j.mu.RUnlock()
return gconv.MapToStruct(j.ToMap(), o)
}
// 打印Json对象
func (j *Json) Dump() error {
j.mu.RLock()
defer j.mu.RUnlock()
if b, err := j.ToJsonIndent(); err != nil {
return err
} else {
fmt.Println(string(b))
}
return nil
2017-11-23 10:21:28 +08:00
}