Python实现JSON反序列化类对象

Stella981
• 阅读 757

本文转自:https://juejin.im/post/5a7012b3f265da3e33049e6c

我们的网络协议一般是把数据转换成JSON之后再传输。之前在Java里面,实现序列化和反序列化,不管是jackson,还是fastjson都非常的简单。现在有项目需要用Python来开发,很自然的希望这样的便利也能在Python中体现。

但是在网上看了一些教程,讲反序列化的时候,基本都是转换为dict或者array。这种编程方式我从情感上是无法接受的。难道是这些JSON库都不支持反序列化为类对象?我马上打消了这个念头,Python这样强大的脚本语言,不可能没有完善的JSON库。

于是我就研究了一下原生的json,以及第三方的demjsonsimplejson

一、原生json

我仔细研究了原生jsonloads方法的定义

def loads(s, encoding=None, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)
复制代码

这里面的object_hookobject_pairs_hook参数引起了我的注意,我重点说一下object_hook

官方文档的说明如下:

object_hook is an optional function that will be called with the result of any object literal decoded (a dict). The return value of object_hook will be used instead of the dict. This feature can be used to implement custom decoders (e.g. JSON-RPC class hinting).

这个object_hook根据文档的解释就是一个自定义解码函数,入参数标准反序列化后的dict,我们可以根据自己的规则转换输出为想要的格式。

我又去搜了一下object_hook,大家对于这个东西的处理方式基本就是用一个静态方法把dict转换成对象。

我们的数据结构是这样的

{"status":1,"info":"发布成功","data":{"id":"52","feed_id":"70"}} 复制代码

于是我就写了这样的代码:

class Response:

    def __init__(self, status, info, data) -> None:
        super().__init__()
        self.status = status
        self.info = info
        self.data = data

    @staticmethod
    def object_hook(d):
        return Response(d['status'], d['info'], d['data'])
 ...
resp = json.loads(body, object_hook=Response.object_hook)
复制代码

一开始呢,确实没有问题,虽然用起来没有java的json库辣么方便,但总归实现了需求。

好景不长,我测试的第一个接口返回的数据中,data是字段一个字符串,反序列化正常。可是后来当接口返回的结构中data字段是一个dict结构的时候,object_hook的入参居然变成了data字段转换之后的dict({"id":"52","feed_id":"70"}),而不是完整的数据。

这些懵逼了,上网搜索了一圈没有结论。好吧,我最后又老老实实回到官方文档,read the fucking official document

不看不知道,一看吓一跳,官方文档用了一种巧妙的方式实现了上面的需求。

>>> class JSONObject:
...     def __init__(self, d):
...         self.__dict__ = d
...
>>>
>>> data = json.loads(s, object_hook=JSONObject)
>>> data.name
'ACME'
>>> data.shares
50
>>> data.price
490.1
>>>
复制代码

我服了,把json解析之后的dict直接赋值给对象的属性dict,然后就可以随心所欲的使用属性了,真心方便,动态语言就是好。

以上是官方的json库实现方案,那另外两个知名的第三方库呢?

二、demjson

demjson也支持hook。有两种配置的方式:decode函数配置和set_hook函数配置

1. decode

def decode( txt, encoding=None, **kwargs )
复制代码

decode函数可以指定很多参数,其中就包括hook函数。hook函数的指定是使用键值对的方式,键是hook函数的名称,值是hook函数。

demjson是通过名字来管理hook函数的,所以hookname不是随便指定的,必须是内置的几种hook函数的名称。

  • decode_number

  • decode_float

  • decode_object

  • decode_array

  • decode_string

  • encode_value

  • encode_dict

  • encode_dict_key

  • encode_sequence

  • encode_bytes

  • encode_default

    demjson.decode(body, encode='utf-8',decode_obbject=Reponse.object_hook) 复制代码

结果并没有让我很开森,依然是无法处理嵌套结构。 日志中显示如下内容:

2018-01-30 16:01:17,137 poster.py post_all 73 INFO    : {"status":1,"info":"\u53d1\u5e03\u6210\u529f","data":{"id":"54","feed_id":"72"}} 2018-01-30 16:01:17,138 response.py object_hook 13 INFO : {'id': '54', 'feed_id': '72'} 2018-01-30 16:01:17,138 response.py object_hook 13 INFO : {'status': 1, 'info': '发布成功', 'data': demjson.undefined} 复制代码

很奇怪的是object_hook 函数被调用了两次,第一次是data字段的内容,第二是全部的内容,但是data字段没有解析出来。 非常奇怪,百思不得其解!!!

2. set_hook

set_hook函数跟上面的decode函数不一样,它是JSON类的成员函数,而decode函数是个静态函数。

def set_hook(self, hookname, function)
复制代码

吸取之前的教训,这次我仔细阅读了demjson的文档,还真发现点东西。

Netsted values. When decoding JSON that has nested objects or arrays, the decoding hooks will be called once for every corresponding value, even if nested. Generally the decoding hooks will be called from the inner-most value outward, and then left to right.

这里重点说到嵌套的问题,出现嵌套的时候,每个对应的类型都会调用hook函数一次,而且是从最内层,从左往右。好吧,之前出现的问题全部明白了,原来都是这个规则惹的祸,但是为什么这样设计我暂时还是不明白。

set_hook的使用方式

    j = demjson.JSON()
    j.set_hook( 'decode_array', my_sort_array )
    j.decode(body, encode='utf-8')
复制代码

三、simplejson

前面说了那么多,simplejson的方式就没什么可说的,跟官方的jsonhook方式一致。

总结

虽然我的需求是满足了,但是还是有一个大大的问号留在我心中,为什么是这样设计,网上没有找到合适的答案,剩下的需要研究源代码分析了。

作者:挨踢的懒猫
链接:https://juejin.im/post/5a7012b3f265da3e33049e6c
来源:掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Wesley13 Wesley13
3年前
java将前端的json数组字符串转换为列表
记录下在前端通过ajax提交了一个json数组的字符串,在后端如何转换为列表。前端数据转化与请求varcontracts{id:'1',name:'yanggb合同1'},{id:'2',name:'yanggb合同2'},{id:'3',name:'yang
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
4个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Stella981 Stella981
3年前
Python之time模块的时间戳、时间字符串格式化与转换
Python处理时间和时间戳的内置模块就有time,和datetime两个,本文先说time模块。关于时间戳的几个概念时间戳,根据1970年1月1日00:00:00开始按秒计算的偏移量。时间元组(struct_time),包含9个元素。 time.struct_time(tm_y
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
10个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这