JSON進階
Python的dict對象可以直接序列化為JSON的{},不過,很多時候,我們更喜歡用class表示對象,比如定義Student類,然后序列化:
1
2
3
4
5
6
7
8
9
10
|
import json class Student( object ): def __init__( self , name, age, score): self .name = name self .age = age self .score = score s = Student( 'Bob' , 20 , 88 ) print (json.dumps(s)) |
運行代碼,毫不留情地得到一個TypeError:
1
2
3
|
Traceback (most recent call last): ... TypeError: <__main__.Student object at 0x10aabef50 > is not JSON serializable |
錯誤的原因是Student對象不是一個可序列化為JSON的對象。
如果連class的實例對象都無法序列化為JSON,這肯定不合理!
別急,我們仔細看看dumps()方法的參數列表,可以發現,除了第一個必須的obj參數外,dumps()方法還提供了一大堆的可選參數:
https://docs.python.org/2/library/json.html#json.dumps
這些可選參數就是讓我們來定制JSON序列化。前面的代碼之所以無法把Student類實例序列化為JSON,是因為默認情況下,dumps()方法不知道如何將Student實例變為一個JSON的{}對象。
可選參數default就是把任意一個對象變成一個可序列為JSON的對象,我們只需要為Student專門寫一個轉換函數,再把函數傳進去即可:
1
2
3
4
5
6
7
8
|
def student2dict(std): return { 'name' : std.name, 'age' : std.age, 'score' : std.score } print (json.dumps(s, default = student2dict)) |
這樣,Student實例首先被student2dict()函數轉換成dict,然后再被順利序列化為JSON。
不過,下次如果遇到一個Teacher類的實例,照樣無法序列化為JSON。我們可以偷個懶,把任意class的實例變為dict:
print(json.dumps(s, default=lambda obj: obj.__dict__))
因為通常class的實例都有一個__dict__屬性,它就是一個dict,用來存儲實例變量。也有少數例外,比如定義了__slots__的class。
同樣的道理,如果我們要把JSON反序列化為一個Student對象實例,loads()方法首先轉換出一個dict對象,然后,我們傳入的object_hook函數負責把dict轉換為Student實例:
1
2
3
4
5
|
def dict2student(d): return Student(d[ 'name' ], d[ 'age' ], d[ 'score' ]) json_str = '{"age": 20, "score": 88, "name": "Bob"}' print (json.loads(json_str, object_hook = dict2student)) |
運行結果如下:
1
|
<__main__.Student object at 0x10cd3c190 > |
打印出的是反序列化的Student實例對象。
小結
Python語言特定的序列化模塊是pickle,但如果要把序列化搞得更通用、更符合Web標準,就可以使用json模塊。
json模塊的dumps()和loads()函數是定義得非常好的接口的典范。當我們使用時,只需要傳入一個必須的參數。但是,當默認的序列化或反序列機制不滿足我們的要求時,我們又可以傳入更多的參數來定制序列化或反序列化的規則,既做到了接口簡單易用,又做到了充分的擴展性和靈活性。