我們?cè)?jīng)提到,Oyster.com的Python web服務(wù)器怎樣利用一個(gè)巨大的Python dicts(hash table),緩存大量的靜態(tài)資源。我們最近在Image類中,用僅僅一行__slots__代碼,讓每個(gè)6G內(nèi)存占用的服務(wù)進(jìn)程(共4個(gè)),省出超過(guò)2G來(lái)。
這是其中一個(gè)服務(wù)器在部署代碼前后的截圖:
我們alloc了大約一百萬(wàn)個(gè)類似如下class的實(shí)例:
class Image(object):
def __init__(self, id, caption, url):
self.id = id
self.caption = caption
self.url = url
self._setup()
# ... other methods ...
默認(rèn)情況下,Python用一個(gè)dict來(lái)存儲(chǔ)對(duì)象實(shí)例的屬性。這在一般情況下還不錯(cuò),而且非常靈活,乃至你在運(yùn)行時(shí)可以隨意設(shè)置新的屬性。
但是,對(duì)一些在”編譯”前就知道該有幾個(gè)固定屬性的小class來(lái)說(shuō),這個(gè)dict就有點(diǎn)浪費(fèi)內(nèi)存了。而當(dāng)你把這個(gè)小浪費(fèi)乘上一百萬(wàn),那可就大不同了。在Python中,你可以在class中設(shè)置__slots__,它是一個(gè)包含這些固定的屬性名的list。這樣Python就不會(huì)再使用dict,而且只分配這些屬性的空間。
class Image(object):
__slots__ = ['id', 'caption', 'url']
def __init__(self, id, caption, url):
self.id = id
self.caption = caption
self.url = url
self._setup()
# ... other methods ...
你還可以用collections.namedtuple,它允許訪問(wèn)參數(shù),但只占用一個(gè)tuple的空間。這跟__slots__類似。不過(guò)我總覺(jué)得繼承一個(gè)namedtuple類很奇怪。另外,如果你需要自定義初始化,你應(yīng)該重載__new__而不是__init__。
警告:不要貿(mào)然進(jìn)行這個(gè)優(yōu)化,把它用在所有地方。這種做法不利于代碼維護(hù),而且只有當(dāng)你有數(shù)以千計(jì)的實(shí)例的時(shí)候才會(huì)有明顯效果。
譯注:作者在評(píng)論中關(guān)于”不利于代碼維護(hù)“的說(shuō)法:
webreac:我覺(jué)得__slots__關(guān)鍵字不只是速度優(yōu)化(注:這里應(yīng)該是內(nèi)存優(yōu)化),也是類字段名的一個(gè)可靠”文檔“。這有利于代碼維護(hù)。為什么你覺(jué)得它不好?
Ben Hoyt(作者):有趣的說(shuō)法——我不確定應(yīng)不應(yīng)該把__slots__作為文檔。不過(guò)的確是不錯(cuò)的注意。我之前這么說(shuō)的原因是,你需要對(duì)字段名”定義“兩次(不夠DRY)。namedtuple也類似。