在 python 中賦值語(yǔ)句總是建立對(duì)象的引用值,而不是復(fù)制對(duì)象。因此,python 變量更像是指針,而不是數(shù)據(jù)存儲(chǔ)區(qū)域,
這點(diǎn)和大多數(shù) OO 語(yǔ)言類似吧,比如 C++、java 等 ~
1、先來(lái)看個(gè)問(wèn)題吧:
在Python中,令values=[0,1,2];values[1]=values,為何結(jié)果是[0,[...],2]?
1
2
3
4
|
>>> values = [ 0 , 1 , 2 ] >>> values[ 1 ] = values >>> values [ 0 , [...], 2 ] |
我預(yù)想應(yīng)當(dāng)是
1
|
[ 0 , [ 0 , 1 , 2 ], 2 ] |
但結(jié)果卻為何要賦值無(wú)限次?
可以說(shuō) Python 沒(méi)有賦值,只有引用。你這樣相當(dāng)于創(chuàng)建了一個(gè)引用自身的結(jié)構(gòu),所以導(dǎo)致了無(wú)限循環(huán)。為了理解這個(gè)問(wèn)題,有個(gè)基本概念需要搞清楚。
Python 沒(méi)有「變量」,我們平時(shí)所說(shuō)的變量其實(shí)只是「標(biāo)簽」,是引用。
執(zhí)行
1
|
values = [ 0 , 1 , 2 ] |
的時(shí)候,Python 做的事情是首先創(chuàng)建一個(gè)列表對(duì)象 [0, 1, 2],然后給它貼上名為 values 的標(biāo)簽。如果隨后又執(zhí)行
1
|
values = [ 3 , 4 , 5 ] |
的話,Python 做的事情是創(chuàng)建另一個(gè)列表對(duì)象 [3, 4, 5],然后把剛才那張名為 values 的標(biāo)簽從前面的 [0, 1, 2] 對(duì)象上撕下來(lái),重新貼到 [3, 4, 5] 這個(gè)對(duì)象上。
至始至終,并沒(méi)有一個(gè)叫做 values 的列表對(duì)象容器存在,Python 也沒(méi)有把任何對(duì)象的值復(fù)制進(jìn) values 去。過(guò)程如圖所示:
執(zhí)行
1
|
values[ 1 ] = values |
的時(shí)候,Python 做的事情則是把 values 這個(gè)標(biāo)簽所引用的列表對(duì)象的第二個(gè)元素指向 values 所引用的列表對(duì)象本身。執(zhí)行完畢后,values 標(biāo)簽還是指向原來(lái)那個(gè)對(duì)象,只不過(guò)那個(gè)對(duì)象的結(jié)構(gòu)發(fā)生了變化,從之前的列表 [0, 1, 2] 變成了 [0, ?, 2],而這個(gè) ? 則是指向那個(gè)對(duì)象本身的一個(gè)引用。如圖所示:
要達(dá)到你所需要的效果,即得到 [0, [0, 1, 2], 2] 這個(gè)對(duì)象,你不能直接將 values[1] 指向 values 引用的對(duì)象本身,而是需要吧 [0, 1, 2] 這個(gè)對(duì)象「復(fù)制」一遍,得到一個(gè)新對(duì)象,再將 values[1] 指向這個(gè)復(fù)制后的對(duì)象。Python 里面復(fù)制對(duì)象的操作因?qū)ο箢愋投?,?fù)制列表 values 的操作是
values[:] #生成對(duì)象的拷貝或者是復(fù)制序列,不再是引用和共享變量,但此法只能頂層復(fù)制
所以你需要執(zhí)行
1
|
values[ 1 ] = values[:] |
Python 做的事情是,先 dereference 得到 values 所指向的對(duì)象 [0, 1, 2],然后執(zhí)行 [0, 1, 2][:] 復(fù)制操作得到一個(gè)新的對(duì)象,內(nèi)容也是 [0, 1, 2],然后將 values 所指向的列表對(duì)象的第二個(gè)元素指向這個(gè)復(fù)制二來(lái)的列表對(duì)象,最終 values 指向的對(duì)象是 [0, [0, 1, 2], 2]。過(guò)程如圖所示:
往更深處說(shuō),values[:] 復(fù)制操作是所謂的「淺復(fù)制」(shallow copy),當(dāng)列表對(duì)象有嵌套的時(shí)候也會(huì)產(chǎn)生出乎意料的錯(cuò)誤,比如
1
2
3
4
|
a = [ 0 , [ 1 , 2 ], 3 ] b = a[:] a[ 0 ] = 8 a[ 1 ][ 1 ] = 9 |
問(wèn):此時(shí) a 和 b 分別是多少?
正確答案是 a 為 [8, [1, 9], 3],b 為 [0, [1, 9], 3]。發(fā)現(xiàn)沒(méi)?b 的第二個(gè)元素也被改變了。想想是為什么?不明白的話看下圖
正確的復(fù)制嵌套元素的方法是進(jìn)行「深復(fù)制」(deep copy),方法是
1
2
3
4
5
6
|
import copy a = [ 0 , [ 1 , 2 ], 3 ] b = copy.deepcopy(a) a[ 0 ] = 8 a[ 1 ][ 1 ] = 9 |
2、引用 VS 拷貝:
(1)沒(méi)有限制條件的分片表達(dá)式(L[:])能夠復(fù)制序列,但此法只能淺層復(fù)制。
(2)字典 copy 方法,D.copy() 能夠復(fù)制字典,但此法只能淺層復(fù)制
(3)有些內(nèi)置函數(shù),例如 list,能夠生成拷貝 list(L)
(4)copy 標(biāo)準(zhǔn)庫(kù)模塊能夠生成完整拷貝:deepcopy 本質(zhì)上是遞歸 copy
(5)對(duì)于不可變對(duì)象和可變對(duì)象來(lái)說(shuō),淺復(fù)制都是復(fù)制的引用,只是因?yàn)閺?fù)制不變對(duì)象和復(fù)制不變對(duì)象的引用是等效的(因?yàn)閷?duì)象不可變,當(dāng)改變時(shí)會(huì)新建對(duì)象重新賦值)。所以看起來(lái)淺復(fù)制只復(fù)制不可變對(duì)象(整數(shù),實(shí)數(shù),字符串等),對(duì)于可變對(duì)象,淺復(fù)制其實(shí)是創(chuàng)建了一個(gè)對(duì)于該對(duì)象的引用,也就是說(shuō)只是給同一個(gè)對(duì)象貼上了另一個(gè)標(biāo)簽而已。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
L = [ 1 , 2 , 3 ] D = { 'a' : 1 , 'b' : 2 } A = L[:] B = D.copy() print "L, D" print L, D print "A, B" print A, B print "--------------------" A[ 1 ] = 'NI' B[ 'c' ] = 'spam' print "L, D" print L, D print "A, B" print A, B L, D [ 1 , 2 , 3 ] { 'a' : 1 , 'b' : 2 } A, B [ 1 , 2 , 3 ] { 'a' : 1 , 'b' : 2 } - - - - - - - - - - - - - - - - - - - - L, D [ 1 , 2 , 3 ] { 'a' : 1 , 'b' : 2 } A, B [ 1 , 'NI' , 3 ] { 'a' : 1 , 'c' : 'spam' , 'b' : 2 } |
3、增強(qiáng)賦值以及共享引用:
x = x + y,x 出現(xiàn)兩次,必須執(zhí)行兩次,性能不好,合并必須新建對(duì)象 x,然后復(fù)制兩個(gè)列表合并
屬于復(fù)制/拷貝
x += y,x 只出現(xiàn)一次,也只會(huì)計(jì)算一次,性能好,不生成新對(duì)象,只在內(nèi)存塊末尾增加元素。
當(dāng) x、y 為list時(shí), += 會(huì)自動(dòng)調(diào)用 extend 方法進(jìn)行合并運(yùn)算,in-place change。
屬于共享引用
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
L = [ 1 , 2 ] M = L L = L + [ 3 , 4 ] print L, M print "-------------------" L = [ 1 , 2 ] M = L L + = [ 3 , 4 ] print L, M [ 1 , 2 , 3 , 4 ] [ 1 , 2 ] - - - - - - - - - - - - - - - - - - - [ 1 , 2 , 3 , 4 ] [ 1 , 2 , 3 , 4 ] |
4、python 從2.x 到3.x,語(yǔ)句變函數(shù)引發(fā)的變量作用域問(wèn)題
先看段代碼:
1
2
3
4
5
6
7
8
9
|
def test(): a = False exec ( "a = True" ) print ( "a = " , a) test() b = False exec ( "b = True" ) print ( "b = " , b) |
在 python 2.x 和 3.x 下 你會(huì)發(fā)現(xiàn)他們的結(jié)果不一樣:
1
2
3
4
5
6
7
|
2.x : a = True b = True 3.x : a = False b = True |
這是為什么呢?
因?yàn)?3.x 中 exec 由語(yǔ)句變成函數(shù)了,而在函數(shù)中變量默認(rèn)都是局部的,也就是說(shuō)
你所見(jiàn)到的兩個(gè) a,是兩個(gè)不同的變量,分別處于不同的命名空間中,而不會(huì)沖突。
具體參考 《learning python》P331-P332
知道原因了,我們可以這么改改:
1
2
3
4
5
6
7
8
9
10
11
12
|
def test(): a = False ldict = locals () exec ( "a=True" , globals (),ldict) a = ldict[ 'a' ] print (a) test() b = False exec ( "b = True" , globals ()) print ( "b = " , b) |
這個(gè)問(wèn)題在 stackoverflow 上已經(jīng)有人問(wèn)了,而且 python 官方也有人報(bào)了 bug。。。
具體鏈接在下面:
http://stackoverflow.com/questions/7668724/variables-declared-in-execed-code-dont-become-local-in-python-3-documentatio
http://bugs.python.org/issue4831
http://stackoverflow.com/questions/1463306/how-does-exec-work-with-locals