當(dāng)我在工作中使用lua進(jìn)行開(kāi)發(fā)時(shí),發(fā)現(xiàn)在lua中有4種方式遍歷一個(gè)table,當(dāng)然,從本質(zhì)上來(lái)說(shuō)其實(shí)都一樣,只是形式不同,這四種方式分別是:
for key, value in pairs(tbtest) do
XXX
end
for key, value in ipairs(tbtest) do
XXX
end
for i=1, #(tbtest) do
XXX
end
for i=1, table.maxn(tbtest) do
XXX
end
前兩種是泛型遍歷,后兩種是數(shù)值型遍歷。當(dāng)然你還會(huì)說(shuō)lua的table遍歷還有很多種方法啊,沒(méi)錯(cuò),不過(guò)最常見(jiàn)的這些遍歷確實(shí)有必要弄清楚。
這四種方式各有特點(diǎn),由于在工作中我?guī)缀趺刻於紩?huì)使用遍歷table的方法,一開(kāi)始也非常困惑這些方式的不同,一段時(shí)間后才漸漸明白,這里我也是把自己的一點(diǎn)經(jīng)驗(yàn)告訴大家,對(duì)跟我一樣的lua初學(xué)者也許有些幫助(至少當(dāng)初我在寫(xiě)的時(shí)候在網(wǎng)上就找了很久,不知道是因?yàn)榇笈兌颊J(rèn)為這些很簡(jiǎn)單,不需要說(shuō),還是因?yàn)槲冶浚B這都要問(wèn))。
首先要明確一點(diǎn),就是lua中table并非像是C/C++中的數(shù)組一樣是順序存儲(chǔ)的,準(zhǔn)確來(lái)說(shuō)lua中的table更加像是C++中的map,通過(guò)Key對(duì)應(yīng)存儲(chǔ)Value,但是并非順序來(lái)保存key-value對(duì),而是使用了hash的方式,這樣能夠更加快速的訪問(wèn)key對(duì)應(yīng)的value,我們也知道hash表的遍歷需要使用所謂的迭代器來(lái)進(jìn)行,同樣,lua也有自己的迭代器,就是上面4種遍歷方式中的pairs和ipairs遍歷。但是lua同時(shí)提供了按照key來(lái)遍歷的方式(另外兩種,實(shí)質(zhì)上是一種),正式因?yàn)樗峁┝诉@種按key的遍歷,才造成了我一開(kāi)始的困惑,我一度認(rèn)為lua中關(guān)于table的遍歷是按照我table定義key的順序來(lái)的。
下面依次來(lái)講講四種遍歷方式,首先來(lái)看for k,v in pairs(tbtest) do這種方式:
先看效果:
tbtest = {
[1] = 1,
[2] = 2,
[3] = 3,
[4] = 4,
}
for key, value in pairs(tbtest) do
print(value)
end
我認(rèn)為輸出應(yīng)該是1,2,3,4,實(shí)際上的輸出是1,2,4,3。我因?yàn)檫@個(gè)造成了一個(gè)bug,這是后話。
也就是說(shuō)for k,v in pairs(tbtest) do 這樣的遍歷順序并非是tbtest中table的排列順序,而是根據(jù)tbtest中key的hash值排列的順序來(lái)遍歷的。
當(dāng)然,同時(shí)lua也提供了按照key的大小順序來(lái)遍歷的,注意,是大小順序,仍然不是key定義的順序,這種遍歷方式就是for k,v in ipairs(tbtest) do。
for k,v in ipairs(tbtest) do 這樣的循環(huán)必須要求tbtest中的key為順序的,而且必須是從1開(kāi)始,ipairs只會(huì)從1開(kāi)始按連續(xù)的key順序遍歷到key不連續(xù)為止。
tbtest = {
[1] = 1,
[2] = 2,
[3] = 3,
[5] = 5,
}
for k,v in ipairs(tbtest) do
print(v)
end
只會(huì)打印1,2,3。而5則不會(huì)顯示。
local tbtest = {
[2] = 2,
[3] = 3,
[5] = 5,
}
for k,v in ipairs(tbtest) do
print(v)
end
這樣就一個(gè)都不會(huì)打印。
第三種遍歷方式有一種神奇的符號(hào)'#',這個(gè)符號(hào)的作用是是獲取table的長(zhǎng)度,比如:
tbtest = {
[1] = 1,
[2] = 2,
[3] = 3,
}
print(#(tbtest))
打印的就是3
tbtest = {
[1] = 1,
[2] = 2,
[6] = 6,
}
print(#(tbtest))
這樣打印的就是2,而且和table內(nèi)的定義順序沒(méi)有關(guān)系,無(wú)論你是否先定義的key為6的值,‘#'都會(huì)查找key為1的值開(kāi)始。
如果table的定義是這樣的:
tbtest = {
["a"] = 1,
[2] = 2,
[3] = 3,
}
print(#(tbtest))
那么打印的就是0了。因?yàn)?lsquo;#'沒(méi)有找到key為1的值。同樣:
tbtest = {
[“a”] = 1,
[“b”] = 2,
[“c”] = 3,
}
print(#(tbtest))
打印的也是0
所以,for i=1, #(tbtest) do這種遍歷,只能遍歷當(dāng)tbtest中存在key為1的value時(shí)才會(huì)出現(xiàn)結(jié)果,而且是按照key從1開(kāi)始依次遞增1的順序來(lái)遍歷,找到一個(gè)遞增不是1的時(shí)候就結(jié)束不再遍歷,無(wú)論后面是否仍然是順序的key,比如:
table.maxn獲取的只針對(duì)整數(shù)的key,字符串的key是沒(méi)辦法獲取到的,比如:
tbtest = {
[1] = 1,
[2] = 2,
[3] = 3,
}
print(table.maxn(tbtest))
tbtest = {
[6] = 6,
[1] = 1,
[2] = 2,
}
print(table.maxn(tbtest))
這樣打印的就是3和6,而且和table內(nèi)的定義順序沒(méi)有關(guān)系,無(wú)論你是否先定義的key為6的值,table.maxn都會(huì)獲取整數(shù)型key中的最大值。
如果table的定義是這樣的:
tbtest = {
["a"] = 1,
[2] = 2,
[3] = 3,
}
print(table.maxn(tbtest))
那么打印的就是3了。如果table是:
tbtest = {
[“a”] = 1,
[“b”] = 2,
[“c”] = 3,
}
print(table.maxn(tbtest))
print(#(tbtest))
那么打印的就全部是0了。
換句話說(shuō),事實(shí)上因?yàn)閘ua中table的構(gòu)造表達(dá)式非常靈活,在同一個(gè)table中,你可以隨意定義各種你想要的內(nèi)容,比如:
tbtest = {
[1] = 1,
[2] = 2,
[3] = 3,
["a"] = 4,
["b"] = 5,
}
同時(shí)由于這個(gè)靈活性,你也沒(méi)有辦法獲取整個(gè)table的長(zhǎng)度,其實(shí)在coding的過(guò)程中,你會(huì)發(fā)現(xiàn),你真正想要獲取整個(gè)table長(zhǎng)度的地方幾乎沒(méi)有,你總能采取一種非常巧妙的定義方式,把這種需要獲取整個(gè)table長(zhǎng)度的操作避免掉,比如:
tbtest = {
tbaaa = {
[1] = 1,
[2] = 2,
[3] = 3,
},
["a"] = 4,
["b"] = 5,
}
你可能會(huì)驚訝,上面這種table該如何遍歷呢?
for k, v in pairs(tbtest) do
print(k, v)
end
輸出是:a 4 b 5 tbaaa table:XXXXX。
由此你可以看到,其實(shí)在table中定義一個(gè)table,這個(gè)table的名字就是key,對(duì)應(yīng)的內(nèi)容其實(shí)是table的地址。
當(dāng)然,如果你用
for k, v in ipairs(tbtest) do
print(k,v)
end
來(lái)遍歷的話,就什么都不會(huì)打印,因?yàn)闆](méi)有key為1的值。但當(dāng)你增加一個(gè)key為1的值時(shí),ipairs只會(huì)打印那一個(gè)值,現(xiàn)在你明白ipairs是如何工作的吧。
既然這里談到了遍歷,就說(shuō)一下目前看到的幾種針對(duì)table的遍歷方式:
for i=1, #tbtest do --這種方式無(wú)法遍歷所有的元素,因?yàn)?#39;#'只會(huì)獲取tbtest中從key為1開(kāi)始的key連續(xù)的那幾個(gè)元素,如果沒(méi)有key為1,那么這個(gè)循環(huán)將無(wú)法進(jìn)入
for i=1, table.maxn(tbtest) do --這種方式同樣無(wú)法遍歷所有的元素,因?yàn)閠able.maxn只會(huì)獲取key為整數(shù)中最大的那個(gè)數(shù),遍歷的元素其實(shí)是查找tbtest[1]~tbtest[整數(shù)key中最大值],所以,對(duì)于string做key的元素不會(huì)去查找,而且這么查找的效率低下,因?yàn)槿绻阏麛?shù)key中定義的最大的key是10000,然而10000以下的key沒(méi)有幾個(gè),那么這么遍歷會(huì)浪費(fèi)很多時(shí)間,因?yàn)闀?huì)從1開(kāi)始直到10000每一個(gè)元素都會(huì)查找一遍,實(shí)際上大多數(shù)元素都是不存在的,比如:
tbtest = {
[1] = 1,
[10000] = 2,
}
local count = 0
for i=1, table.maxn(tbtest) do
count = count + 1
print(tbtest[i])
end
print(count)
你會(huì)看到打印結(jié)果是多么的坑爹,只有1和10000是有意義的,其他的全是nil,而且count是10000。耗時(shí)非常久。一般我不這么遍歷。但是有一種情況下又必須這么遍歷,這個(gè)在我的工作中還真的遇到了,這是后話,等講完了再談。
for k, v in pairs(tbtest) do
這個(gè)是唯一一種可以保證遍歷tbtest中每一個(gè)元素的方式,別高興的太早,這種遍歷也有它自身的缺點(diǎn),就是遍歷的順序不是按照tbtest定義的順序來(lái)遍歷的,這個(gè)前面講到過(guò),當(dāng)然,對(duì)于不需要順序遍歷的用法,這個(gè)是唯一可靠的遍歷方式。
for k, v in ipairs(tbtest) do
這個(gè)只會(huì)遍歷tbtest中key為整數(shù),而且必須從1開(kāi)始的那些連續(xù)元素,如果沒(méi)有1開(kāi)始的key,那么這個(gè)遍歷是無(wú)效的,我個(gè)人認(rèn)為這種遍歷方式完全可以被改造table和for i=1, #(tbtest) do的方式來(lái)代替,因?yàn)閕pairs的效果和'#'的效果,在遍歷的時(shí)候是類(lèi)似的,都是按照key的遞增1順序來(lái)遍歷。
好,再來(lái)談?wù)劄槭裁次倚枰褂胻able.maxn這種非常浪費(fèi)的方式來(lái)遍歷,在工作中, 我遇到一個(gè)問(wèn)題,就是需要把當(dāng)前的周序,轉(zhuǎn)換成對(duì)應(yīng)的獎(jiǎng)勵(lì),簡(jiǎn)單來(lái)說(shuō),就是從一個(gè)活動(dòng)開(kāi)始算起,每周的獎(jiǎng)勵(lì)都不是固定的,比如1~4周給一種獎(jiǎng)勵(lì),5~8周給另一種獎(jiǎng)勵(lì),或者是一種排名獎(jiǎng)勵(lì),1~8名給一種獎(jiǎng)勵(lì),9~16名給另一種獎(jiǎng)勵(lì),這種情況下,我根據(jù)長(zhǎng)久的C語(yǔ)言的習(xí)慣,會(huì)把table定義成這個(gè)樣子:
tbtestAward = {
[8] = 1,
[16] = 3,
}
這個(gè)代表,1~8給獎(jiǎng)勵(lì)1,9~16給獎(jiǎng)勵(lì)3。這樣定義的好處是獎(jiǎng)勵(lì)我只需要寫(xiě)一次(這里的獎(jiǎng)勵(lì)用數(shù)字做了簡(jiǎn)化,實(shí)際上獎(jiǎng)勵(lì)也是一個(gè)大的table,里面還有非常復(fù)雜的結(jié)構(gòu))。然后我就遇到一個(gè)問(wèn)題,即我需要根據(jù)周序數(shù),或者是排名序數(shù)來(lái)確定給哪一種獎(jiǎng)勵(lì),比如當(dāng)前周序數(shù)是5,那么我應(yīng)該給我定義好的key為8的那一檔獎(jiǎng)勵(lì),或者當(dāng)前周序數(shù)是15,那么我應(yīng)該給獎(jiǎng)勵(lì)3。由此讀者看出,其實(shí)我定義的key是一個(gè)分界,小于這個(gè)key而大于上一個(gè)key,那么就給這個(gè)key的獎(jiǎng)勵(lì),這就是我判斷的條件。邏輯上沒(méi)有問(wèn)題,但是lua的遍歷方式卻把我狠狠地坑了一把。讀者可以自己想一想我上面介紹的4種遍歷方式,該用哪一種來(lái)實(shí)現(xiàn)我的這種需求呢?這個(gè)函數(shù)的大致框架如下:
function GetAward(nSeq)
for 遍歷整個(gè)獎(jiǎng)勵(lì)表 do
if 滿(mǎn)足key的條件 then
return 返回對(duì)應(yīng)獎(jiǎng)勵(lì)的key
end
end
return nil
end
我也不賣(mài)關(guān)子了,分別來(lái)說(shuō)一說(shuō)吧,首先因?yàn)槲业膋ey不是連續(xù)的,而且沒(méi)有key為1的值,所以ipairs和'#'遍歷是沒(méi)用的。這種情況下理想的遍歷貌似是pairs,因?yàn)樗鼤?huì)遍歷我的每一個(gè)元素,但是讀者不要忘記了,pairs遍歷并非是按照我定義的順序來(lái)遍歷,如果我真的使用的條件是:序數(shù)nSeq小于這個(gè)key而大于上一個(gè)key,那么就返回這個(gè)key。那么我無(wú)法保證程序執(zhí)行的正確性,因?yàn)閗ey的順序有可能是亂的,也就是有可能先遍歷到的是key為16的值,然后才是key為8的值。
這么看來(lái)我只剩下table.maxn這么一種方式了,于是我寫(xiě)下了這種代碼:
for i=1, table.maxn(tbtestAward) do
if tbtestAward[i] ~= nil then
if nSeq <= i then
return i
end
end
end
這么寫(xiě)效率確實(shí)低下,因?yàn)閷?shí)際上還是遍歷了從key為1開(kāi)始直到key為table.maxn中間的每一個(gè)值,不過(guò)能夠滿(mǎn)足我上面的要求。當(dāng)時(shí)我是這么實(shí)現(xiàn)的,因?yàn)檫@個(gè)獎(jiǎng)勵(lì)表會(huì)不斷的發(fā)生變化,這樣我每次修改只需要修改這個(gè)獎(jiǎng)勵(lì)表就能夠滿(mǎn)足要求了,后來(lái)我想了想,覺(jué)得其實(shí)我如果自己再定義一個(gè)序數(shù)轉(zhuǎn)換成對(duì)應(yīng)的獎(jiǎng)勵(lì)數(shù)種類(lèi)的表就可以避免這種坑爹的操作了,不過(guò)如果獎(jiǎng)勵(lì)發(fā)生修改,我需要統(tǒng)一排查的地方就不止這個(gè)獎(jiǎng)勵(lì)表了,權(quán)衡再三,我還是沒(méi)有改,就這么寫(xiě)了。沒(méi)辦法,不斷變化的需求已經(jīng)把我磨練的忘記了程序的最高理想。我甚至愿意犧牲算法的效率而去追求改動(dòng)的穩(wěn)定性。在此哀悼程序員的無(wú)奈。我這種時(shí)間換空間的做法確實(shí)不知道好不好。
后來(lái)我在《Programming In Lua》中看到了一個(gè)神奇的迭代器,使用它就可以達(dá)到我想要的這種遍歷方式,而且不需要去遍歷那些不存在的key。它的方法是把你所需要遍歷的table里的key按照遍歷順序放到另一個(gè)臨時(shí)的table中去,這樣只需要遍歷這個(gè)臨時(shí)的table按順序取出原table中的key就可以了。如下:
首先定義一個(gè)迭代器:
function pairsByKeys(t)
local a = {}
for n in pairs(t) do
a[#a+1] = n
end
table.sort(a)
local i = 0
return function()
i = i + 1
return a[i], t[a[i]]
end
end
然后在遍歷的時(shí)候使用這個(gè)迭代器就可以了,table同上,遍歷如下:
for key, value in pairsByKeys(tbtestAward) do
if nSeq <= key then
return key
end
end
并且后來(lái)我發(fā)現(xiàn)有了這個(gè)迭代器,我根本不需要先做一步獲取是哪一檔次的獎(jiǎng)勵(lì)的操作,直接使用這個(gè)迭代器進(jìn)行發(fā)獎(jiǎng)就可以了。大師就是大師,我怎么就沒(méi)想到呢!
還有些話我還沒(méi)有說(shuō),比如上面數(shù)值型遍歷也并非是像看起來(lái)那樣進(jìn)行遍歷的,比如下面的遍歷:
tbtest = {
[1] = 1,
[2] = 2,
[3] = 3,
[5] = 5,
}
for i=1, #(tbtest) do
print(tbtest[i])
end
打印的順序是:1,2,3。不會(huì)打印5,因?yàn)?已經(jīng)不在table的數(shù)組數(shù)據(jù)塊中了,我估計(jì)是被放到了hash數(shù)據(jù)塊中,但是當(dāng)我修改其中的一些key時(shí),比如:
tbtest = {
[1] = 1,
[2] = 2,
[4] = 4,
[5] = 5,
}
for i=1, #(tbtest) do
print(tbtest[i])
end
打印的內(nèi)容卻是:1,2,nil,4,5。這個(gè)地方又遍歷到了中間沒(méi)有的key值,并且還能繼續(xù)遍歷下去。我最近正在看lua源碼中table的實(shí)現(xiàn)部分,已經(jīng)明白了是怎么回事,不過(guò)我想等我能夠更加清晰的闡述lua中table的實(shí)現(xiàn)過(guò)程了再向大家介紹。用我?guī)煾档脑捳f(shuō)就是不要使用一些未定義的行為方法,避免在工作中出錯(cuò),不過(guò)工作外,我還是希望能明白未定義的行為中那些必然性,o(︶︿︶)o 唉!因果論的孩子傷不起。等我下一篇博文分析lua源碼中table的實(shí)現(xiàn)就能夠更加清晰的說(shuō)明這些了。