在上一期C++中 set的用法文章當中講解了set的一些常規用法和api,最后末尾的時候留了一個問題,如何修改set中的元素?今天就來聊聊這個問題。
很多同學估計會說,這還不簡單,不是有迭代器么。我們把迭代器當做指針,去修改它指向的值不就行了嗎?
like this:
set<string> st{"hello", "world", "good"}; set<string>::iterator it = st.begin(); *it = "test";
但是很遺憾,你真這么做了,會得到一個報錯:
報錯的意思是set的迭代器并沒有重載等于符號,也就是說我們沒辦法使用等于符號來為它賦值。說白了,也就是編譯器進行了限制,不允許我們對set迭代器的內容進行修改。
Effective C++當中也明確說了,不要對set集合中的元素進行修改。
不知道有沒有小伙伴去嘗試,可能有些小伙伴嘗試了之后會說不對啊,在我電腦上怎么能運行?
也很簡單,大概率因為你用的是vc編譯器,比如臭名昭著的VC6.0或者是visual studio IDE(不是VSCode)。微軟的編譯器沒有嚴格遵循C++的標準,在很多地方有些瑕疵和隨意。這也是不推薦使用VC6.0進行C++學習的原因,因為時間久了,就把錯的當成對的了。
吐槽完畢,回到正題。既然已經知道了這樣修改會引發報錯,是不是就已經得到了答案了呢?
其實并沒有,因為如果我們真的去閱讀C++的標準或者是翻閱set的源碼,會發現其中是沒有明確說明set中的元素是定義成const的。
實際上,std::set<T>聲明一個allocator_type,默認為std::allocator<T>。std::allocator_traits<allocator_type>::construct將它傳遞給T *,從而構造一個T,而不是const T。
說人話就是std::set<T>其實不允許將元素定義成const,既然元素不是const類型,那么就說明理論上是可以修改的。也就是說C++規范里說不能改,Effective C++中說建議不要改,但實際上底層的實現里并沒有嚴格禁止。我們非要改還是有辦法的,那是什么辦法呢?
老梁縱觀全網博客,也沒有看到一篇把這個問題說清楚。
在我們開始之前,首先思考一個問題,既然set底層源碼當中的元素并不是定義成const,那么當我們去用迭代器去修改的時候為什么會報錯呢?
要回答這個問題,我們只需要查看一下set迭代器的源碼定義即可。
老梁在大牛的源碼分析當中找到了一行關鍵的代碼:
原來迭代器的定義是一個const_iterator,搞了半天,其實并不是set底層限制了禁止修改,而是通過迭代器限制的。所以要想修改set當中的元素,我們只需要繞開迭代器的這個限制即可。
進一步研究可以發現,它這里使用的是一個const_iterator,它表示一個指向常量的迭代器,和const iterator不同。后者表示迭代器本身是一個常量,即迭代器本身指向的位置不能修改。而前者表示迭代器指向的位置是一個const常量,迭代器本身可以修改,指向不同的位置,但我們不能修改它指向的位置的值。
const_iterator并沒有嚴格限制只能指向const修飾的變量,這也就能解釋為什么set當中的元素沒有const修飾也不會報錯的原因,因為const_iterator兼容這種情況。
const_iterator解引用之后是一個const修飾的變量的引用,所以我們要對它指向的內容進行修改,只需要將它解引用的結果去除const限制即可。那具體怎么操作呢,我們可以使用const_cast操作符解除const的限制。
但它也不是萬能的,它只能使用在引用和指針當中,用來去掉const屬性。
這里有必要說明一下,在C++當中const修飾符出現的位置不同有不同的含義。以指針舉例,const T* p和T* const p是兩種完全不同的指針,前者表示不能通過指針去修改指向對象的內容。如p->x = 100;這樣的操作都是非法的。而后者表示指針只能在初始化時設置指向的內容,之后不能修改指向,如p=&t;是非法的。
在當前問題當中,我們想要修改set當中的元素值,遇到了const限制,顯然是第一種情況。
有些同學可能會覺得疑惑,我們加上const的目的不就是為了對變量做限制,從而可以在編譯的時候通過編譯器來替我們檢查一些非法的操作嗎?既然如此,又為什么需要去掉呢?
主要的原因是有時候我們手上的變量有const修飾,但是我們想要調用一個函數,而函數的內部會對指針或引用指向的值進行修改。這個時候我們就沒辦法傳入我們手上已有的參數了,const_cast操作符設計的初衷就是為了應對這種情況。
我們來舉個例子:
void test(int *x) { *x = 5; } int main() { int a = 3; const int *p = &a; test(p); return 0; }
如果我們編譯上面這段代碼就會遇到編譯器無情地報錯,因為我們在test函數內部修改了指針p的指向。
這個時候我們就可以在傳參的時候,使用const_cast操作符來解除掉const的限制。
test(const_cast<int*>(p));
尖括號中是我們要轉換的類型,只能是指針或引用。如果我們輸出指針p指向的值,會得到5,因為在test函數當中進行了修改。
看起來好像很簡單,對吧?
但是我們接下來看兩個例子,可能會令人有些費解:
const int a = 3; int *r = const_cast<int*>(&a); (*r)++; cout << a << endl; int i = 3; const int b = i; int *r2 = const_cast<int*>(&b); (*r2)++; cout << b << endl;
這兩段代碼做的事情非常類似,也就是通過const_cast修改了一個const修飾的int。唯一的不同是int a是直接賦值成了3,而int b是賦值成了另外一個也等于3的int。這兩者其實并沒有什么區別,對吧?但是當我們運行代碼之后,神奇的事情發生了,
屏幕上輸出的結果是這樣的:
為什么一個是3,另外一個是4呢?這兩者的邏輯明明是一樣的!
老梁發現這個問題的時候是完全震驚的,查了好久的資料,才從大牛博客的只言片語當中找到了一點描述。原來是編譯器針對第一種情況做了優化,因為a初始化時給的是一個常量,所以當我們輸出的時候,編譯器就直接取了3代替了它實際原本應該的值。
關于這個解釋老梁也不能完全確認,如果有知道的小伙伴不妨在下方留言。
最后, 我們回到正題,如果我們想要修改set當中的元素,可以怎么操作呢?
我們知道了const_cast操作符之后就完全沒有懸念了。
set<string> st{"hello", "world", "good"}; set<string>::iterator it = st.begin(); const_cast<string&>(*it) = "test"; for (auto it = st.begin(); it != st.end(); it++) { cout << *it << endl; }
但是我們需要注意一點,我們這樣強行修改其實是沒有經過set原本的機制的。也就是說我們雖然改了元素的值,但是它在紅黑樹中的位置其實是沒有變的。這樣的結果就是會導致元素失去有序性,比如上面的結果輸出的順序是:"test","hello","world",按道理應該是按照字典順序排序的。
這也是為什么C++ Primer里強烈建議大家不要修改set中元素值的原因,如果真的要修改,只能先刪除再添加了。雖然這樣會犧牲一點點性能,但至少可以保證set里的數據都是安全有序的。
到此這篇關于C++為什么不能修改set里的值?非要修改怎么辦?的文章就介紹到這了,更多相關C++修改set里的值內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!
注:文章轉自微信公眾號:Coder梁(ID:Coder_LT)