多么令人愉快的一個問題啊
就在被帶到編譯器那里之前,預處理器都會對你的源代碼瞧上一瞧, 做一些格式化的工作,并執行任何你在源代碼里面留給它來執行的指令.
像什么?
好吧,預處理器的指令就被叫做預處理器指令,而他們都以一個#開頭.
像 #include 這樣?
正確.
每一個被預處理器遇到的 # 命令都會導致在某種方式上對源代碼的修改. 讓我們來簡單的研究研究它們,然后我們就會之后這背后都是怎么運轉的了.
#include
包含其他庫、類、接口等的頭文件。預處理器實際上就只是把整個頭文件復制到你的源代碼里面 (是的,這就是包含防御之所以是件好事的原因了).
#define
誰會不喜歡宏呢! 預處理器會把所有定義的實體替換成被定義的代碼. 定義會一直持續直到發現這個定義的 #undef 指令.
#ifdef
條件行為告訴預處理器包含在遇到聲明的條件成立的條件塊中的代碼. 你可以就像if-else語句一樣使用它們,從這里面選擇: #ifdef, #ifndef, #if, #else, 以及 #elif, 而你總是要使用一個 #endif 作為結束。
#error #warning
用來向用戶發送消息。預處理器會在 #error 處, 而不會在 #warning 處停下來. 兩種情況下他都會發送他在指令背后(的括號里面)發現的字符串, 發送到屏幕作為輸出,因此它是一種確保針對你的平臺一切OK的手動方式.
#line
用來在你遇到編譯錯誤時修改顯示的錯誤行號和文件名. 例如,加入你需要查看一個來自編譯的中間文件的源文件(可能是自動生成的).
#pragma
其它由編譯器解釋的特殊指令。你的編譯器文檔會告訴你指令是怎么用的,而你不要假定他們在全世界都通用哦.
#assert #unassert
這些在老程序里面總是特別受歡迎的 (好吧,只要我也曾經為這樣一個程序工作過), 但是它們在現在已經過時了。強烈建議不使用它們,這意味著不要把他們放到新的代碼里面
預定義宏
有許多可以利用的預定義宏:
__FILE__ 給出一個字符串的文件名
__LINE__ 給出當前的行號(整型)
__DATE__ 當前編譯日期的字符串
__TIME__ 當前編譯時間的字符串
__STDC__ 同編譯器相關的,但常常被定義成1,以聲明同ISO C標準兼容.
__cplusplus 在編譯一個C++程序是總是會被定義
特別是開頭兩個在調試時真的非常有用。只要拿出它們倆,不用你自己編寫文件和行處理類,就能神奇的讓你獲得豐富的信息輸出.
你的編譯器可能還支持其它的宏,例如,你這從 這里 獲得(面向GCC)的整個宏清單.
那么當你運行預處理器時實際會發生什么呢?
1. 替換所有的三字母組合,我會在將來的一篇文章中談論到他,因為盡管他只是一個歷史上的特性(而且你也要在GCC中對它進行切換),它仍讓是很有趣的.
2. 將并列的源代碼分成多行.
3. 移除所有的注釋并用一個空格替換.
4. 處理(我們上面講到的)的預處理器指令。對于 #include, 他會在新文件上遞歸執行1 - 3步 :-)
5. 處理轉義序列.
6. 把文件發送給編譯器
如果你想看看預處理之后你的文件會是什么樣子 (誰不想呢?),你可以向 gcc 傳入 -E 選項. 這將會想stdout標準輸出發送預處理過的源代碼,并且沒有編譯和連接就直接終止gcc命令的執行。
例如
1
|
g++ -E myfile.cpp |
你也可以使用這個參數:
1
|
-save-temps |
編譯的后會有一份臨時文件。
拿下面這個簡單的程序說吧:
1
2
3
4
5
6
7
8
9
10
|
#include <stdio.h> #define ONE 1 #define TWO 2 int main() { printf ( "%d, %d\n" , ONE, TWO); return 0; } |
用下面這行命令編譯
1
|
g++ hello.cpp -save-temps |
編譯完后, 會在文件夾中生成兩個文件: hello.s 和 hello.ii
hello.s 里面是匯編代碼, 而 hello.ii 則是預處理過后的源代碼。
用文本編輯器打開 hello.ii , 你會發現多出許多代碼. 那是因為 #include 指令把 stdio 頭文件的代碼加進去了。
如果你把滾動條拉到最底下, 就會發現, printf 那一行的宏定義 ONE 和 TWO 已經被預處理器替換成 1 和 2 了 .
神奇吧!
其實它只是在編譯的時候, 把你的源代碼文件復制一份, 當作臨時文件, 然后把里面的預處理指令替換掉. 用完后就把這個臨時文件刪了. 所以一般情況下我們不知道這個文件的存在.