在計算機科學中,抽象語法樹(abstract syntax tree或者縮寫為AST),或者語法樹(syntax tree),是源代碼的抽象語法結構的樹狀表現形式,這里特指編程語言的源代碼。樹上的每個節點都表示源代碼中的一種結構。之所以說語法是“抽象”的,是因為這里的語法并不會表示出真實語法中出現的每個細節。比如,嵌套括號被隱含在樹的結構中,并沒有以節點的形式呈現;而類似于if-condition-then這樣的條件跳轉語句,可以使用帶有兩個分支的節點來表示。
和抽象語法樹相對的是具體語法樹(concrete syntaxtree),通常稱作分析樹(parse tree)。一般的,在源代碼的翻譯和編譯過程中,語法分析器創建出分析樹。一旦AST被創建出來,在后續的處理過程中,比如語義分析階段,會添加一些信息。
抽象語法樹的結構不依賴于源語言的文法,也就是語法分析階段所采用的上下文無關文法。因為在Parser工程中,經常會對文法進行等價的轉換(消除左遞歸、回溯、二義性等),這樣會給文法引入一些多余的成分,對后續階段造成不利影響,甚至會使各階段變得混亂。因此,很多編譯器(包括GJC)經常要獨立地構造語法分析樹,為前、后端建立一個清晰的接口。
Python實現
假設對'a + 3 * b'進行解釋,其中a=2,b=5
代碼很簡單,就不再進行詳細的解釋了。
1
2
3
4
5
6
7
8
9
10
11
12
13
|
Num = lambda env, n: n Var = lambda env, x: env[x] Add = lambda env, a, b:_eval(env, a) + _eval(env, b) Mul = lambda env, a, b:_eval(env, a) * _eval(env, b) _eval = lambda env, expr:expr[ 0 ](env, * expr[ 1 :]) env = { 'a' : 2 , 'b' : 5 } tree = (Add, (Var, 'a' ), (Mul, (Num, 3 ), (Var, 'b' ))) print _eval(env, tree) |
輸出結果為17