國(guó)內(nèi)的虛擬機(jī)一般不提供.htaccess功能(據(jù)我所知,discuz的主機(jī)好像提供此功能),而在國(guó)外主機(jī)中,.htaccess功能似乎是標(biāo)配,筆者的Blog架在MT上,支持.htaccess,每次看到一堆別人寫好了的.htaccess設(shè)置,很多命令都不甚了了,查看、修改起來很不方便,痛定思痛,潛心學(xué)習(xí)一下,知其所以然嘛~
學(xué)習(xí)前提:(不會(huì)的朋友要學(xué)習(xí)一下,才能更好的理解下面的文字呢)
Linux基礎(chǔ)(不會(huì)也沒事啦,寫個(gè).htaccess沒必要大費(fèi)周折啦,推薦:鳥哥私房菜linux基礎(chǔ))
正則表達(dá)式(Rewrite規(guī)則建立在正則的基礎(chǔ)之上,推薦:正則表達(dá)式30分鐘入門教程)
rewrite的語法格式:
RewriteEngine On #要想rewrite起作用,必須要寫上哦
RewriteBase url-path #設(shè)定基準(zhǔn)目錄,例如希望對(duì)根目錄下的文件rewrtie,就是”/”
RewriteCond test-string condPattern #寫在RewriteRule之前,可以有一或N條,用于測(cè)試rewrite的匹配條件,具體怎么寫,后面會(huì)詳細(xì)說到。
RewriteRule Pattern Substitution #規(guī)則
RewriteEngine On|Off
RewriteEngine 用于開啟或停用rewrite功能。
rewrite configurations 不會(huì)自動(dòng)繼承,因此你得給每個(gè)你想用 rewrite功能的虛擬主機(jī)目錄中加上這個(gè)指令。
RewriteBase URL-path
RewriteBase用于設(shè)定重寫的基準(zhǔn)URL。在下文中,你可以看見RewriteRule可以用于目錄級(jí)的配置文件中 (.htaccess)并在局部范圍內(nèi)起作用,即規(guī)則實(shí)際處理的只是剝離了本地路徑前綴的一部分。處理結(jié)束后,這個(gè)路徑會(huì)被自動(dòng)地附著回去。默認(rèn)值 是”RewriteBase physical-directory-path”。
在對(duì)一個(gè)新的URL進(jìn)行替換時(shí),此模塊必須把這個(gè)URL重新注入到服務(wù)器處理中。為此,它必須知道其對(duì)應(yīng)的URL前綴或者說URL基準(zhǔn)。通常,此前綴就是 對(duì)應(yīng)的文件路徑。但是,大多數(shù)網(wǎng)站URL不是直接對(duì)應(yīng)于其物理文件路徑的,因而一般不能做這樣的假定! 所以在這種情況下,就必須用RewriteBase指令來指定正確的URL前綴。
如果你的網(wǎng)站服務(wù)器URL不是與物理文件路徑直接對(duì)應(yīng)的,而又需要使用RewriteBase指令,則必須在每個(gè)對(duì)應(yīng)的.htaccess文件中指定 RewriteRule 。
RewriteCond TestString CondPattern [flags]
RewriteCond指令定義了一個(gè)規(guī)則的條件,即,在一個(gè)RewriteRule指令之前有一個(gè)或多個(gè)RewriteCond指令。 條件之后的重寫規(guī)則僅在當(dāng)前URI與pattern匹配并且符合這些條件的時(shí)候才會(huì)起作用。
TestString是一個(gè)純文本的字符串,但是還可以包含下列可擴(kuò)展的成分:
RewriteRule反向引用: 引用方法是 $N (0 <= N <= 9) 引用當(dāng)前(帶有若干RewriteCond指令的)RewriteRule中的 與pattern匹配的分組成分(圓括號(hào)!)。
RewriteCond反向引用: 引用方法是 %N (1 <= N <= 9) 引用當(dāng)前若干RewriteCond條件中最后符合的條件中的分組成分(圓括號(hào)!)。
RewriteMap 擴(kuò)展: 引用方法是 ${mapname:key|default}
服務(wù)器變量: 引用方法是 %{ NAME_OF_VARIABLE } 這個(gè)是我們最常使用到的功能
NAME_OF_VARIABLE具體數(shù)值見下表:
HTTP headers: | connection & request: | |
---|---|---|
HTTP_USER_AGENT HTTP_REFERER HTTP_COOKIE HTTP_FORWARDED HTTP_HOST HTTP_PROXY_CONNECTION HTTP_ACCEPT |
REMOTE_ADDR REMOTE_HOST REMOTE_USER REMOTE_IDENT REQUEST_METHOD SCRIPT_FILENAME PATH_INFO QUERY_STRING AUTH_TYPE |
|
server internals: | system stuff: | specials: |
DOCUMENT_ROOT SERVER_ADMIN SERVER_NAME SERVER_ADDR SERVER_PORT SERVER_PROTOCOL SERVER_SOFTWARE |
TIME_YEAR TIME_MON TIME_DAY TIME_HOUR TIME_MIN TIME_SEC TIME_WDAY TIME |
API_VERSION THE_REQUEST REQUEST_URI REQUEST_FILENAME IS_SUBREQ |
這些都對(duì)應(yīng)于類似命名的HTTP MIME頭、Apache服務(wù)器的C變量以及Unix系統(tǒng)中的 struct tm字段,大多數(shù)都在其他的手冊(cè)或者CGI規(guī)范中有所講述。 而其中為mod_rewrite所特有的變量有:
IS_SUBREQ
如果正在處理的請(qǐng)求是一個(gè)子請(qǐng)求,它包含字符串”true”,否則就是”false”。 模塊為了解析URI中的附加文件,有可能會(huì)產(chǎn)生子請(qǐng)求。
API_VERSION
這是正在使用的httpd中(服務(wù)器和模塊之間內(nèi)部接口)的Apache模塊API的版本, 其定義位于include/ap_mmn.h中。此模塊版本對(duì)應(yīng)于正在使用的Apache的版本 (比如,在Apache 1.3.14的發(fā)行版中,這個(gè)值是19990320:10)。 通常,對(duì)它感興趣的是模塊的作者。
THE_REQUEST
這是由瀏覽器發(fā)送給服務(wù)器的完整的HTTP請(qǐng)求行。(比如, “GET /index.html HTTP/1.1″). 它不包含任何瀏覽器發(fā)送的附加頭信息。
REQUEST_URI
這是在HTTP請(qǐng)求行中所請(qǐng)求的資源。(比如上述例子中的”/index.html”.)
REQUEST_FILENAME
這是與請(qǐng)求相匹配的完整的本地文件系統(tǒng)的文件路徑名或描述.
CondPattern是條件pattern, 即, 一個(gè)應(yīng)用于當(dāng)前實(shí)例TestString的正則表達(dá)式, 即, TestString將會(huì)被計(jì)算然后與CondPattern匹配.
注意:CondPattern是一個(gè)兼容perl的正則表達(dá)式, 但是還有若干補(bǔ)充:
可以在pattern串中使用'!‘ 字符(驚嘆號(hào))來實(shí)現(xiàn)匹配的反轉(zhuǎn)。
RewriteOptions Options
RewriteOptions指令為當(dāng)前服務(wù)器級(jí)和目錄級(jí)的配置設(shè)置一些選項(xiàng)。 Option可以是下列值之一:
inherit
此值強(qiáng)制當(dāng)前配置可以繼承其父配置。 在虛擬主機(jī)級(jí)配置中,它意味著主服務(wù)器的映射表、條件和規(guī)則可以被繼承。 在目錄級(jí)配置中,它意味著其父目錄的.htaccess中的條件和規(guī)則可以被繼承。
MaxRedirects=number
為了避免目錄級(jí)RewriteRule的無休止的內(nèi)部重定向, 在此類重定向和500內(nèi)部服務(wù)器錯(cuò)誤次數(shù)達(dá)到一個(gè)最大值的時(shí)候, mod_rewrite會(huì)停止對(duì)此請(qǐng)求的處理。 如果你確實(shí)需要對(duì)每個(gè)請(qǐng)求允許大于10次的內(nèi)部重定向,可以增大這個(gè)值。
RewriteRule Pattern Substitution [flags]
RewriteRule指令是重寫引擎的根本。此指令可以多次使用。 每個(gè)指令定義一個(gè)簡(jiǎn)單的重寫規(guī)則。這些規(guī)則的定義順序尤為重要, 因?yàn)椋谶\(yùn)行時(shí)刻,規(guī)則是按這個(gè)順序逐一生效的.
Pattern是一個(gè)作用于當(dāng)前URL的兼容perl的正則表達(dá)式。
此外,還可以使用否字符(‘!‘)的pattern前綴,以實(shí)現(xiàn)pattern的反轉(zhuǎn)。但是,需要注意的是使用否字符以反轉(zhuǎn)pattern時(shí),pattern中不能使用分組的通配成分;即$N。
重寫規(guī)則中的Substitution是, 當(dāng)原始URL與Pattern相匹配時(shí),用以替代(或替換)的字符串。除了純文本,還可以使用
$N 反向引用RewriteRule的pattern
%N 反向引用最后匹配的RewriteCond pattern
規(guī)則條件測(cè)試字符串中(%{VARNAME})的服務(wù)器變量
映射函數(shù)調(diào)用(${mapname:key|default})
下面給出幾個(gè)完整的例子供各位參考:
一、防盜鏈功能
只這四行就實(shí)現(xiàn)了防盜鏈?zhǔn)遣皇呛苌衿鎊_^,編寫起來是不是又覺得復(fù)雜。
RewriteEngine On
RewriteCond %{HTTP_REFERER} !^http://(.+.)?mysite.com/ [NC]
RewriteCond %{HTTP_REFERER} !^$
RewriteRule .*.(jpe?g|gif|bmp|png)$ /images/nohotlink.jpg [L]
二、網(wǎng)址規(guī)范化
這個(gè)是把所有二級(jí)域名都重定向到www.yourdomain.com的例子,現(xiàn)在看來是不是很簡(jiǎn)單了?
Options +FollowSymLinks
rewriteEngine on
rewriteCond %{http_host} ^yourdomain.com [NC]
rewriteRule ^(.*)$ http://www.yourdomain.com/$1 [R=301,L]
三、臨時(shí)錯(cuò)誤頁面
當(dāng)你的網(wǎng)站在升級(jí)、修改的時(shí)候,你最好讓訪客轉(zhuǎn)到指定的頁面,而不是沒做完的頁面或者是錯(cuò)誤頁。
RewriteEngine on
RewriteCond %{REQUEST_URI} !/maintenance.html$
RewriteCond %{REMOTE_ADDR} !^123.123.123.123
RewriteRule $ /error.html [R=302,L]
四、重定向RSS地址到FeedSky
除了可以更改模板里的RSS地址外,.htaccess也能實(shí)現(xiàn)RSS地址的更改,并更加方便。
RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} !FeedSky [NC]
RewriteCond %{HTTP_USER_AGENT} !FeedValidator [NC]
RewriteRule ^feed/?([_0-9a-z-]+)?/?$ http://feed.feedsky.com/yours
附錄:flags
‘redirect|R [=code]‘ (強(qiáng)制重定向 redirect)
以http://thishost[:thisport]/(使新的URL成為一個(gè)URI) 為前綴的Substitution可以強(qiáng)制性執(zhí)行一個(gè)外部重定向。 如果code沒有指定,則產(chǎn)生一個(gè)HTTP響應(yīng)代碼302(臨時(shí)性移動(dòng))。 如果需要使用在300-400范圍內(nèi)的其他響應(yīng)代碼,只需在此指定這個(gè)數(shù)值即可, 另外,還可以使用下列符號(hào)名稱之一: temp (默認(rèn)的), permanent, seeother. 用它可以把規(guī)范化的URL反饋給客戶端,如, 重寫“/~”為 “/u/”,或?qū)?u/user加上斜杠,等等。 注意: 在使用這個(gè)標(biāo)記時(shí),必須確保該替換字段是一個(gè)有效的URL! 否則,它會(huì)指向一個(gè)無效的位置! 并且要記住,此標(biāo)記本身只是對(duì)URL加上 http://thishost[:thisport]/的前綴,重寫操作仍然會(huì)繼續(xù)。 通常,你會(huì)希望停止重寫操作而立即重定向,則還需要使用'L'標(biāo)記.
‘forbidden|F' (強(qiáng)制URL為被禁止的 forbidden)
強(qiáng)制當(dāng)前URL為被禁止的,即,立即反饋一個(gè)HTTP響應(yīng)代碼403(被禁止的)。 使用這個(gè)標(biāo)記,可以鏈接若干RewriteConds以有條件地阻塞某些URL。
‘gone|G' (強(qiáng)制URL為已廢棄的 gone)
強(qiáng)制當(dāng)前URL為已廢棄的,即,立即反饋一個(gè)HTTP響應(yīng)代碼410(已廢棄的)。 使用這個(gè)標(biāo)記,可以標(biāo)明頁面已經(jīng)被廢棄而不存在了.
‘proxy|P' (強(qiáng)制為代理 proxy)
此標(biāo)記使替換成分被內(nèi)部地強(qiáng)制為代理請(qǐng)求,并立即(即, 重寫規(guī)則處理立即中斷)把處理移交給代理模塊。 你必須確保此替換串是一個(gè)有效的(比如常見的以 http://hostname開頭的)能夠?yàn)锳pache代理模塊所處理的URI。 使用這個(gè)標(biāo)記,可以把某些遠(yuǎn)程成分映射到本地服務(wù)器名稱空間, 從而增強(qiáng)了ProxyPass指令的功能。 注意: 要使用這個(gè)功能,代理模塊必須編譯在Apache服務(wù)器中。 如果你不能確定,可以檢查“httpd -l”的輸出中是否有mod_proxy.c。 如果有,則mod_rewrite可以使用這個(gè)功能; 如果沒有,則必須啟用mod_proxy并重新編譯“httpd”程序。
‘last|L' (最后一個(gè)規(guī)則 last)
立即停止重寫操作,并不再應(yīng)用其他重寫規(guī)則。 它對(duì)應(yīng)于Perl中的last命令或C語言中的break命令。 這個(gè)標(biāo)記可以阻止當(dāng)前已被重寫的URL為其后繼的規(guī)則所重寫。 舉例,使用它可以重寫根路徑的URL(‘/')為實(shí)際存在的URL, 比如, ‘/e/www/'.
‘next|N' (重新執(zhí)行 next round)
重新執(zhí)行重寫操作(從第一個(gè)規(guī)則重新開始). 這時(shí)再次進(jìn)行處理的URL已經(jīng)不是原始的URL了,而是經(jīng)最后一個(gè)重寫規(guī)則處理的URL。 它對(duì)應(yīng)于Perl中的next命令或C語言中的continue命令。 此標(biāo)記可以重新開始重寫操作,即, 立即回到循環(huán)的頭部。 但是要小心,不要制造死循環(huán)!
‘chain|C' (與下一個(gè)規(guī)則相鏈接 chained)
此標(biāo)記使當(dāng)前規(guī)則與下一個(gè)(其本身又可以與其后繼規(guī)則相鏈接的, 并可以如此反復(fù)的)規(guī)則相鏈接。 它產(chǎn)生這樣一個(gè)效果: 如果一個(gè)規(guī)則被匹配,通常會(huì)繼續(xù)處理其后繼規(guī)則, 即,這個(gè)標(biāo)記不起作用;如果規(guī)則不能被匹配, 則其后繼的鏈接的規(guī)則會(huì)被忽略。比如,在執(zhí)行一個(gè)外部重定向時(shí), 對(duì)一個(gè)目錄級(jí)規(guī)則集,你可能需要?jiǎng)h除“.www” (此處不應(yīng)該出現(xiàn)“.www”的)。
‘type|T=MIME-type' (強(qiáng)制MIME類型 type)
強(qiáng)制目標(biāo)文件的MIME類型為MIME-type。 比如,它可以用于模擬mod_alias中的ScriptAlias指令, 以內(nèi)部地強(qiáng)制被映射目錄中的所有文件的MIME類型為“application/x-httpd-cgi”.
‘nosubreq|NS' (僅用于不對(duì)內(nèi)部子請(qǐng)求進(jìn)行處理 no internal sub-request)
在當(dāng)前請(qǐng)求是一個(gè)內(nèi)部子請(qǐng)求時(shí),此標(biāo)記強(qiáng)制重寫引擎跳過該重寫規(guī)則。 比如,在mod_include試圖搜索可能的目錄默認(rèn)文件(index.xxx)時(shí), Apache會(huì)內(nèi)部地產(chǎn)生子請(qǐng)求。對(duì)子請(qǐng)求,它不一定有用的,而且如果整個(gè)規(guī)則集都起作用, 它甚至可能會(huì)引發(fā)錯(cuò)誤。所以,可以用這個(gè)標(biāo)記來排除某些規(guī)則。 根據(jù)你的需要遵循以下原則: 如果你使用了有CGI腳本的URL前綴,以強(qiáng)制它們由CGI腳本處理, 而對(duì)子請(qǐng)求處理的出錯(cuò)率(或者開銷)很高,在這種情況下,可以使用這個(gè)標(biāo)記。
‘nocase|NC' (忽略大小寫 no case)
它使Pattern忽略大小寫,即, 在Pattern與當(dāng)前URL匹配時(shí),'A-Z' 和'a-z'沒有區(qū)別。
‘qsappend|QSA' (追加請(qǐng)求串 query string append)
此標(biāo)記強(qiáng)制重寫引擎在已有的替換串中追加一個(gè)請(qǐng)求串,而不是簡(jiǎn)單的替換。 如果需要通過重寫規(guī)則在請(qǐng)求串中增加信息,就可以使用這個(gè)標(biāo)記。
‘noescape|NE' (在輸出中不對(duì)URI作轉(zhuǎn)義 no URI escaping)
此標(biāo)記阻止mod_rewrite對(duì)重寫結(jié)果應(yīng)用常規(guī)的URI轉(zhuǎn)義規(guī)則。 一般情況下,特殊字符(如'%', ‘$', ‘;'等)會(huì)被轉(zhuǎn)義為等值的十六進(jìn)制編碼。 此標(biāo)記可以阻止這樣的轉(zhuǎn)義,以允許百分號(hào)等符號(hào)出現(xiàn)在輸出中,如: RewriteRule /foo/(.*) /bar?arg=P1\%3d$1 [R,NE]
可以使'/foo/zed'轉(zhuǎn)向到一個(gè)安全的請(qǐng)求'/bar?arg=P1=zed'.
‘passthrough|PT' (移交給下一個(gè)處理器 pass through)
此標(biāo)記強(qiáng)制重寫引擎將內(nèi)部結(jié)構(gòu)request_rec中的uri字段設(shè)置為 filename字段的值,它只是一個(gè)小修改,使之能對(duì)來自其他URI到文件名翻譯器的 Alias,ScriptAlias, Redirect 等指令的輸出進(jìn)行后續(xù)處理。舉一個(gè)能說明其含義的例子: 如果要通過mod_rewrite的重寫引擎重寫/abc為/def, 然后通過mod_alias使/def轉(zhuǎn)變?yōu)?ghi,可以這樣: RewriteRule ^/abc(.*) /def$1 [PT]
Alias /def /ghi
如果省略了PT標(biāo)記,雖然mod_rewrite運(yùn)作正常, 即, 作為一個(gè)使用API的URI到文件名翻譯器, 它可以重寫uri=/abc/…為filename=/def/…, 但是,后續(xù)的mod_alias在試圖作URI到文件名的翻譯時(shí),則會(huì)失效。
注意: 如果需要混合使用不同的包含URI到文件名翻譯器的模塊時(shí), 就必須使用這個(gè)標(biāo)記。混合使用mod_alias和mod_rewrite就是個(gè)典型的例子。
For Apache hackers
如果當(dāng)前Apache API除了URI到文件名hook之外,還有一個(gè)文件名到文件名的hook, 就不需要這個(gè)標(biāo)記了! 但是,如果沒有這樣一個(gè)hook,則此標(biāo)記是唯一的解決方案。 Apache Group討論過這個(gè)問題,并在Apache 2.0 版本中會(huì)增加這樣一個(gè)hook。
'skip|S=num' (跳過后繼的規(guī)則 skip)
此標(biāo)記強(qiáng)制重寫引擎跳過當(dāng)前匹配規(guī)則后繼的num個(gè)規(guī)則。 它可以實(shí)現(xiàn)一個(gè)偽if-then-else的構(gòu)造: 最后一個(gè)規(guī)則是then從句,而被跳過的skip=N個(gè)規(guī)則是else從句. (它和'chain|C'標(biāo)記是不同的!)
‘env|E=VAR:VAL' (設(shè)置環(huán)境變量 environment variable)
此標(biāo)記使環(huán)境變量VAR的值為VAL, VAL可以包含可擴(kuò)展的反向引用的正則表達(dá)式$N和%N。 此標(biāo)記可以多次使用以設(shè)置多個(gè)變量。 這些變量可以在其后許多情況下被間接引用,但通常是在XSSI (via or CGI (如 $ENV{‘VAR'})中, 也可以在后繼的RewriteCond指令的pattern中通過%{ENV:VAR}作引用。 使用它可以從URL中剝離并記住一些信息。
‘cookie|CO=NAME:VAL:domain[:lifetime[:path]]' (設(shè)置cookie)
它在客戶端瀏覽器上設(shè)置一個(gè)cookie。 cookie的名稱是NAME,其值是VAL。 domain字段是該cookie的域,比如'.apache.org', 可選的lifetime是cookie生命期的分鐘數(shù), 可選的path是cookie的路徑。
深入閱讀:http://oss.org.cn/man/newsoft/ApacheManual/mod/mod_rewrite.html