前言
最近在部署項目時要求實現負載均衡,有趣的是發現網上一搜全部都是以下類似的配置文件
- upstream localhost{
- server 127.0.0.1:8080 weight=1;
- server 127.0.0.1:8081 weight=1;
- }
- server {
- listen 80;
- server_name localhost;
- location / {
- proxy_pass http://localhost;
- index index.html index.htm index.jsp;
- }
- }
所以打算來看看Nginx內部原理,這篇博客主要介紹Nginx如何實現反向代理以及在Nginx中負載均衡的參數使用
一、正向代理與反向代理
正向代理是代理客戶端,也就是客戶端能真正接觸到的,比如訪問外網時需要使用VPN軟件,在這個軟件中用戶可以選擇連接哪里的服務器。
反向代理則是代理服務端,用戶感知不到,只是客戶端把請求發到服務端的端口時,Nginx監聽到了便把該端口的請求轉發到不同的服務器上。就以上面配置文件來講解,當在網址中輸入http://localhost:80/時(不加80一樣時默認進入80端口,這里為了表示清楚),而后Nginx監聽到80端口的請求之后,就會查找對應的location來執行。由上面的配置文件我們可以看出是將請求轉發到了不同的端口。這是在服務器中執行的,用戶不可見。
而服務端中我們最常使用的反向代理的工具就是Nginx。
二、Nginx內部基本架構
nginx在啟動后以daemon的方式在后臺運行,會有一個master進程和多個worker進程。
master進程:主要用來管理worker進程,包含:接收來自外界的信號,向各worker進程發送信號,監控worker進程的運行狀態,當worker進程退出后(異常情況下),會自動重新啟動新的worker進程。
worker進程:處理基本的網絡事件了。多個worker進程之間是對等的,他們同等競爭來自客戶端的請求,各進程互相之間是獨立的。一個請求,只可能在一個worker進程中處理,一個worker進程,不可能處理其它進程的請求。worker進程的個數是可以設置的,一般我們會設置與機器cpu核數一致,或者直接設置參數worker_processes auto;

所以Nginx基本的架構就如下:

當我們輸入./nginx -s reload,就是來重啟nginx,./nginx -s stop,就是來停止nginx的運行,這里面是如何做到的?執行命令時,我們是啟動一個新的nginx進程,而新的nginx進程在解析到reload參數后,就知道我們的目的是控制nginx來重新加載配置文件了,它會向master進程發送信號。master進程在接到信號后,會先重新加載配置文件,然后再啟動新的worker進程,并向所有老的worker進程發送信號,告訴他們可以光榮退休了。新的worker在啟動后,就開始接收新的請求,而老的worker在收到來自master的信號后,就不再接收新的請求,并且在當前進程中的所有未處理完的請求處理完成后,再退出。所以使用上面命令重啟Nginx的時候服務是不中斷的。
三、Nginx如何處理客戶端請求
首先來解釋一下上面的架構圖:每個worker進程都是從master進程分支過來的,在master進程里面,先建立好需要監聽的socket之后,然后再分支出多個worker進程。所有worker進程的listenfd(socket中listenfd是指客戶端連接本機時的fd,是用來和客戶端通信用的)會在新連接到來時變得可讀,為保證只有一個進程處理該連接,所有worker進程在注冊listenfd讀事件前搶accept_mutex,搶到互斥鎖的那個進程注冊listenfd讀事件,在讀事件里調用accept接受該連接。
在Nginx中worker進程之間是平等的,每個進程,處理請求的機會也是一樣的。當Nginx監聽80端口時,一個客戶端的連接請求過來,每個進程都有可能處理這個連接,上面說到是每個worker進程都會去搶注listenfd讀事件。當一個worker進程在accept這個連接之后,就開始讀取請求,解析請求,處理請求,產生數據后,再返回給客戶端,最后才斷開連接,這樣一個完整的請求就是這樣的了。這里需要注意的是一個請求,完全由worker進程來處理,而且只在一個worker進程中處理。
下面兩幅流程圖能很好的幫我們理解


四、Nginx如何處理事件并且實現高并發
Nginx內部采用了異步非阻塞的方式來處理請求,也就是說,Nginx是可以同時處理成千上萬個請求的。
異步非阻塞:當一個網絡請求過來時,我們并不依賴于這個請求才能做后續操作,那么這個請求就是異步操作,也就是調用者在沒有得到結果之前同樣可以執行后續的操作。非阻塞就是當前進程/線程沒有得到請求調用的結果時也不會妨礙到進程/線程后續的操作??梢钥闯霎惒胶头亲枞膶ο笫遣煌摹?/p>
五、Nginx負載均衡的算法及參數
round robin(默認):輪詢方式,依次將請求分配到后臺各個服務器中,適用于后臺機器性能一致的情況,若服務器掛掉,可以自動從服務列表中剔除
weight:根據權重來分發請求到不同服務器中,可以理解為比例分發,性能較高服務器分多點請求,較低的則分少點請求
IP_hash:根據請求者ip的hash值將請求發送到后臺服務器中,保證來自同一ip的請求被轉發到固定的服務器上,解決session問題
- upstream localhost {
- ip_hash;
- server 127.0.0.1:8080;
- server 127.0.0.1:8080;
- }
上面是最基本的三種算法,我們還可以通過改變參數來自行配置負載均衡
- upstream localhost{
- ip_hash;
- server 127.0.0.1:9090 down;
- server 127.0.0.1:8080 weight=2;
- server 127.0.0.1:6060;
- server 127.0.0.1:7070 backup;
- }
參數列表如下:
