服務器技術之硬件冗余技術
硬件冗余技術是最常見、最基本的服務器技術之一,也是應用最廣泛的服務器通用技術。它是通過提供雙份完全一樣的硬件,并通過相應的技術設備用件時刻處于待命狀態,發現相應部件失效后立即接替原來的部件繼續工作,使得服務器保持恒久不間斷的運作。它是提供服務器可用性的一個重要手段。根據不同的冗余部位和冗余程度,主要分為以下幾種硬件冗余方式。
1.單擊容錯冗余
這時一種級別的冗余,達到了100%冗余。在這樣一個服務器中,對所有部件都提供了冗余,任何單一部件的損壞都不會造成硬盤中的數據丟失。其實這也是一種單機容錯技術,是在一臺服務器中提供兩套完整的服務器配件,當然都不是簡單地堆放,而是采取失效,立即啟用冗余部件。它比我們后面將要介紹的雙機容錯技術的容錯級別高些,不過采用這種冗余方式的代價較高,除非在一些對容錯性能的要求特別苛刻的環境,如金融、證券系統等。
如圖1-36所示的是NEC公司的一款單機容錯服務器。該產品是對處理器、內存、磁盤及電源等所有主要組件均實行雙重配置,實現容錯。在同一時刻,雙份的容錯硬件部件處理相同的指令。在一個部件出現故障的情形下,故障部件自動分類,其冗余部件像激活了的備份,繼續正常操作。系統不會停機,也不會丟失數據。每一組雙重配置的硬件均同時完成相同的工作,為銀行、證券等有著特別苛刻需求的關鍵領域提供高等級的可靠性。
2.雙服務器冗余
這種冗余方式指采用雙臺服務器進行冗余容錯,將雙臺服務器分為主/從服務器,從服務器是為主服務器出現故障而準備的,不過這一容錯技術需要專門的服務器集群技術來實現。當主服務器出現故障時,從服務器將立即接替主服務器的工作,從而使得任何一臺服務器出現故障都不會造成系統崩潰。
如圖1-37所示的是一款支持雙機容錯的服務器。它的雙機容錯方案,是將兩臺Powerleader Pl4400R服務器通過一條100MB網絡線相連,專門用于兩臺服務器的心跳監測、數據同步鏈路,不再占用客戶機與服務器通信時的應用網卡資源。平時,主服務器處理作業和數據,發生故障后,備用服務器自動接管主服務器的作業和數據,同時自動接管主服務器的主機名及網絡地址,而客戶可以繼續運行,無須重新啟動機器。待主服務器修復好以后,再將備用服務器上的作業和數據切換到主服務器上,而備用服務器又恢復到備用等待狀態。
3.磁盤冗余
這是最常見的硬件冗余方式之一,是提供多個備用磁盤。當然這些磁盤不是像其他冗余部件一樣消極等待,而是時刻處于激活的熱備份狀態,以與當前的活動磁盤保持同步。在這種冗余方式中,應用最廣的是磁盤冗余陣列技術(RAID)。
4.電源冗余
電源冗余和下面將要介紹的風扇冗余是目前服務器中最常見的硬件冗余之一,它們都是為了提高服務器的可用性。很明顯,電源冗余是在一臺服務器中同時提供兩個電源,通常是一個電源處于工作狀態,另一個電源則處于待命狀態,當當前電源出現故障時,備用電源立即接替它繼續工作,使得任何一個電源故障都不會造成系統停機。如圖1-38所示的是一臺具有兩個電源的服務器。
5.風扇冗余是指服務器的關鍵發熱部件上配置的降溫風扇,有主、備件兩套,這兩套風扇都具有自動切換功能,并支持風扇轉速的實時監測、發生故障時可自動報警并啟用備用風扇等功能。若系統正常,則備用風扇不工作,而當主風扇出現故障或其轉速低于規定的標準時,備用風扇馬上自動啟動,從而避免由于系統風扇損壞而導致系統內部溫度升高,使得服務器工作不穩定或停機,如圖1-39所示。
6.網卡冗余
網卡冗余是在一臺服務器中同時提供兩塊相同的網卡,其中一塊處于工作狀態,另一塊處于待命狀態。這樣一旦當前工作的網卡損壞,冗余網卡可立即接替故障網卡繼續工作,不會造成網絡服務中斷。
其實在硬件冗余方面有的品牌還提供了RAM、PCI適配器、網卡、內存,甚至CPU冗余等技術,在此不一一細講了。服務器的可靠性,不僅體現在硬件的冗余上,還體現在一些硬件在線診斷技術上,因為硬件的冗余畢竟有條件限制,我們不可能對所有配件都進行冗余,那樣大大提高服務器的成本。