服務器運行時,如果出現故障,服務器如何保持正常運轉,保證業務不會中斷?這時候就需要“容錯服務器”。服務器的容錯除了硬件的熱冷備,還需要應用層的容錯。同步內存和磁盤數據,目前HA只是同步了磁盤數據,真正的實現容錯還需要把內存數據同步到備份節點,即使主節點斷電也不會出現內存數據丟失導致應用中斷!
一、容錯服務器和普通服務器的區別:
1、“普通服務器”:我相信大家已經有個基礎概念,注意力放在三大件:CPU\內存\硬盤、CPU是核心,CPU是一個有多種功能的優秀領導者。它的優點在于調度、管理、協調能力強,計算能力則位于其次。
2、“容錯服務器”:顧名思義是服務器對于系統運行中產生的錯誤、故障的容納、糾錯能力,它是企業級應用中對于服務器穩定性追求的目標。容錯服務器能夠允許出現一定的錯誤(故障),這些服務器通常都具備有自動修復和支持冗余的功能模塊。當錯誤或者故障出現的時候,這些出錯的部件可以得到及時的修復或者切換,從而確保服務器不間斷運行。
容錯服務器基于容錯技術原理,采用硬件全冗余技術,通過獨立的芯片和軟件保證兩套硬件之間的零時間切換。通常對CPU、內存、磁盤和網卡甚至電源實現冗余備份,在任何部件出現問題的時候都不會造成系統宕機和數據丟失。目前很多基于工業標準的服務器都能實現這種冗余容錯機制,而且是以更具成本優勢的方式來實現。簡單來說,當服務器系統中的數據或文件丟失或損壞時,會自動恢復到損壞前的正常狀態,以保證服務器的正常使用,從而體現服務器對錯誤的容忍度。
冗余:指重復配置系統的某些組件。當系統發生故障時,冗余配置的組件介入并承擔故障組件的工作,從而減少系統的故障時間。通常指通過多次備份增加系統的可靠性。容錯主要靠冗余設計,增加資源換取可靠性。由于資源不同,冗余技術分為硬件冗余、軟件冗余、時間冗余和信息冗余。
硬件冗余是通過重復使用硬件來獲得容錯能力。軟件冗余的基本思想是使用多個不同的軟件來執行相同的功能,利用軟件設計差異來實現容錯。信息冗余是利用添加到數據中的一部分信息比特來檢測或糾正操作或傳輸中的錯誤,從而達到容錯的目的。在通信和計算機系統中,常用的可靠性碼包括奇偶校驗碼、循環冗余碼、漢明碼等。
容錯服務器作為一款高性能、高可靠性的服務器產品。為關鍵業務系統設計的服務器容錯方案是一種易于交付和高度可靠的方案,旨在保護客戶信息技術應用程序的持續、穩定和安全運行。
二、容錯服務器的幾點優勢:(主要是和雙機的區別說一下)
1、國際著名檢測組織IDC公布:容錯服務器的高可用性是99.9998%,而消除單點故障的集群是99.99%,IBM的大型機為99.995%
2、設計上容錯的目標是避免停機,而集群是減少停機(當我們有避免停機的方案,我們為什么還要選擇減少停機的方案呢?)
3、容錯能有效的保護動態數據不丟失,而雙機只能保證寫入硬盤的數據;
4、容錯能支持熱插拔任意的硬件,包括主板,CPU等關鍵性硬件,
5、布置非常簡單,只需要裝單套系統,數據庫也只需要一套,免去雙機軟件和研發代碼的麻煩,從而大大的減少工程師的工作量,也大大的減少了軟件成本.
6、速度比同配置的雙機要快20%以上.
7、后期維護成本幾乎為零,而雙機的話需要工程師的支持,或許由于系統補丁的升級需要額外的研發雙機代碼來保證系統的切換成功;
8、容錯是沒有切換時間的,而雙機由于硬件宕機后會發生停頓的情況,還有就是雙機切換工作是有可能不成功的.
9、容錯的windows系統因為有容錯揪錯芯片,所以容錯的windows系統比傳統的windows系統穩定,也許您用很多年都不需要重起windows,因為它永遠和剛開機一樣快,容錯因此承諾容錯的windows比IBM的AIX還穩定.因為您用上了容錯就不知道什么叫停機.
容錯服務器擁有一鍵式統一運維管理界面,如果機房部署多套容錯服務器,可以選擇One-View進行統一的界面管理和維護,包括對主機硬件和虛擬機運行狀態的監控和管理。做好容錯才能確保服務器的不間斷運行、服務器硬件冗余、服務器軟件更新、服務器硬件故障監控、降低人為操作的失誤率這五點就能減少服務器故障影響!
在實際使用服務器過程中,有些故障可能是因為應用程序故障、系統缺陷以及人為錯誤操作導致的。因此,服務器管理水平也需要提高。隨著信息化的不斷深入和業務的發展,服務器的作用對企業來說顯地更為重要。容錯服務器可以保證網站7*24全天候穩定運行,這也成為企業網站安全的必要的解決方案。
原文地址:https://blog.csdn.net/weixin_27722377/article/details/119266094