一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

服務器之家:專注于服務器技術及軟件下載分享
分類導航

Linux|Centos|Ubuntu|系統進程|Fedora|注冊表|Bios|Solaris|Windows7|Windows10|Windows11|windows server|

服務器之家 - 服務器系統 - Linux - Linux操作系統存儲子系統核心技術之硬盤與RAID

Linux操作系統存儲子系統核心技術之硬盤與RAID

2020-11-08 21:19今日頭條SunnyZhang的IT世界 Linux

Linux操作系統的存儲子系統應該是Linux中最為復雜的子系統了。其實很多子系統都認為自己是最復雜的子系統,比如內存子系統和網絡子系統也這么說。

Linux操作系統的存儲子系統應該是Linux中最為復雜的子系統了。其實很多子系統都認為自己是最復雜的子系統,比如內存子系統和網絡子系統也這么說。無論如何,存儲子系統在Linux中是比較復雜的。今天我們就介紹一下Linux的存儲子系統中的硬盤RAID的相關內容,后面再寫一篇關于LVM與文件系統的內容。

Linux操作系統存儲子系統核心技術之硬盤與RAID

硬盤

在Linux的存儲子系統中,最底層的就是硬盤了。這里的硬盤并不是指我們看到的硬盤硬件,而是指在Linux內部看到的硬盤設備,或者說是塊設備。如果我們在/dev目錄執行以下ls命令,就可以看到很多設備。在這些設備中以sd開頭的就是基于SCSI協議的硬盤。

Linux操作系統存儲子系統核心技術之硬盤與RAID

圖1 Linux中的塊設備

無論是基于SAS、iSCSI還是FC的磁盤設備,大概都是這個樣子。形似dm-X的是Device Map塊設備,也就是通過LVM進行管理的設備,這種設備是一種邏輯設備。

在Linux操作系統中塊設備的種類很多,有本地磁盤設備、有SAN設備還有基于網絡的塊設備。在虛擬機中塊設備又呈現為另外一種文件名,比如在Xen虛擬機中為xvdX。

雖然名稱差異很大,但是在Linux操作系統內核中的實現卻非常簡單。在內核中任何磁盤塊設備都是通過調用add_disk函數完成的。在《Linux設備驅動程序》這本書對塊設備進行了詳細的介紹,并且可以通過非常簡單的代碼實現一個自己的塊設備。

Linux操作系統存儲子系統核心技術之硬盤與RAID

圖2 最簡單的塊設備驅動

這里面有2個函數,也就是alloc_disk和add_disk。前一個函數是分配一個通用塊的結構體,后者則是將該塊設備添加到內核,也就是在/dev目錄下生成一個“文件”。以上述代碼為例,執行后會生成如下塊設備。

brw-rw---- 1 root disk 251, 0 Jun 16 09:13 /dev/sbulla 

這里我們自定義了一個設備名稱sbulla。其實我們看到的SCSI設備也是這樣定義的,只不過其定義名稱的時候是通過sd字符。

以上述代碼為例,在塊設備中比較重要的地方是初始化了一個隊列處理函數(sbull_full_request)。所有從上層訪問該塊設備的請求都會轉發到該處理函數進行處理。

所有塊設備都要初始化這個隊列,并且提供一個請求處理函數。不同的塊設備的請求處理函數略有不同。比如常見的SCSI塊設備,其處理函數初始化過程如下:

q = __scsi_alloc_queue(sdev->host, scsi_request_fn); 

而nbd(網絡塊設備,通過網絡的方式將服務端的文件映射為客戶端的塊設備)設備的初始化隊列的代碼如下所示:

disk->queue = blk_init_queue(do_nbd_request, &nbd_lock); 

類似的例子還很多,本文不再一一介紹。這里我們需要理解一點,核心問題在于注冊處理請求的回調函數,以及通過add_disk就可以在/dev目錄下面創建一個塊設備。

另外一點,對于任何類型的塊設備,無論是本地硬盤,還是經過網絡的NBD和iSCSI,還是FC設備,最后都是/dev目錄下的一個文件,而這個文件其實就是塊設備。我們可以通過對該文件的讀寫實現對塊設備的訪問。

RAID

作為普通用戶使用單個硬盤是沒有任何問題的,但是作為企業應用使用單個硬盤存在很大的風險。這時因為硬盤隨時有可能損壞,因此我們需要一種機制來保證即使出現硬盤故障的情況下,數據不會丟失,且業務仍然可以正常工作。

RAID正是解決上述問題的技術。RAID的全稱為廉價冗余磁盤陣列(Redundant Array of Inexpensive Disks),從字面可以看出其基本原理就是通過廉價的磁盤組成一組磁盤。RAID不僅僅可以通過冗余的方式解決數據可靠性的問題,還可以提高性能。其主要原理就是將請求拆分到多個物理硬盤來執行,性能自然比一個硬盤快了。

在Linux操作系統層面,其實就是將物理磁盤通過軟件抽象為邏輯磁盤。以RAID1(兩塊磁盤存儲相同的數據,在出現一塊磁盤故障的情況下,數據不丟失)為例,通過Linux內核中的軟件創建一個虛擬的塊設備,而該塊設備中記錄了底層對應的物理設備及相關參數。

Linux操作系統存儲子系統核心技術之硬盤與RAID

圖3 RAID1 示意圖

因此,從用戶層面來看就是一塊普通的磁盤設備,而在底層卻是2個獨立的物理硬盤。當用戶向邏輯磁盤寫數據的時候,其中的軟件會通過參數進行計算,并將數據重新定向到底層的物理設備。通過這種方法可以保證即使出現某個物理磁盤損壞,用戶的數據仍然完好無損。

除了上面說的RAID1外,還有很多RAID類型。不同的RAID類型實現不同的功能。比如RAID0實現條帶化,主要是提升性能;RAID1則是實現數據的冗余,防止磁盤故障導致的數據丟失;由于上述RAID只能解決一方面的問題,因此有人講兩者結合,出現了RAID10和RAID01,這樣既能保證數據的可靠性,又能提升性能。

由于RAID1是一份數據寫到兩個設備,因此只有50%的有效數據。為了提高有效數據率,于是發明了RAID5和RAID6等類型。其中RAID5通過增加一個校驗數據來保證數據的可靠性,以5塊盤的RAID5為例,其中有效數占4塊盤的空間,有效數據80%。但是RAID5有個問題,就是一組磁盤中只能壞一塊,如果損壞的磁盤超過1塊就會導致數據丟失。RAID6的算法與RAID5類似,它的特點是可以容忍2塊磁盤故障。

在實現層面,Linux的RAID實現在用戶態和內核態都有涉及。其中用戶態主要進行RAID的管理,而內核態一方面配合用戶態進行RAID管理,另外一方面則實現對IO的處理,這部分才是RAID最為核心的內容。

Linux操作系統存儲子系統核心技術之硬盤與RAID

圖4 軟件架構

對于基于SCSI物理磁盤的RAID來說,Linux環境下整個軟件架構如圖4所示。其中虛線以上的為用戶態的軟件模塊,虛線以下的為內核態的軟件模塊。這里比較核心的是RAID公共層,在這里主要創建md設備,該設備是一個邏輯設備,也是用戶可以看到的RAID設備。其下則是具體的RAID模塊,用于實現不同的RAID級別(算法)。

再往下就是通用SCSI驅動層了,也就是圖中的SCSI磁盤驅動這一層的內容。該層其實是SCSI系統的上層驅動(SCSI子系統分為上中下三層)。RAID模塊通過調用該層的數據訪問接口就可以實現物理磁盤數據讀寫了。

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 日日骑夜夜骑 | 亚洲春黄在线观看 | 成人免费观看www视频 | 国产79av| 九九精品免视频国产成人 | 俺去俺来也www色官网免费的 | 国产精品合集久久久久青苹果 | 日韩在线视频免费不卡一区 | 好爽好深好猛好舒服视频上 | 成人在线观看视频免费 | free性丰满hd性欧美厨房 | 美女张开腿黄网站免费精品动漫 | 亚洲一二三区久久五月天婷婷 | 韩国女主播一区二区视频 | 亚洲3dxxxx动漫xxx | 果冻传媒九一制片厂 | 婷婷久久综合九色综合九七 | 亚洲AV蜜桃永久无码精品红樱桃 | 精品国产免费第一区二区三区日韩 | 免费特黄一级欧美大片在线看 | 多人群p全肉小说 | 日本高清中文字幕 | 天选之王漫画顾长歌免费阅读 | 国产成人毛片 | 精精国产xxxx视频在线播放器 | yellow高清免费观看日本 | 91综合在线视频 | 114毛片免费观看网站 | 精品久久久久久亚洲 | vod国产成人精品视频 | 啪啪国产视频 | 精品无人区乱码1区2区3区在线 | 国产首页精品 | 好爽轻点太大了太深了 | 国产精品亚洲片在线观看麻豆 | 香蕉久久一区二区不卡无毒影院 | 久久国产精品二区99 | 91大神在线观看精品一区 | 不良小说 | 99精品热线在线观看免费视频 | 波多野结衣在线观看中文字幕 |