DFS 分布式存儲(chǔ)系統(tǒng)是什么?分布式文件系統(tǒng)(Distributed File System)是一個(gè)軟件/軟件服務(wù)器,采用全對(duì)稱無(wú)中心化的架構(gòu)設(shè)計(jì)的文件系統(tǒng),這個(gè)軟件可以用來(lái)管理文件。這些服務(wù)器節(jié)點(diǎn)通過(guò)網(wǎng)絡(luò)相連構(gòu)成一個(gè)龐大的文件存儲(chǔ)服務(wù)器集群,這些服務(wù)器都用于存儲(chǔ)文件資源,通過(guò)分布式文件系統(tǒng)來(lái)管理這些服務(wù)器上的文件。
一、DFS分布式存儲(chǔ)系統(tǒng)工作原理
DFS支持獨(dú)立DFS名稱空間、具有一個(gè)主機(jī)服務(wù)器的名稱空間和具有多個(gè)主機(jī)服務(wù)器和高適用性的基于域的名稱空間?;谟虻拿臻g的DFS拓?fù)鋽?shù)據(jù)存儲(chǔ)在Active Directory中。數(shù)據(jù)包括DFS根、DFS鏈接和DFS目標(biāo)。每個(gè)DFS樹結(jié)構(gòu)都有一個(gè)或多個(gè)根目標(biāo)。根目標(biāo)是運(yùn)行DFS服務(wù)的主機(jī)服務(wù)器。
一個(gè)DFS樹結(jié)構(gòu)可以包含一個(gè)或多個(gè)DFS鏈接。每個(gè)DFS鏈接指向網(wǎng)絡(luò)上的一個(gè)或多個(gè)共享文件夾(這些文件夾稱為目標(biāo))??梢詮腄FS名稱空間中添加、修改和刪除DFS鏈接。當(dāng)用戶訪問(wèn)DFS鏈接時(shí),DFS服務(wù)器根據(jù)客戶端的站點(diǎn)信息選擇一組目標(biāo),客戶端訪問(wèn)在集合中第一個(gè)可用的目標(biāo)。以上操作有助于在可能的目標(biāo)之間分發(fā)客戶機(jī)請(qǐng)求,并且即使一些服務(wù)器出現(xiàn)故障,也可以為用戶提供持續(xù)的可訪問(wèn)性。
現(xiàn)代分布式文件系統(tǒng)的特征
?高IOPS/高小文件性能:一些DFS系統(tǒng)支持非常高的IOPS,以提高小文件性能。
?跨協(xié)議鎖定:一些DFS系統(tǒng),當(dāng)文件在被另一個(gè)協(xié)議修改,允許一個(gè)協(xié)議鎖定該文件。該特性禁止文件被多主機(jī)訪問(wèn)損壞,即使是在使用不同協(xié)議訪問(wèn)文件時(shí)也是如此。
?云駐留服務(wù):一些DFS解決方案可以運(yùn)行在公共云環(huán)境中。也就是說(shuō),它們的文件數(shù)據(jù)存儲(chǔ)、元數(shù)據(jù)服務(wù)和任何監(jiān)控/管理服務(wù)都運(yùn)行在公共云提供商中。文件數(shù)據(jù)訪問(wèn)可以在同一個(gè)云AZs內(nèi)進(jìn)行,也可以跨云區(qū)域進(jìn)行,甚至可以在訪問(wèn)云數(shù)據(jù)的前提下進(jìn)行。
?高實(shí)用性:一些DFS系統(tǒng)還通過(guò)跨多個(gè)站點(diǎn)、AZs或服務(wù)器,分割和復(fù)制其控制、元數(shù)據(jù)和文件數(shù)據(jù)存儲(chǔ)系統(tǒng)來(lái)支持非常高的可用性。
?數(shù)據(jù)縮減:一些DFS解決方案支持?jǐn)?shù)據(jù)壓縮或重復(fù)數(shù)據(jù)刪除,旨在減少存儲(chǔ)文件數(shù)據(jù)所需的物理數(shù)據(jù)存儲(chǔ)空間。
?靜態(tài)數(shù)據(jù)加密:一些DFS系統(tǒng)提供靜態(tài)文件數(shù)據(jù)和元數(shù)據(jù)的加密。
?單個(gè)名稱空間:一些DFS系統(tǒng)提供了將多個(gè)文件系統(tǒng)/共享連接到單個(gè)名稱空間的能力,該名稱空間可用于訪問(wèn)所服務(wù)的任何文件目錄。
?地理圍欄:一些DFS系統(tǒng)可以限制或限制數(shù)據(jù)駐留和訪問(wèn)的物理位置。支持GDPR和其他對(duì)數(shù)據(jù)移動(dòng)的法律限制可能需要此功能。
二、DFS 分布式存儲(chǔ)系統(tǒng)的種類
分布式存儲(chǔ)包含傳統(tǒng)意義上的分布式文件系統(tǒng)、分布式塊存儲(chǔ)和分布式對(duì)象存儲(chǔ),還包括分布式數(shù)據(jù)庫(kù)和分布式緩存等,根據(jù)其架構(gòu)分為:
A、中間控制節(jié)點(diǎn)架構(gòu):以 HDFS 為代表,部分命名節(jié)點(diǎn)存放管理數(shù)據(jù),另一部分?jǐn)?shù)據(jù)節(jié)點(diǎn)存放業(yè)務(wù)數(shù)據(jù)。具有組織化明確的特點(diǎn)。
B、完全無(wú)中心架構(gòu)—計(jì)算模式:以 Ceph 為代表的架構(gòu)是其典型的代表,客戶端通過(guò)設(shè)備映射關(guān)系通過(guò)計(jì)算方式,明確寫入的位置,從而達(dá)到客戶端與存儲(chǔ)節(jié)點(diǎn)的直接通信。
C、完全無(wú)中心架構(gòu)— 一致性哈希:以 Swift 為代表的架構(gòu)是其典型的代表,通過(guò)將設(shè)備制定為哈希環(huán),然后通過(guò)數(shù)據(jù)名稱計(jì)算出對(duì)應(yīng)的哈希值,從而映射到哈希環(huán)的某個(gè)位置實(shí)現(xiàn)數(shù)據(jù)定位
三、DFS 分布式存儲(chǔ)系統(tǒng)有以下幾個(gè)優(yōu)勢(shì)和特色:
1、DFS允許多個(gè)用戶訪問(wèn)或存儲(chǔ)數(shù)據(jù):全對(duì)稱無(wú)中心化的架構(gòu)設(shè)計(jì),每個(gè)節(jié)點(diǎn)既是數(shù)據(jù)的存儲(chǔ)節(jié)點(diǎn),也是元數(shù)據(jù)管理節(jié)點(diǎn),不需要配置單獨(dú)的元數(shù)據(jù)管理服務(wù)器,也不會(huì)存在元數(shù)據(jù)管理服務(wù)器性能瓶頸問(wèn)題的出現(xiàn);
2、系統(tǒng)可以彈性擴(kuò)展至數(shù)百個(gè)集群節(jié)點(diǎn),實(shí)現(xiàn)超大的存儲(chǔ)規(guī)模,單一文件系統(tǒng)存儲(chǔ)容量不低于100PB,提高了改變數(shù)據(jù)大小的能力,也提高了數(shù)據(jù)交換的能力。滿足大容量數(shù)據(jù)的存儲(chǔ)需求;
3、支持標(biāo)準(zhǔn)POSIX接口、NFS接口、CIFS接口、FTP接口,可完整支持各類數(shù)據(jù)的訪問(wèn)模式;對(duì)于部分特定的應(yīng)用訪問(wèn)模式,通過(guò)API級(jí)的接口調(diào)用,進(jìn)行軟件的二次開(kāi)發(fā);
4、提供多副本和糾刪碼兩種數(shù)據(jù)保護(hù)模式,用戶可根據(jù)應(yīng)用類型、數(shù)據(jù)重要性、性能、成本等選擇容量管理模式,實(shí)現(xiàn)數(shù)據(jù)高可用保護(hù)和存儲(chǔ)服務(wù)高可用保護(hù);
5、為了便于系統(tǒng)容量的擴(kuò)容,InfoStorage DFS系統(tǒng)可實(shí)現(xiàn)不停機(jī)的在線擴(kuò)展,大大縮減或消除計(jì)劃內(nèi)的停機(jī)時(shí)間;
6、它允許遠(yuǎn)程共享數(shù)據(jù):多樣化的硬件平臺(tái)支持,可靈活支持各類標(biāo)準(zhǔn)x86平臺(tái)硬件,同時(shí)也可以支持國(guó)產(chǎn)化平臺(tái);
7、提供可堆疊模塊化設(shè)計(jì)的機(jī)制,基于這種機(jī)制可以高效簡(jiǎn)便地?cái)U(kuò)展系統(tǒng)的功能,提高了文件的可用性、訪問(wèn)時(shí)間和網(wǎng)絡(luò)效率。;
8、分布式文件系統(tǒng)提供了數(shù)據(jù)的透明度:支持整合光纖SAN盤陣,可有效降低前端業(yè)務(wù)訪問(wèn)存儲(chǔ)的延遲并利舊SAN盤陣。
DFS缺點(diǎn):
?在分布式文件系統(tǒng)中,節(jié)點(diǎn)和連接需要安全保證,在從一個(gè)節(jié)點(diǎn)移動(dòng)到另一個(gè)節(jié)點(diǎn)時(shí),有可能丟失網(wǎng)絡(luò)中的消息和數(shù)據(jù)。
?分布式文件系統(tǒng)的數(shù)據(jù)庫(kù)連接比較復(fù)雜,與單個(gè)用戶系統(tǒng)相比,分布式文件系統(tǒng)中數(shù)據(jù)庫(kù)的處理也不容易。
?如果所有節(jié)點(diǎn)都試圖同時(shí)發(fā)送數(shù)據(jù),就有可能發(fā)生超載,可能出現(xiàn)訪問(wèn)非緩存部分?jǐn)?shù)據(jù)所需的網(wǎng)絡(luò)延遲。
DFS系統(tǒng)提供了對(duì)相同數(shù)據(jù)的全局訪問(wèn),這是很難以任何其他方式有效實(shí)現(xiàn)的,而且讓DFS系統(tǒng)操作更簡(jiǎn)單。因此,多個(gè)站點(diǎn)需要訪問(wèn)相同的數(shù)據(jù), DFS系統(tǒng)將是合適之選。企業(yè)級(jí)數(shù)據(jù)存儲(chǔ)系統(tǒng)基于新一代存儲(chǔ)技術(shù),全線支持SSD、16G FC協(xié)議、并實(shí)現(xiàn)FC/iSCSI/NAS傳輸協(xié)議的統(tǒng)一。